fbpx

一.前言:

  • 什麼是pandas? 

       

       先介紹一下Pandas是什麼,簡單來說就是把Excel的表格觀念丟到Python,概念類似試算表的資料分析套件

 

  • 為什麼學習pandas?

       Excel中所有的操作都可以透過Pandas的函式做簡單的處理,像是欄位的加總、分群、樞紐分析表、小計、畫折線圖、圓餅圖等等…

二.學習項目

1.安裝pandas
2.單維度Series
3.雙維度DataFrame

 

三.本文環境

  • windows 10
  • pandas 1.0.1

 

1.安裝並載入pandas:

   準備環境:利用pip套件管理工具,安裝pandas

 pip install pandas

 載入pandas:

 import pandas as pd

 

2.單維度Series

Series就像是一個列表,或是試算表中直向的欄位資料

(PS : 搞不清楚欄和列的同學們請看下圖 👇)

   

 

  • 建立Series:
         語法 : data = pd.Series(列表)
  • 基本操作:下面代碼中,我們簡單操作兩個關於Series的應用
    • data.max(找最大值)
    • data.median(找中位數)

 

3.雙維度DataFrame

DataFrame就像是一個表格,有欄跟列的概念

 

  • 建立dataframe:和Series不同的地方是,DataFrame的創建是以字典為底 !

pd.DataFrame(字典) #以字典資料為底,建立dataframe 

範例:創建三位學生的成績表格

 

  • 觀察資料
  • 取得特(row橫向)和欄(column直向)

 

  • 應用:
1.計算三位學生的成績平均值
2.在欄位中新增一欄學生的操行成績

 

 

四.總結

希望讀者能透過此篇文章初步了解關於pandas的基礎運用,
想要了解更詳細的pandas操作及應用可以參考下列網站的教學:)

[Python] Pandas 基礎教學

資料科學家的 pandas 實戰手冊:掌握 40 個實用數據技巧

 

 

celia

celia

人生苦短,我用Python !

Leave a Reply