一.前言:
什麼是pandas?
先介紹一下Pandas是什麼,簡單來說就是把Excel的表格觀念丟到Python,概念類似試算表的資料分析套件
為什麼學習pandas?
Excel中所有的操作都可以透過Pandas的函式做簡單的處理,像是欄位的加總、分群、樞紐分析表、小計、畫折線圖、圓餅圖等等…
二.學習項目
1.安裝pandas
2.單維度Series
3.雙維度DataFrame
三.本文環境
windows 10
pandas 1.0.1
1.安裝並載入pandas:
準備環境:利用pip套件管理工具,安裝pandas
pip install pandas
載入pandas:
import pandas as pd
2.單維度Series
Series就像是一個列表,或是試算表中直向的欄位資料
(PS : 搞不清楚欄和列的同學們請看下圖 👇)
建立Series:
語法 : data = pd.Series(列表)
基本操作:下面代碼中,我們簡單操作兩個關於Series的應用
data.max(找最大值)
data.median(找中位數)
3.雙維度DataFrame
DataFrame就像是一個表格,有欄跟列的概念
建立dataframe:和Series不同的地方是,DataFrame的創建是以字典為底 !
pd.DataFrame(字典) #以字典資料為底,建立dataframe
範例:創建三位學生的成績表格
觀察資料
- 取得特定列(row橫向)和欄(column直向)
應用:
1.計算三位學生的成績平均值
2.在欄位中新增一欄學生的操行成績
四.總結
希望讀者能透過此篇文章初步了解關於pandas的基礎運用,
想要了解更詳細的pandas操作及應用可以參考下列網站的教學:)
資料科學家的 pandas 實戰手冊:掌握 40 個實用數據技巧