python pandas & pandas.DataFrame メソッド

pandas (パンダズ)の method

DataFrame

2次元リストを使った作成

df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]],
columns=[‘col01’, ‘col02’, ‘col03’],
index=[‘idx01’, ‘idx02’, ‘idx03’])

NumPy配列を使った作成方法

df = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
columns=[‘col01’, ‘col02’, ‘col03’],
index=[‘idx01’, ‘idx02’, ‘idx03’])

最初の10行とってくる

df_population_data.head()

インデックス、カラム参照

df.index

辞書型を使った作成方法

df = pd.DataFrame({‘col01’:[1, 2, 3], ‘col02’:[4, 5, 6], ‘col03’:[7, 8, 9]})
df.index = [‘idx01’, ‘idx02’, ‘idx03’]

 

カラム、インデックスの操作

df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

renameメソッドでカラム名変更

df = df.rename(columns={‘col04’: ‘x’})

renameメソッドでインデックス名変更

df = df.rename(index={‘idx01’: ‘w’})

列取得

df[‘x’]

 

locで行取得

df.loc[‘w’]

locで行と列を指定して取得

 

locで列取得

df.loc[‘w’,’z’]

locでデータ操作

df = pd.DataFrame({‘col01’:[1, 2, 3],
‘col02’:[4, 5, 6],
‘col03’:[7, 8, 9]}
,index=[‘idx01’, ‘idx02’, ‘idx03’])

複数のデータ変更

df.loc[:,’col03′]=[‘Tokyo’,’Osaka’,’Hokkaido’]

スライスを使ってデータ取得

df.loc[:,’col02′:’col03′]

get_locメソッドで行番号取得

df.index.get_loc(‘idx03’)

データ型を調べる

df.dtypes

行数・列数取得

df.shape

行と列を入れ替え

df = df.T

 

 

 

 

 


dir(pandas)

pandasのmethod一覧を見てみる、naumpyよりだいぶ少ない