
PythonのPandasを使うと、Excelのデータを配列データとして持つことができます。Excelシートに慣れている人は、Excelシートでなにか文字を入力してリスト化した方が仕事の効率が良くなるでしょう。
また、リスト化することができるとかなりいろいろな使い方ができるのではないかと心踊らせる備忘録となりました。
Pandasを使ったExcelデータの取り込み方

Pandasをimportする
Pandasのインポートは一文だけなので、決め打ちで覚えてください。
1 |
import pandas as pd |
特に、Pandasを使うときにPandasと打ち込むのが面倒なので、pdって今後は使うからね!という宣言の仕方になってますので、今後も非常に便利だと思います。
Pandasを使って取り込みを実施してみる
Excelから読み込むコードは単純です。読み込んでDataFrameに取り込みを行います。宣言の必要性もないので、すごく簡単に取り込みができます。
1 |
df = pd.read_excel('./KWサンプル.xlsx',sheet_name='Sheet1') |
アドレスの部分にある最初の「./」は、このフォルダの!って意味です。なので、このPythonファイルと同じフォルダ内にエクセルファイルを入れておく必要があります。アドレスになるので、適宜変更をお願いします。
次はシート名を指定しているだけのコードです。
取り込んだデータを取り出してみる2つの方法
ilocを使った抽出方法
特徴としては、数字で指定できる点です。カラム名やロウ名が入っていたとしても、数字での指定が可能となります。
カウントは0からになるので注意が必要です。
1 2 |
for i in range(len(df)): print(df.iloc[i-1,0]) |
groupbyを使った抽出方法
このさきに置いた変数を使えばまっさらな値だけを取得できます。そして、今回の撮影で知ったんですが、通常とは逆の順番で取得ができるようです。
使い方は色々とあると思いますので、考えてみたいなぁ~と思います。
1 2 3 4 |
groups = df.groupby('検索KW') for name,group in groups: print('--Name:',name,'--')#値だけを取り出す print('--Group:',group,'--')#値と付随して列と行と値を取得する |
コピペ用コード
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
import pandas as pd#インポート df = pd.read_excel('./KWサンプル.xlsx',sheet_name='Sheet1')#エクセルの展開&配列格納 print('------今からhead------') print(df.head()) #ーーーーーーー配列抽出開始 2パターンーーーーーーー #おまけ1 数字を指定して抽出 print('------今からおまけ1------') for i in range(len(df)): print(df.iloc[i-1,0]) #おまけ2 groupbyを使って抽出 print('------今からおまけ2------') groups = df.groupby('検索KW') for name,group in groups: print('--Name:',name,'--')#値だけを取り出す print('--Group:',group,'--')#値と付随して列と行と値を取得する |
まとめ
Pandasを使う機会は非常に多いと思います。Excelシートとして利用できるような強みもありますが、見える化されていない分難しさもあると思います。
私は、Pandasで一番使えるなぁ~と思ったのが、このDataFrameです。なので、このDataFrameを中心に今後も話は進むと思います。
面白い操作方法などを知っている方がいらっしゃればお気軽にコメントいただけると嬉しいです。
では、またよろしくおねがいします。