Python で Excel ファイルを読み込む方法についてまとめておきます。
必要最小限の知識で Excel のデータを読み込んで活用できるよう意図しています。
以下の環境で動作確認をしています。
環境: Windows、Python 3.X
背景
公的機関、オープンデータ、Google などのサイトでデータをダウンロードすると、ファイル形式が Excel 形式(*.xlsx)であることがあります。
こうしたデータについて Python で処理をするためには Excel ファイルが読み込める必要があります。
そこで、Excel ファイルを読み込むスクリプトについてまとめておきます。Excel ファイルを読み込む方法については、多数やり方があると思いますが、最も簡素、最小限の手間となる方法で、まとめておきます。
なお、サンプルスクリプトでは、読み込んだファイルを Python 標準のリスト形式で読み込みます。読み込んだデータは、コンソールに表示後、HTML ファイル形式で書き出すようにしています。
必要な部分を残して活用してみてください。
使い方
① 以下を例にフォルダを作成してください。
例: C:\user
② ①のフォルダ内に read_excel1.py 等の名前でテキストファイルを作り、下記のサンプルスクリプトを貼りつけて保存してください。
③ さらに、①のフォルダ内に作業用のフォルダを作成してください。
C:\user\folder1
④ ③のフォルダ内に Excel のファイルを作り、データを書き込んでください。
スクリプトと記載を合わせるため、Excel のファイル名は test1.xlsx、シート名は Sheet1 (デフォルトのまま)としてください。
⑤ ②のサンプルコードを実行してください。
例: python C:\user\read_excel1.py
→ ④で書き込んだ Excel の内容がコンソールに表示され、③のフォルダ内に HTML ファイル(test1.html)が生成されます。
→ 生成された HTML ファイルをダブルクリックして、ブラウザで表示してみてください。
⑥ うまく動いたら、スクリプトのファイル名やシート名を使いたい Excel ファイルに合わせて修正し、活用してみてください。
フォルダ内に Excel ファイルを複数入れておくと一括して処理する等のアレンジも可能になります。
まとめ
Python で Excel ファイルを読み込む方法についてまとめました。
なお、テキストファイルや csv ファイルの読み書きについては、以下の関連リンク等でまとめています。
Excel フォーマットについても同様に扱えるようになりました。
関連リンク
・ 配列(リスト)の読み書き、HTML の出力 【Python】
・ CSV ファイルを HTML の表に変換する 【Python】
・ テキストファイルを入出力する 【Python】
サンプルスクリプト
import pandas as pd1
import os
def read_excel1( file1, sheet1 ): # read excel
a0 = pd1.read_excel( file1, sheet_name=sheet1, header=None, index_col=None )
a0 = a0.values.tolist()
return a0
def write_html1( file1, a1 ): # write html
df1 = pd1.DataFrame( a1 )
df1.to_html( file1, escape=False )
path1 = os.path.dirname(__file__) + "\\folder1\\"
file1 = path1 + "test1.xlsx"
sheet1 = "Sheet1"
a1 = read_excel1( file1, sheet1 )
print( a1 )
file1 = path1 + "test1.html"
write_html1( file1, a1 )