Python

【初心者向け】PythonでCSVデータ連結

Python

概要

データを連結したい時にPythonで連結する方法を解説する。

csvデータ複数取得 → pythonでcsv連結

前準備

以下の方法で2年分のKDDIの株価データを取得し、csv化する。

データ

2019年のKDDIの株価データと2020年の株価データを連結する。

・2019年の株価データ


日付始値高値安値終値出来高終値調整
02019-01-042,5952,6632,590.52,652.58,355,4002,652.5
12019-01-072,698.52,7062,6402,6437,101,3002,643
22019-01-082,6532,703.52,643.52,682.58,268,1002,682.5
32019-01-092,682.52,6872,640.52,667.56,805,2002,667.5
42019-01-102,6262,689.52,6222,688.57,473,5002,688.5
52019-01-112,7092,711.52,656.52,6657,831,2002,665
62019-01-152,684.52,7082,673.52,7065,577,1002,706

・2020年の株価データ


日付始値高値安値終値出来高終値調整
02020-01-063,2373,2433,2113,2434,504,0003,243
12020-01-073,2503,2733,2383,2714,604,2003,271
22020-01-083,2703,2773,2133,2416,703,2003,241
32020-01-093,2413,3003,2343,2954,647,0003,295
42020-01-103,2953,2983,2783,2884,270,0003,288
52020-01-143,2803,2993,2773,2834,701,6003,283
62020-01-153,2893,2903,2663,2704,198,7003,270

実装

CSV連結

globで「.csv」の拡張子を持ったファイル名を検索するし、ALL_Filesに格納する。

import os
import glob
import csv
import pandas as pd

#カレントディレクトリの取得
path=os.getcwd()

# フォルダ中のパスを取得
DATA_PATH = path+"/"
All_Files = glob.glob('{}*.csv'.format(DATA_PATH))
print(All_Files)

ALL_Filesに格納したcsvファイルを連結する。

# フォルダ中の全csvをマージ
list = []
for file in All_Files:
    list.append(pd.read_csv(file))
df = pd.concat(list,ignore_index=True, sort=False,)

df.to_csv('kddi.csv',index=False)

結果

連結できていることを確認。

2019年の次に2020年のデータが連結されている。

2402019-12-303,2653,2763,2423,2533,068,3003,253
02020-01-063,2373,2433,2113,2434,504,0003,243

コメント

  1. […] […]

タイトルとURLをコピーしました