Python Stocks Trend

【KDDI株価分析】pytrendsによるGoolgle検索数とKDDIの株価の関係把握

Python

はじめに

KDDIの株価が2020年11月2日、128.5円も急騰しました。

前日終値:2792.5

11/2(月)引け:2921

この急騰は、Googleでの検索数から予期できるのはでは?という仮説が経ちました。なぜなら、この急騰は、以下二点の情報を市場が把握したためと推定されるためです。この情報を把握するために、検索数が増えるのでは?ということが予想されますね。

  1. TOYOTAとの資本提携
  2. 自社株買い

そこで、KDDIの株価と相関のある検索ワードを探索したいと思います。

検索ワード

  1. KDDI
  2. au
  3. ドコモ
  4. 株価
  5. 菅さん

方法

検索ワードの人気度(Googleが検索数から算出する0-100の値)と株価の相関係数より、どのキーワードが最も相関が高いかを確認します。

検索ワードの人気度の取得方法はこちらを参照ください。

この方法で得た人気度を月単位で平均値をとります。

ある程度、長期的な見方をまずはやってみます。

実装

データ

同じディレクトリに株価を時系列で把握したデータと人気度を時系列で把握したデータを用意します。

株価のデータの取得方法はこちらを参照ください。

人気度のデータ例

dateKDDI
2018-01-0752
2018-01-1456
2018-01-2156

株価のデータ例

以下のデータの終値のみを使用します。

日付始値高値安値終値出来高終値調整
2020-01-063,2373,2433,2113,2434,504,0003,243
2020-01-073,2503,2733,2383,2714,604,2003,271
2020-01-083,2703,2773,2133,2416,703,2003,241

コード(Python)

以下の例では、KDDIという検索ワードと株価の相関を把握したコード例になります。

import pandas as pd
import matplotlib.pyplot as plt

def mean_m(df):
    df_m = df.resample('M').mean()
    return(df_m)

def read_csv(file):
    df = pd.read_csv(file)
    return df

def plot(trend,kabuka):

    # Set background color to white
    fig = plt.figure()
    #fig.patch.set_facecolor('white')

    # Plot lines
    plt.xlabel('trend(KDDI)')
    plt.scatter(trend,kabuka)
    plt.legend()

    # Visualize
    plt.show()

#kabuka_csv読み込み
file_1 = 'kddi_kabuka.csv'
df_kabuka = read_csv(file_1)
df_kabuka = df_kabuka[['日付','終値']]

#datetimeindexに変換
df_kabuka['日付'] = pd.to_datetime(df_kabuka['日付'])
df_kabuka.set_index('日付',inplace=True)

#月平均を算出
df_m_kabuka = mean_m(df_kabuka)
print(df_m_kabuka)

#kabuka_trend読み込み
file_2 = 'kddi_trend.csv'
df_trend = read_csv(file_2)

df_trend = df_trend[['date','KDDI']]
df_trend['date'] = pd.to_datetime(df_trend['date'])
df_trend.set_index('date',inplace=True)

df_m_trend = mean_m(df_trend)
print(df_m_trend)

df_m = df_m_kabuka
df_m['トレンド'] = df_m_trend

plot(df_m['トレンド'],df_m['終値'])

#df_m.to_csv('kddi_month_data.csv')

print(df_m)

結果

結果概要

相対的には、検索ワード「株価」と株価の相関がもっとも高い。

もっとも低いのは「菅さん」。

ただし絶対的には、相関係数が、0.45程度なので、そこまで高くない。

検索ワード相関係数
KDDI-0.155051
au0.083744
ドコモ-0.326747
株価0.455576
菅さん0.060795

結果詳細

KDDIの株価

検索人気の変化

KDDI

最近TOYOTAとの資本提携が話題となり、検索数が上昇傾向である。

株価が大きく変動した時に検索数が上昇している。

au

2020年5月頃にピーク。何かあっただろうか?

ドコモ

ドコモ口座流出の時期に検索数がピークになる。

株価

コロナショックの時に検索数が増加傾向。

菅さん

総理就任前後で検索数がピークになる。

考察

検索ワード「KDDI」の検索数が上昇するときは、株価は変動する傾向がある。

必ずしも、検索数が上昇と株価の上昇は連動しない。バッドニュースかグッドニュースかを判断して、検索数が急上昇した時に、売りor買いエントリーするのが良さそう。

結論

KDDIの株価ともっとも相関が高い検索ワードは、以下5つの中では「株価」である。

菅さんの検索数は、KDDIの株価(長期的)に関係ない。

  1. KDDI
  2. au
  3. ドコモ
  4. 株価
  5. 菅さん

コメント

タイトルとURLをコピーしました