はじめに
トランプ大統領は、どんなワードを一番つぶやいているのか?気になりませんか。
こちらでワードクラウドの使い方を解説しました。
今回は、トランプ大統領のツイートをPythonでグラフィック化していきます。
ワードクラウドの導入
ワードクラウドは、https://tsukimitech.com/2020/11/04/mecab_wordcloud/より確認可能です。
ワードクラウドは、文章中で出現頻度が高い単語を複数選び出し、その頻度に応じた大きさで図示する手法です。
つまり、ウェブページやブログなどに頻出する単語を自動的に並べることが可能です。
文字の大きさだけでなく、色、字体、向きに変化をつけることで、アーティスティックな画像を作ることができます。文章の内容をひと目で印象づける時に使用すると効果的です。
実装
トランプ大統領のツイートを取得します。
トランプ大統領のツイートデータの取得
トランプ大統領のツイートは、Kaggleより取得可能です。
Trump Tweets
Tweets from @realdonaldtrump
トランプ大統領のコード
mport pandas as pd
from wordcloud import WordCloud
from matplotlib import pyplot as plt
df = pd.read_csv('realdonaldtrump.csv')
#print(df['content'])
tx = df['content']
text=""
for n in range(len(tx)):
text = text + tx[n]
print(text)
wc = WordCloud(background_color = "black",width=480, height=320,colormap='prism')
wc.generate(text)
plt.imshow(wc)
plt.axis("off")
plt.show()
結果
トランプ大統領は、 realDonaldTrumpとつぶやくことが多いのですかね?
「will」「great」「Thank」などポジティブなワードも目立ちますね。
一方で、「China」など、社会情勢に関する単語も多いですね。
考察
トランプ大統領は、ツイッターを何よりも“攻撃”に使っている印象が多かったです。一方で、ポジティブなワードも多い印象を今回の調査でわかりました。
1
コメント