PythonTrend

トランプ大統領のツイート可視化

Python

はじめに

トランプ大統領は、どんなワードを一番つぶやいているのか?気になりませんか。

こちらでワードクラウドの使い方を解説しました。

今回は、トランプ大統領のツイートをPythonでグラフィック化していきます。

ワードクラウドの導入

ワードクラウドは、https://tsukimitech.com/2020/11/04/mecab_wordcloud/より確認可能です。

ワードクラウドは、文章中で出現頻度が高い単語を複数選び出し、その頻度に応じた大きさで図示する手法です。

つまり、ウェブページやブログなどに頻出する単語を自動的に並べることが可能です。

文字の大きさだけでなく、色、字体、向きに変化をつけることで、アーティスティックな画像を作ることができます。文章の内容をひと目で印象づける時に使用すると効果的です。

実装

トランプ大統領のツイートを取得します。

トランプ大統領のツイートデータの取得

トランプ大統領のツイートは、Kaggleより取得可能です。

Trump Tweets
Tweets from @realdonaldtrump

トランプ大統領のコード

mport pandas as pd
from wordcloud import WordCloud
from matplotlib import pyplot as plt

df = pd.read_csv('realdonaldtrump.csv')
#print(df['content'])
tx = df['content']

text=""
for n in range(len(tx)):
    text = text + tx[n]

print(text)

wc = WordCloud(background_color = "black",width=480, height=320,colormap='prism')
wc.generate(text)
plt.imshow(wc)
plt.axis("off")
plt.show()

結果

トランプ大統領は、 realDonaldTrumpとつぶやくことが多いのですかね?

「will」「great」「Thank」などポジティブなワードも目立ちますね。

一方で、「China」など、社会情勢に関する単語も多いですね。

考察

トランプ大統領は、ツイッターを何よりも“攻撃”に使っている印象が多かったです。一方で、ポジティブなワードも多い印象を今回の調査でわかりました。

1

コメント

タイトルとURLをコピーしました