Pythonプログラミング

データ分析の基本

Python

はじめに

データ分析とは何でしょうか?
筆者は、「次のアクション決定のためのアイテム」だと思います。
データ分析の基本とは何なのか?を解説したいと思います。

データ分析において大切なこと

手, 商業, 科学技術, データ, クラウド
  • データ分析でもっとも大切なことは、「目的」を明確にすることです。

何のために、データ分析を行うのか?まずはその軸をぶらさないことが大切です。

  • 「なんでもいいからこのデータから情報を引き出して。」

これではデータ分析ができません。
目的とは、例えば、

  • 目的:条件A,B,Cの中でもっともよい条件を判断する。

などです。この場合、導かれる結論は、

  • 結論:条件◯がもっともよい条件と判断する。

目的と結論は必ず対応していることが大切です。
つまり、目的と結論が対応していないのはもっともダメです。

目的と結論を結ぶ妥当性を示すのが「データ分析」です。
つまり、「このデータ&分析なら高い確率で結論が正しい」と証明できる方法がもっとも良いのです。

高度なデータ分析が良いわけではないです。目的に対し、結論を導くその妥当性が高いデータ分析が良いと筆者は考えています。

データ分析の時間は短い方がよい!

砂時計, 時間, クロック, エッグ タイマー, 時間の量, ガラス, フォワード

これは、ビジネスの世界では基本です。情報は「生もの」である可能性が高いです。
データ分析だと妥当性が高い分析手法が求められますが、一方で高速でそこそこの分析手法も価値があるのです。

よくあるのが、ある判断をするのに、ここまでのデータと高度な分析をしなくても・・・判断できたというケースです。これはもっとその結論を導くことが、早くできた可能性があります。時間はビジネスだと特に非常に大切です。

「何かを判断したい」ためのデータ分析なのに、いつしかより高度に、より精度が高いものをと追い求めてしまう。。。(これが技術者だとよくある笑)

  • ビジネスの世界だと必ずしもそれが大切ではないです。
  • もちろん精度が大切な場面もよくあります。

つまり、大切なのは「課題毎に納期を適切に設定して、設定した目的に対する結論を導き出す」というゴール設定が大切です。納期は常に意識しましょう。

他人の手法との比較では必ず条件とKPIを設定する

スケール, 質問, 重要性, バランス, 選択, 記号, シンボル, 重量, ビジネス, 測定, 比較, 正義

よくあるのですが、apple2appleでない比較で結論を導いているケースが多々あります。
これは非常に危険です。個人的にもっとも誤った判断の原因の一つだと感じています。

月見
月見

筆者はエンジニアです。データ分析で間違えるケースを経験的かつ主観で語っています。

例えば、設計の現場だと、評価環境の違いです。

  • Aという結果は、評価環境温度が35度であった。
  • Bという結果は、評価環境温度が15度であった。

こんなので評価結果が変わるのはザラです。ただ、技術文章にたまに記述されていないことがあり、データとしての有用性が失われることが多々あります。

なので、データ分析、というよりデータの取得方法含めての条件とKPIを設定することが大切です。

データ分析をする強い武器「Python」

データ分析において非常に強いプログラミング言語がPythonです。
データ分析に必要な統計処理のライブラリが揃っているだけでなく、機械学習やディープラーニングなど、高度な数学処理がすでにライブラリと提供されているためです。さらにそれらが無料で使えるのです。

このPythonに興味がある方は、以下の記事も参考にしてみてください。

コメント

  1. […] データ分析の基本データ分析の目的とは何でしょうか? 筆者は、「何か判断するための理由を明確にする」ことだと思います。 その目的のために、データ分析の基本とは何なのか?を […]

タイトルとURLをコピーしました