はじめに
データ分析とは何でしょうか?
筆者は、「次のアクション決定のためのアイテム」だと思います。
データ分析の基本とは何なのか?を解説したいと思います。
データ分析において大切なこと
- データ分析でもっとも大切なことは、「目的」を明確にすることです。
何のために、データ分析を行うのか?まずはその軸をぶらさないことが大切です。
- 「なんでもいいからこのデータから情報を引き出して。」
これではデータ分析ができません。
目的とは、例えば、
- 目的:条件A,B,Cの中でもっともよい条件を判断する。
などです。この場合、導かれる結論は、
- 結論:条件◯がもっともよい条件と判断する。
目的と結論は必ず対応していることが大切です。
つまり、目的と結論が対応していないのはもっともダメです。
目的と結論を結ぶ妥当性を示すのが「データ分析」です。
つまり、「このデータ&分析なら高い確率で結論が正しい」と証明できる方法がもっとも良いのです。
高度なデータ分析が良いわけではないです。目的に対し、結論を導くその妥当性が高いデータ分析が良いと筆者は考えています。
データ分析の時間は短い方がよい!
これは、ビジネスの世界では基本です。情報は「生もの」である可能性が高いです。
データ分析だと妥当性が高い分析手法が求められますが、一方で高速でそこそこの分析手法も価値があるのです。
よくあるのが、ある判断をするのに、ここまでのデータと高度な分析をしなくても・・・判断できたというケースです。これはもっとその結論を導くことが、早くできた可能性があります。時間はビジネスだと特に非常に大切です。
「何かを判断したい」ためのデータ分析なのに、いつしかより高度に、より精度が高いものをと追い求めてしまう。。。(これが技術者だとよくある笑)
- ビジネスの世界だと必ずしもそれが大切ではないです。
- もちろん精度が大切な場面もよくあります。
つまり、大切なのは「課題毎に納期を適切に設定して、設定した目的に対する結論を導き出す」というゴール設定が大切です。納期は常に意識しましょう。
他人の手法との比較では必ず条件とKPIを設定する
よくあるのですが、apple2appleでない比較で結論を導いているケースが多々あります。
これは非常に危険です。個人的にもっとも誤った判断の原因の一つだと感じています。
筆者はエンジニアです。データ分析で間違えるケースを経験的かつ主観で語っています。
例えば、設計の現場だと、評価環境の違いです。
- Aという結果は、評価環境温度が35度であった。
- Bという結果は、評価環境温度が15度であった。
こんなので評価結果が変わるのはザラです。ただ、技術文章にたまに記述されていないことがあり、データとしての有用性が失われることが多々あります。
なので、データ分析、というよりデータの取得方法含めての条件とKPIを設定することが大切です。
データ分析をする強い武器「Python」
データ分析において非常に強いプログラミング言語がPythonです。
データ分析に必要な統計処理のライブラリが揃っているだけでなく、機械学習やディープラーニングなど、高度な数学処理がすでにライブラリと提供されているためです。さらにそれらが無料で使えるのです。
このPythonに興味がある方は、以下の記事も参考にしてみてください。
コメント
[…] データ分析の基本データ分析の目的とは何でしょうか? 筆者は、「何か判断するための理由を明確にする」ことだと思います。 その目的のために、データ分析の基本とは何なのか?を […]