はじめに
Python ライブラリでよく使うものって何?と悩んでいる方、いらっしゃると思います。
基本的には、私は「Anaconda」のインストールをオススメしています。なぜなら、Python ライブラリでよく使うものざっくりとインストールできるので、迷わなくて済むためです。
ライブラリでよく使うものについて初心者の方向けに、主に機能を解説したいと思います。
機能一覧
ライブラリ | 機能 |
---|---|
NumPy | ベクトルや行列など簡単な表記で計算できるライブラリです。 |
Matplotlib | データ可視化用のライブラリです。グラフの描画で主に使用します。 |
pandas | データ分析・解析用のライブラリです。データの読み込みや加工などの前処理でよく用います。 |
scikit-learn | 機械学習用のライブラリです。訓練データとテストデータへの分割やスケーリングなどの前処理もscikit-learnで行うことができます。 |
基本的に分析の過程では、これらのライヴラリを組み合わせて、実施します。
ライブラリのインストール方法
NumPy、Matplotlib、pandas、は「Anaconda」をインストールすると、初期からインストールされています。
なので、scikit-learnのインストール方法を解説します。
コマンドラインで以下を入力するだけで、インストール可能です。
MacOS/WindowsOS両者やり方は同じです。
# pipでインストールする場合
pip install scikit-learn
# anacondaでインストールする場合
conda install scikit-learn
ライブラリの使い方についてオススメの書籍|Python実践データ分析100本ノック
これらのライブラリを使ってどうやって活用するのかという具体的な内容を知りたい方には、以下の書籍をオススメしています。なぜなら、ビジネス現場でありがちな問題ケースをPythonを使って解決するという実践的な内容でライブラリを活用しているためです。なので、ビジネスマンの方でデータ分析したい方には、非常に参考になると思います。
https://amzn.to/2UaU2yP
コメント