はじめに
「別にその仕事、エクセルで十分対応できるし?」とお思いの方は多いと思います。
いやいやその仕事、Pandasでやったらもっと早く楽に出来る可能性が高いです。
そこで、今回は、Python のライブラリーの一つ「Pandas」について初心者向けに解説します。
この記事では以下三つの構成で、解説します。
- Pandasとは?
- Pandasでできることは?
- Pandasをなぜ使うのか?
Pandasとは?
ざっくりいうと「Python版のエクセル」みたいなものです。少し、イメージが掴めましたかね?
もう少し、正確な言葉で説明すると、「Pandasとは、Pythonのデータ解析用のライブラリ」です。Pythonでデータ分析や機械学習を行うには、必須のライブラリなります。Pandasはオープンソースで公開されています。そのため、個人/商用問わず、誰でも無料で利用可能です。
Pandasでできることは?
Pandasは、「エクセル」でできることの中で、以下に二点がPandasでできます。
- データの前処理
- データ分析
あれってことは、エクセル以下じゃん?エクセルはグラフ描画できるし・・・
って思った方も多いはずです。しかし、Pandasはその他のPythonの無料のライブラリと組み合わせることでエクセルのできることを超えます。
Pandasをなぜ使うのか?
理由一点目が、PandasはPythonその他のライブラリを活用することで、エクセルより様々なことができるためです。
それらのライブラリを活用するためには、データの前処理が必要になるケースがほとんどです。その前処理に、Pandasを用います。もちろんエクセルでもできなくないと思いますが、Pythonライブラリとの親和性を考えると寧ろエクセルでは、面倒です。例えば、機械学習です。もちろんVBAで実装することもものすごーく頑張れば出来ると思います。でもPythonならそれに比べれば、一瞬で実装できます。Pythonの機械学習のデータ整形には、Pandasを用いるのが最適です。
理由二点目が、Pythonの方がエクセルより、処理が早いからです。エクセルで処理していると、コピペの繰り返しの処理が面倒で、大変な思いをした経験、誰しもあると思います。その処理Pandasで自動化できる可能性が高いです。「別にVBAでいいんじゃない?」という方「Pythonはコンパイル不要かつそのジャンルの言語の中では、圧倒的に処理速度が早い言語です。」例えば、沢山の会社商品の売り上げのうち、A社のみの売り上げを算出したい場合、エクセルではフィルタなど使い手動で分類し、Sumをとると思います。pythomでは、少しコーディングしたら算出できます。後者の方が圧倒的に早いし、その作業を繰り返しするようなケースになってくると、Pythonの方が圧倒的に早いです。
理由三点目が、Pandasは無料だからです。正直、無料でこんなことまでできるのかと驚きです。無料で使えるからこそ、ユーザが多くなり、困った時の解決策の記載量も圧倒的に多いです。Pandasで困ったことは、ググれば大抵解決できます。
コメント
[…] Python Pandas ①|【初心者向け】Pandasとは?エクセルより便利?はじめに「別にその仕事、エクセルで十分対応できるし?」とお思いの方は多いと思います。いやいやその仕事、Pandasでや […]