はじめに
Pythonの初級の本を終えて、さらに学習を進めようという方がどの本を選んだらよいか?とお悩みの方はいらっしゃいませんか?Pythonはできることの幅が広く、中級者レベルになると、目的別に本を選択する方が効率的に学習できます。
この記事のゴール
この記事を読むことで、初心者が入門書を読み終えた後に次の本を何を選べば良いかが明確になります。
中級者になるためには、目的に特化した本を読了することで、一つ軸をしっかりと持つことが大切です。その中でも簡単で、読みやすい本を目的別に選別しました。
Pythonでニーズの高い項目
Pythonでニーズの高い以下三つの目的別に本を紹介します。
- スクレイピング
- AI/機械学習
- データ分析
難易度
筆者の主観で難易度をつけてみます。学ぶ上ので基準として、参考にしてみてください。
- ⭐︎⭐︎⭐︎:難しい
- ⭐︎⭐︎:普通
- ⭐︎:簡単
項目 | 難易度 |
---|---|
スクレイピング | ⭐︎ |
AI/機械学習 | ⭐︎⭐︎⭐︎ |
データ分析 | ⭐︎⭐︎ |
特にAI/機械学習は、難しい数学の話が出てくるので、注意が必要です。学ぶステップとしては、データ分析をしてから、AI/機械学習の流れがベターかと思います。
スクレイピングは、AI/機械学習やデータ分析とは関係ないので、特にステップとかはないです。
スクレイピング
スクレイピングとは、一般的には、ウェブから情報を引き抜くウェブスクレイピングを指します。
ウェブスクレイピングは多くの検索エンジンによって採用されている、ボットを利用してウェブ上の情報にインデックス付けを行うウェブインデクシングと密接な関係がある。ウェブスクレイピングではウェブ上の非構造化データの変換、一般的にはHTMLフォーマットからデータベースやスプレッドシートに格納・分析可能な構造化データへの変換に、より焦点が当てられている。また、コンピュータソフトウェアを利用して人間のブラウジングをシミュレートするウェブオートメーションとも関係が深い。ウェブスクレイピングの用途は、オンラインでの価格比較、気象データ監視、ウェブサイトの変更検出、研究、ウェブマッシュアップやウェブデータの統合等である。
参照元:Wikipedia
おすすめの本
Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる!
【スクレイピングとは】
機械学習やデータ分析になくてはならない「データ」。
このようなデータは、インターネット上に膨大にありますが、Pythonを使えば効率よくデータ収集できます。
こうした手法を「スクレイピング」といいます。
サイト自体もオープンデータ化が進んでおり、データを集めやすい環境が整ってきています。【Python2年生について】
「Python2年生」シリーズは、「Python1年生」を読み終えた方を対象とした入門書です。
ある程度、技術的なことを盛り込み、本書で扱う技術について身に着けてもらいます。【ターゲット】
・ネット上からデータ収集を行う初心者
・データ分析の手前の初心者【本書の売り】
ヤギ博士&フタバちゃんと一緒に、インターネットからのファイルのダウンロード方法、
HTML解析の方法、いろいろなデータの読み書き、
APIの使い方といったデータ収集と便利なライブラリを利用した簡単な可視化手法を解説する書籍です。
また最終的にデータ収集を自動化する方法も簡単に解説します。
この本は難易度は低めで、初心者の方が入門書を読み終えて且つスクレイピングをやりたいって方にぴったりです。
AI/機械学習
機械学習(きかいがくしゅう、英: Machine Learning)とは、経験からの学習により自動で改善するコンピューターアルゴリズムもしくはその研究領域で[1][2]、人工知能の一種であるとみなされている。「訓練データ」もしくは「学習データ」と呼ばれるデータを使って学習し、学習結果を使って何らかのタスクをこなす。例えば過去のスパムメールを訓練データとして用いて学習し、スパムフィルタリングというタスクをこなす、といった事が可能となる。
おすすめの本
Pythonではじめる機械学習 ―scikit-learnで学ぶ特徴量エンジニアリングと機械学習の基礎
Pythonの機械学習用ライブラリの定番、scikit‐learnのリリースマネージャを務めるなど開発に深く関わる著者が、scikit‐learnを使った機械学習の方法を、ステップバイステップで解説します。ニューラルネットを学ぶ前に習得しておきたい機械学習の基礎をおさえるとともに、優れた機械学習システムを実装し精度の高い予測モデルを構築する上で重要となる「特徴量エンジニアリング」と「モデルの評価と改善」について多くのページを割くなど、従来の機械学習の解説書にはない特長を備えています。
筆者は、この本で機械学習を学びましたが、ちょっと難しかったです。ただ、この本を読了すれば、機械学習のデファクトスタンダードであるscikit‐learnをマスターできるといっても過言ではないです。内容は非常におすすめできます。
データ分析
データ分析は、有用な情報の発見、結論の通知、および意思決定のサポートを目的として、データを検査、クレンジング、変換、およびモデリングするプロセスです。データ分析には複数の側面とアプローチがあり、さまざまな名前でさまざまな手法が含まれ、さまざまなビジネス、科学、社会科学の分野で使用されています。
おすすめの本
Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理 (日本語)
NumPy、SciPy、pandas、Matplotlib、Jupyterをはじめ、高機能で使いやすい数学・科学計算用ライブラリが充実しているPythonは、科学計算、統計解析、機械学習のみならず、金融や経済分野でも広く利用されています。
本書はPythonの代表的なデータ分析ツール、pandasの開発者Wes McKinneyによる、データ分析を行うための基本を網羅しています。
データサイエンティスト方だけでなく、理系で分析をする方にもおすすめな内容です。データサイエンティスト以上の内容をカバーしているのでおすすめです。難易度的には、機械学習よりは難しくないと思います。
まとめ
Pythonの初級の本を終えて、さらに学習を進めようという方がどの本を選んだらよいか?について解説しました。中級者になるには、目的別に合わせて専門的な本を選定することが大切です。
Pythonでは大きく分類して以下三つが実現可能です。
- スクレイピング
- AI/機械学習
- データ分析
この目的に合わせてそれぞれ紹介した本は以下です。
コメント