前回は、Python のいろいろなライブラリについて調べてみました。
ただ、ライブラリのAPIやドキュメントだけで、全くの素人が何か動くものをつくれるか?というと、そんな知識は残念ながらありません。私が活用している幾つかのオンライン講座と書籍を紹介したいと思います。特に、知識がないところから始める場合にはオンライン講座で概要理解すると、スタート地点に立てるところまではスムーズにいくのではないかと思います。
今回は、全くの素人が、簡単な機械学習プログラムを動作させてみるためのスタートラインに立つにあたり、役立ちそうなにいくつかのオンライン学習講座や、書籍を紹介したいと思います。
AI・機械学習のビジネス適用を考えると、そもそもモデルがどうのこうのという前にやるべきことがたくさんあり、AI関連の職種としてもかなり幅広いものになります。
1.解決すべき課題の把握
AIで何を解決するのか?解決すべき課題を正確に把握する。
2.モデルの検討
必要なに関連したのデータ入手・データ前処理・モデルの検討・モデルの知識を得る必要があります。
3.データの収集
必要なデータを収集する。既にあるデータが使えればよいですが、新に収集する場合はどうデータを収集するのか?その仕組み構築から必要だったりします。
4.データの加工・前処理
必要なデータが所望の形態で入手できるわけではないので、そのデータを自分の求める形に加工する必要がある。
5.モデルの生成・最適化・評価
ここまで来て、ようやく、モデルの生成に入ることができます。

果てしない・・・
今回の目的は、Python で機械学習をしてあそぼう。なので、前段の部分は割り切って、モデルの生成・最適化・評価の部分の学習を進めます。
ということで、意気込んで少し知識を習得しようと、いくつかの書籍を購入しましたが、なかなか数式が出てきたり、よくわからない単語が出て来て、素人には全く入ってきません・・・。

Give Up!!
お勧めオンライン講座での学習
途方に暮れてしまいそうなので、Aidemyの無料講座をいくつか受講して概要を学びました。

いくつかの有料講座の受講も考えましたが、「2021年以降有料講座のご提供を終了する予定」とのことなので、以下、Udemyさんのオンライン講座を受講しました。

Udemyさんは、通常だと20,000円以上するような講座も時期によってはキャンペーンで2,000円弱で受講できたりしますので、上手く活用すると、低価格で受講することができます。受講期限もないので、キャンペーン中にいくつか購入しておくとよいのではないでしょうか?
こちらの講座は、NumpyやPandasから、実際の解析例まで、かなり詳細に学ぶことができます。あとで色々見返したり、有効に活用できるのではないかと思います。
【世界で5万人が受講】実践 Python データサイエンス・オンライン講座
以下の講座はKIKAGAKUさんという会社が提供している講座ですが、データ解析に必要な統計学や線形代数の説明も丁寧です。
あぁ、昔、大学でならったあの数式はこういうことだったのか・・・という気づきもいくつかありました。お勧めです。
初級編はデータ解析に必要な知識~単回帰分析。
中級編では重回帰分析について、学習することができます。
データ解析にはこちらのコースもお勧めです。こちらは、SIGNATEさんという、コンペサイトの運営も行っている会社の講座で、実際のデータを使って、データ分析の一連の流れを体感することができます。コンペサイトがどういうものかも知ることができます。
【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門
これらの講座受講により、以下学ぶことができました。
- データ解析の流れ
- 用語の理解
- 簡単なサンプルでのモデル生成・チューニング・評価体験
- コンペ参加の体験
動画教材だけで全てが得られるわけではないですが、やはり図解と口頭説明の連動、実際のコード動作を視覚で見られることで、概要の学習には有効だと思います。
他にもいくつかの講座を購入していますが、ちょっと膨大なものや、ちょっと・・・なものもあり、現時点で、機械学習の入口としてお勧めできるのは上記のものです。
未受講の講座の受講を進めて、新たなお勧めがあれば、また紹介したいと思います。
ちなみにSIGNATEさんは2021/6/30まで、オンライン講座の割引キャンペーン中です。DeepLearningに関する講座や、実際のコンペデータを使った講座で実践的な部分が学べそうです。
SIGNATE Questオープン記念 特別割引キャンペーン(~2021/6/30)
参考書籍
このようなオンライン講座で概要理解が進んだことで、書籍の理解が少しできるようになりました。理論の深いところまでは難しいですが、どういうことを言っているのか?以前よりも理解できるようになってきました。
ようやくスタート地点に立てたのでしょうか・・・・?

・データ分析に必要なPython、Numpy、Pandas、matplotlib
・統計・回帰の基礎
・回帰分析・クラスタリング
について書かれています。なんだっけ?という時の振り返り用に使おうかと思っています。
・データの前処理
・モデルの作成・評価・チューニング
について学べます。
東京大学のデータサイエンティスト育成講座と重複する部分もありますが、より実践的な内容になっていて、オンライン講座の内容の理解を深めるのによい本だと思います。
せっかくオンライン講座を受講したSIGNATEさんか、Kaggleか、なんらかのデータ分析をこの本を参考にしながら実践してみたいと思います。
『ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装』
・深層学習のバイブル的な書籍。
・先2冊は深層学習には特に触れていないので、深層学習について、本書とオンライン講座と合わせて学習していこうかと思っています。
この辺りの書籍を活用して、機械学習の学習を進めていきたいと思います。
次回は機械学習に必要な画像データを収集してみます。