競馬AI開発についての第2回です。
今回は開発全体の流れについてざっくりと記述します。
開発全体の流れ
開発の流れ
- 開発環境を構築する
- 使用項目を検討する
- 必要なデータを収集する
- データベースを作る
- 特徴量を設計する
- 学習用のデータを作成する
- AIモデルを構築する
- 買目を含めて構築したモデルの精度を検証する
- 運用システムを作成する
- 実運用をしながらモデルのチューニングや使用データの見直しをする
おおまかな流れは上記の通りです。
あくまでこれは自分の場合であり、他の競馬AI開発者の方と異なる部分はあると思いますが、全体的には似た開発フローになると思います。
もちろん、各工程の中で必要な知識・技術が適宜登場します。
例えば、
・データベースを作るのであればデータベースを操作するためのSQL知識
・データを作成するにあたってはその処理方法
・モデルを構築するのであればそもそもどの機械学習手法を用いるか
・そして全体的にプログラミング言語(だいたいpython)の知識
などが必要です。
これだけでもなんかお腹いっぱいですね(^o^;)
大丈夫です!分からないところはググりましょう!
基本的に個人で開発する以上、何もAIモデルの内部数式ロジックを理解しろとか、完璧なコーディングをしろとか言ってないですし、最終的に予想ができればいいのです笑
前回の記事でもお伝えした通り、私も競馬AI開発を通して新しく学んだことが多いです。
そこには競馬AI開発だけでなく、エクセル操作やタイピングなど普段の仕事でも十分流用できる部分があると思いますので、一つ一つじっくり取り組んでいきましょう!
開発環境について
開発環境の構築については特に重点的には触れない予定です。
私はwindowsで開発していますが、Macで開発される方も多いでしょうし、人によってプログラムのソースコード編集ソフトなども異なりますので各々お好みで構築してもらえばと思います。
私はあまり使用したことないですが、現在はクラウドサービスでAutoML(データ加工やAIモデル構築を自動でやってもらえる)を提供する企業も多いので、その場合はあまり開発環境構築にこだわらなくてよいかもしれません。
しかし、
せっかく競馬AI開発を通して色々なことを学びたいのであれば開発すべてのフローを自分で取り組んでみることをおススメします。
将来的に競馬AIだけではなく、他の領域に転用することもできますし。
もちろん最初はクラウドサービスでAIを作ってみてそこから自分でも一から取り組んでみる!という流れでも良いですね。
「AI 開発環境」や「python 開発環境」などと検索すれば多くの情報がヒットするはずなので頑張って調べてみましょう。
参考までに私の開発環境(2021年1月時点)は下記の通りです。
OS | windows10 |
CPU | Intel Core i7-8700K |
メモリ | 64GB |
開発言語 | python3.7 |
GPU | NVIDIA GeForce RTX 2060 SUPER |
使用DB | SQlite |
エディタ | Atom |
IDE | PyCharm |
一つアドバイスあるならば、
ハードウェア(CPU、GPU、メモリなど)はなるべくケチらない方が良い
です。
自分の実装が悪いせいもありますが、開発が進むにつれて「メモリエラーが頻発する!」「もっと処理スピード速ければなあ」と思って部品を取り換えたことが多々あったので(;^_^A
今回はこのあたりで、各作業ステップの詳細については次回以降に触れていきたいと思います!