秋研修を実施しました。
機械学習のライブラリといえば、scikit-learnですが、教師ありモデルや教師なしモデル以外にも色々できることがあります。
今回はコサイン類似度を使用して、類似者を検索する処理を行います。類似者を探すのに指標が一つや二つならif文で判定できますが、それが多数の指標となると、if文では抽出できず、機械学習の出番です。
実習1:プロ野球選手の成績を元に一人のバッターのと似たバッターを検索します。
実行結果
結果を見ると鈴木誠也選手と同様に好打者と言われる人達が並んでいて、いい感じの結果です。
sklearnのライブラリを使って簡単に検索することができました!!
実習2
以前の研修で使ったPythonAPIとRailsクライアントを使って、性格の似た人を探すシステムを作成します。入力データは性格分析テストです。
コサイン類似度はたまたま見つけた技術ですが結構おもしろく、scikit-learnには他にも色々あるようなので、試してみんなで技術向上を図ろうと思います。(社内勉強会では今、画像処理もやっていて、これも結構おもしろいので、全員参加の研修でもやってみようと考え中です)
これからも社として技術向上を目指していきます。