Kaggle活動記録-9
こんにちは。アイティーシーの藤原です。
前回の更新からかなり日が空いてしまいましたが、今回はKaggleの「Learn」というコンテンツについてご紹介です。
【「Learn」について】
「Learn」とは、Kaggle内にある機械学習やそれに関連した分野を学習できるコンテンツになります。
機械学習やAIの初学者やコンペティションの参加はハードルが高いと感じている方を対象とされています。
ポイントは、ただの読み物コンテンツではなく、手を動かして学習できる点にあります。
それぞれのLessonは、「Tutorial」と「Exercise」の2つで構成されています。
「Tutorial」ではその章で取り扱う内容の説明やコード例が記載されています。
「Exercise」では「Tutorial」で説明された内容についての演習が用意されており、自身でコードを記述・実行することができます。
コースによっては学習した内容を活用できるコンペティションが用意されている場合もあります。
ボリュームも十分に用意されており、Pythonのプログラミング言語の学習からディープラーニングの学習まで幅広く取り扱われています。
今回はその中でも「Intermediate Machinne Learning」についてご紹介いたします。
【Intermediate Machine Learning】
こちらは機械学習のモデル精度を高める上で必要な学習データの前準備や検証時に必要な知識・技術について学習できるコースです。
具体的には欠損値や交差検証、データリーケージについて学ぶことができます。
章構成は以下の通りです。
1Introduction
2Missing Values
3Categoical Variables
4Pipelines
5Cross-Validation
6XGBoost
7Data Leakage
【所感】
モデル精度を高めるためには避けては通れない欠損値やカテゴリ変数について学ぶことができたのは大変良かったです。
データリーケージについては、感覚的に理解できるようになったものの中々に難しい内容でした。
このあたりは経験を積み上げて理解を深める必要性を感じています。
今回このコースを完了し、機械学習の基礎はできるようになっているはずなので、次回の記事では実際にKaggleのコンペ参加した報告ができればと思います。
最後までご精読ありがとうございました。