TD AutoML(月例セミナーコンテンツ)
資料
講義録画
TD AutoMLについて
AutoML とは?
近年「AutoML」という言葉が機械学習の分野で話題になっています。AutoMLは「Automated Machine Learning」の略称であり、その名の通り機械学習(主に教師あり学習)における多くのプロセスを自動化してくれることにより、従来より圧倒的に短いリードタイムで機会学習を実行することができるものです。
一般的にAutoMLでは上図のような「データの前処理」から「精度向上」に至るまでを自動化してくれるため、機械学習の実行のための敷居を大幅に下げることができます。これまで機械学習の現場ではデータの準備やモデルの制度向上を行うためにデータエンジニアやデータサイエンティストと呼ばれる人が必要でした。しかし、AutoMLにおいては、そこまで機械学習に深い知見のない場合でも自分たちで機械学習を実行できるものになっています。現在GoogleやAmazonをはじめとした多くのBig Tech CompanyがAutoMLのライブラリを開発し、サービスを展開している状況です。
Treasure Data が提供する TD AutoML とは?
まず、Treasure Data CDP内における TD AutoML の立ち位置を説明しますと、CDP内で機械学習を実行できる第4の枠組みという位置付けになっています。
TD AutoMLはWorkflowを通じて機械学習を実行できるようになっていますが、Hive SQLから実行するHivemallやWorkflow上でPythonコードを記述して実行するCustomScriptsに比べて、必要な記述量が圧倒的に短いものになっています。また、Predictive Scoringはオーディエンススタジオ内からUIベースで実行できるものですが、ロジスティック回帰というただ一つの手法のみしか実行できません。
また、Treasure Data が提供する「TD AutoML」は、もちろん AutoML の機能(ソリューション)も提供するのですが、実はそれだけにとどまりません。基本的に(テーブルデータに対する)AutoMLは「教師あり学習」と呼ばれる、分類や回帰を行なってくれるものになっています。しかし世の中にはその他にもクラスタリングに代表される教師なし学習や強化学習などの多くの機械学習のソリューションが存在しています。 TD AutoMLでは各ソリューションを「Notebook」と呼ばれるものに定義・実装し、Notebookごとに機械学習ソリューションを提供する形式となっています。これによって、AutoMLに限らず、さまざまな機械学習ソリューションを同じ枠組みの中で、しかも非常に簡潔な記述のもによって利用することができるものになっています。
さらに、提供するソリューションは機械学習だけにとどまりません。主にマーケティング領域における、マルチタッチアトリビューションやネットワーク分析といった高度なデータ分析もNotebookとして提供しています。そして、今後も時代や利用者のニーズに合わせたソリューションNotebookがどんどん増えていく拡張性もTD AutoMLの大きな魅力と価値になっています。
名前 |
大分類 |
小分類 |
何ができる? |
AutoGluon automl |
機械学習 |
教師あり学習 |
回帰および(2値,多値)分類を実行し、予測結果をテーブル出力 |
ML datasets |
その他 |
データセット |
AutoML向けサンプルデータセットの提供 |
Network analysis |
可視化 |
有向グラフ |
ネットワーク可視化 |
Exploratory Data Analysis |
データ分析 |
分析 |
探索的データ分析を行い、データの理解を深める |
Next Best Action |
機械学習 |
強化学習 |
Next Best Action(次に最適なアクションは何か)を提示 |
Timeseries Forecasting |
機械学習 |
教師あり学習 |
時系列予測 |
Multi-touch Attribution |
データ分析 |
マーケティング |
アトリビューション分析によってコンバージョンに寄与しているタッチポイントを評価 |
Shapley |
機械学習 |
予測の説明 |
特徴量が各予測値に与える影響を説明、可視化 |
上の表は、リリース時点で提供されているNotebookの一覧になっています。