Skip to content

お勧めする最初のステップ

生成AIや予測AIの基本ステップを手順に従って試してみます。 これらの基本ステップでの手順に必要なものはすべて含まれているので、1つ終了したら、戻って別の基本ステップに挑戦してみてください。

備考

どちらの演習も、このテクノロジーを初めて利用するかどうかに関わらず、すべてのレベルに適しています。

演習 終了までの所要時間の目安
生成AI(GenAI)のプレイグラウンド 20分
エンドツーエンドの予測AI(二部構成) 40分

本機能の提供について

DataRobotの生成AI機能はプレミアム機能です。詳細については、DataRobotの担当者にお問い合わせください。 ただし、DataRobotの試用版では、この機能を制限付きでお試しいただけます。

演習1:生成AIのプレイグラウンド

GenAIの基本ステップでは、未処理のドキュメントから始まり、最適なものをデプロイできる複数のチャットボットオプションで終わる、GenAIパイプラインを作成します。

具体的には、技術ドキュメントのページをチャンクに分割し、それらのチャンクを簡単に検索できるようにベクターとして保存します。 次に、チャットが可能な大規模言語モデル(LLM)の追加と設定を行います。 最後に、ベクターデータベース内のドキュメントに関する自然言語での質問に対して、各LLMがどのように回答するかを比較します。

デモデータをダウンロード

ソースコード:

提供されたZIPファイルには、数百ページに及ぶDataRobot製品ドキュメントが含まれています。 これは、ユーザーが製品について詳細な質問をするためのチャットエージェントを企業が構築する方法の一例です。 製品は、冷蔵庫、サウンドミキシングボード、あるいは高度なソフトウェアかもしれません。

演習2:エンドツーエンドの予測AI

この演習を終了すると、一般的な機械学習チームが1週間で処理できる以上の作業が1時間足らずでできたことになります。

この演習は2つのパートに分かれています。

How-to 説明
構築 データを準備し、複数のモデルを構築して、パフォーマンスを評価・比較する。
運用とガバナンス 「最適な」モデルをAPIエンドポイントにデプロイし、バッチ予測を行って、デプロイ監視指標を確認する。

これらのデータセットは、DataRobotの試用版のアカウントにあらかじめロードされています。 それ以外のDataRobotユーザーの方は、ここからダウンロードできます。

トレーニングデータをダウンロード スコアリングコードをダウンロードする

ソースコード:

再入院のサンプルデータは、BioMed Research Internationalが7万人の糖尿病入院患者を対象として行った調査から得られたものです。 この調査の研究者は、Cerner社が提供するHealth Factsデータベース(米国医療提供者全体の臨床記録)からこのデータを収集しています。 Cerner社の電子医療システムを利用している組織は、研究目的でHealth Factsのデータを無償で利用できます。 すべてのデータは、HIPAAに従ってPIIが消去されています。

次に進みますか?

サンプルアセットのページには、問題のタイプ別に整理された、すぐに使用できるサンプルファイルと付属のチュートリアルが用意されています。 基本ステップのセクションでは、ステップバイステップの演習でプラットフォームのさまざまな機能を学習できます。