お勧めする最初のステップ¶
このページでは、生成AIや予測AIを初めてお使いの方向けに、ステップバイステップのチュートリアルをご紹介します。 演習での手順に必要なものはすべて含まれているので、1つ終了したら、戻ってもう1つの演習をやってみてください。
どちらの演習も、このテクノロジーを初めて利用するかどうかに関わらず、すべてのレベルに適しています。
- 演習1:生成AIのプレイグラウンド
- 演習2:エンドツーエンドの予測AI(二部構成)
本機能の提供について
DataRobotの生成AI機能はプレミアム機能です。この機能の有効化情報については、DataRobotの担当者にお問い合わせください。 ただし、DataRobotの試用版では、この機能を制限付きでお試しいただけます。
将来の時間を節約するために、1時間かけてこれらの演習に取り組み、情報の入手先と回避可能なミスの修正方法を把握します。
演習1:生成AIのプレイグラウンド¶
GenAIの基本ステップでは、未処理のドキュメントから始まり、最適なものをデプロイできる複数のチャットボットオプションで終わる、生成AIパイプラインを20分で作成します。
具体的には、技術ドキュメントのページをチャンクに分割し、それらのチャンクを簡単に検索できるようにベクターとして保存します。 次に、チャットが可能な大規模言語モデル(LLM)の追加と設定を行います。 最後に、ベクターデータベース内のドキュメントに関する自然言語での質問に対して、各LLMがどのように回答するかを比較します。
ソースコード:
提供されたZIPファイルには、数百ページに及ぶDataRobot製品ドキュメントが含まれています。 これは、ユーザーが製品について詳細な質問をするためのチャットエージェントを企業が構築する方法の一例です。 製品は、冷蔵庫、サウンドミキシングボード、あるいは高度なソフトウェアかもしれません。
演習2:エンドツーエンドの予測AI¶
この演習を約40分で終了すると、一般的な機械学習チームが1週間で処理できる以上の作業ができたことになります。
この演習は2つのパートに分かれています。
実行内容 | 目的 |
---|---|
構築の基本ステップ | データを準備し、複数のモデルを構築して、パフォーマンスを評価・比較する。 |
運用とガバナンスの基本ステップ | 「最適な」モデルをAPIエンドポイントにデプロイし、バッチ予測を行って、デプロイ監視指標を確認する。 |
これらのデータセットは、DataRobotの試用版のアカウントにあらかじめロードされています。 それ以外のDataRobotユーザーの方は、ここからダウンロードできます。
トレーニングデータをダウンロード スコアリングコードをダウンロードする
ソースコード:
再入院のサンプルデータは、BioMed Research Internationalが7万人の糖尿病入院患者を対象として行った調査から得られたものです。 この調査の研究者は、Cerner社が提供するHealth Factsデータベース(米国医療提供者全体の臨床記録)からこのデータを収集しています。 Cerner社の電子医療システムを利用している組織は、研究目的でHealth Factsのデータを無償で利用できます。 すべてのデータは、HIPAAに従ってPIIが消去されています。
次に進みますか?¶
サンプルアセットのページには、問題のタイプ別に整理された、すぐに使用できるサンプルファイルと付属のチュートリアルが用意されています。