サンプルアセット¶
これらのサンプルデータセットを使用して、DataRobotを短時間で習得できます。 これらのアセットを使用した完全なチュートリアルが用意されている場合もあり、自分で手順を追って試すことができます。 データセットは、問題のタイプ別にまとめられています。
構築用のデータセット¶
生成¶
| 名前 | 説明 | 用途 | アセットのリンク | 学習リソース |
|---|---|---|---|---|
| 宇宙ステーションにおける研究 | 宇宙ステーションの研究論文のZIPファイルと、評価プロンプトのCSVファイル。 | 検索拡張生成 | .zipをダウンロード | 動画 基本ステップ |
| 医学研究の抄録 | 個々のテキストファイルを含むZIPファイル。 各テキストファイルは医学研究論文の抄録です。 | 検索拡張生成 | .zipをダウンロード | AIアクセラレーター |
| 技術ドキュメンテーション | 2023年末時点でのDataRobotの技術ドキュメントを含むZIPファイル。 | 検索拡張生成 | .zipをダウンロード | 基本ステップ |
時系列¶
| 名前 | 説明 | 用途 | 特徴量 | アセットのリンク | 学習リソース |
|---|---|---|---|---|---|
| 自動車の売上(GUIとコード) | 多くの自動車メーカーと車種の月間販売台数に、コンテキスト変数を追加。 | 複数系列、多変量の時系列 | 数値 | データのショートバージョンとフルバージョン。Pythonノートブック | 動画 基本ステップ |
| 店舗ごとのSKU単位の需要予測 | カテゴリー別にグループ化された50商品について、店舗ごとのSKU単位の週間販売個数 | SKUレベルの需要予測 | 数値、カテゴリー | トレーニングファイル スコアリングファイル カレンダーファイル |
AIアクセラレーター |
連続値¶
| 名前 | 説明 | 用途 | 特徴量 | アセットのリンク | 学習リソース |
|---|---|---|---|---|---|
| 燃費 | 車に関する他の属性に基づいて、マイル毎ガロン(MPG)を予測します。 | 連続値 | 数値 | トレーニングデータ | DR University Lab |
| ワインの品質 | 化学組成に基づいて白ワインの品質スコアを予測します。 | 連続値 | 数値 | トレーニングデータ スコアリングファイル |
DR University Lab |
| 開発者の給与 | Stack Overflow Developer Survey 2019を参考に、開発者のスキルに基づいて給与を予測します。 | 連続値 | 数値、カテゴリー、テキスト | トレーニングデータ | DR University Lab |
分類¶
| 名前 | 説明 | 用途 | 特徴量 | アセットのリンク | 学習リソース |
|---|---|---|---|---|---|
| 再入院 | 患者が退院後に「再入院」するかどうかを予測します。 | 二値分類 | 数値、カテゴリー、テキスト | トレーニングデータ | 基本ステップ |
| 融資承認 | 申し込み時に提供された情報に基づいて、融資が'is_bad'かどうかを予測します。 | 二値分類 | 数値、カテゴリー、テキスト | トレーニングデータ スコアリングファイル |
DR University Lab |
| フライト遅延 | 飛行機の出発が30分以上遅れるかどうかを予測します。 | 二値分類 | 数値、カテゴリー | トレーニング スコアリング |
AIアクセラレーター |
多クラス分類/多ラベル分類¶
これらのプロジェクトはDataRobot Classicでのみ完了できます。
| 名前 | 説明 | 用途 | 特徴量 | アセットのリンク | 学習リソース |
|---|---|---|---|---|---|
| 植物の病気 | 植物の葉の画像数百枚が、病気の種類ごとにフォルダー分けされたZIPファイル。 | 多クラス | 画像 | ダウンロード | — |
| アパレルの多ラベル | 「青」と「ドレス」の両方など、複数のカテゴリーに当てはまる服の写真。 | 多ラベル | 画像 | ダウンロード | — |