Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

合成トレーニングデータの作成

GitHubでこのAIアクセラレーターにアクセス

このノートブックには、表形式の合成データセットの生成に役立つ強力なコードファーストアクセラレーターが用意されています。 現実世界のデータセットの構造や統計的特性を模倣した合成データを作成でき、既存のデータを補強したり、まったく新しいデータセットを作成したりするための安全で効率的な方法を提供します。 生成された合成データセットはAIカタログに直接アップロードでき、さまざまな機械学習プロジェクト向けに整理、管理、再利用できます。

このアプローチは、プライバシー、セキュリティ、または規制上の制約により、実データへのアクセスが制限されているシナリオで特に有用です。 合成データセットを生成することで、ユーザーは機微情報を危険にさらすことなく、トレーニングデータを拡張できます。 これらの合成データセットは、モデルのトレーニング、検証、テストに使用でき、より堅牢なモデル開発と、未知のデータに対してより適切な一般化を実現します。

このノートブックでは、名前、住所、電話番号、会社名、口座番号、クレジットスコアを含むcsvファイルで合成トレーニングデータセットを作成する方法がまとめられています。


更新しました 2025年3月12日