個人データ検出¶
本機能の提供について:セルフマネージドのみ
このプレビュー機能は、米国ベースのセルフマネージドAIプラットフォームでのみ利用できます。 この機能を有効にする方法については、DataRobotの担当者または管理者にお問い合わせください。
規制された特定のユースケースでは、個人情報をモデルの特徴量として使用することは禁止されています。 DataRobotは、特定の種類の個人情報の検出を自動化して、データセットにこの情報が誤って含まれないように保護するレイヤーを提供し、モデリングおよび予測時に使用されないようにします。
データセットがAIカタログを通して取り込まれた後、各特徴量に個人情報が存在するかどうかをチェックするオプションがあります。 その結果、データセットのすべてのセルを、この種の情報を識別するためにDataRobotが開発したパターンと照合する処理が行われます。 見つかった場合、AIカタログの情報とプロフィールページに警告メッセージが表示され、各特徴量で検出された個人情報の種類を知らせるとともに、今後どのように進めるかを決めるのに役立つサンプル値を提供します。 さらに、DataRobotは新しい特徴量セットを作成します。これは有用な特徴量と同等ですが、個人情報を含む特徴量がすべて削除されています。 新しいセットの名前は有用な特徴量 - 個人情報を削除です。
注意
このツールは個人データのすべてのインスタンスを識別することを保証するものではありません。 これは、自身の個人データ検出制御を補足することを目的としています。
現在、DataRobotは次のフィールドでの検出をサポートしています。
- Eメールアドレス
- IPv4アドレス
- 米国の電話番号
- 社会保障番号
AIカタログのデータセットで個人データ検出を実行するには、情報ページに移動して、データセットの正常なパブリッシュを示すバナーで個人データの検出を実行するをクリックします。
データセット内で個人データが検出されると注意メッセージが表示されます。 詳細をクリックすると、検出された個人データに関する詳細情報が表示されます。却下をクリックすると、注意が消えて再度表示されなくなります。
注意はプロフィールタブの列によっても強調表示されます。