Text AIのリソース¶
DataRobotでText AIを使用すると、自然言語処理(NLP)の専門家である必要や、モデル構築プロセスに追加のステップを投入する必要なく、テキストデータをモデルにシームレスに組み込むことができます。 NLP用に特別に設計されたモデルおよび前処理のステップにより、DataRobotは、言語および言語グループの名前を表すための標準セットである ISO 639のすべての言語をサポートします。
テキスト操作で使用可能なツールについて、以下のセクションで説明します。
トピック | 説明 |
---|---|
テキストの操作 | |
自動変換 | モデルの精度を向上させるために構築されたテキスト用に自動化された特徴量エンジニアリングについて学びます。 |
テキストコレクションに基づくクラスタリング | テキストコレクション内のトピック、タイプ、タクソノミー、言語を検出するためにクラスタリングを使用します。 |
時系列プロジェクトの集約と補完 | 時系列プロジェクトのテキスト特徴量の処理を設定します。 |
Composable MLトランスフォーマー | 事前にトレーニングされた変換器を含むモデルブループリントを編集して、テキスト特徴量を最適に表現します。 |
モデルのインサイト | |
係数 | テキストの前処理によって、データセット内で見つかったテキストが、DataRobotモデルで使用できる形式に変換される方法を確認できます。 |
テキストマイニング | テキストと認識されたすべての特徴量に含まれる最も関連度の高い語句が表示されます。 |
ワードクラウド | データセット内で最も関連度の高い語句がワードクラウド形式で表示されます。 |
テキストの説明 | 影響力のあるテキスト特徴量だけでなく、特徴量内のどの特定の単語が影響力を持つかを視覚化します。 |
テキスト分類用の多ラベルモデリング | テキスト分類に多ラベル分類を使用します。 |
例:テキスト内でセンチメントをキャプチャ | テキスト内でセンチメントをキャプチャしてモデルを高める例を参照してください。 |
テキスト関連機能の説明 | |
NLPファインチューナーのブループリント | NLPファインチューナーのブループリントについて説明します。 |
言語検出用のFastText | データ取込みでの言語検出のためのFastTextについて説明します。 |
この特徴量: | GoogleのBERT(蒸留版)を使用する方法について説明します。 |
更新しました 2024年12月17日
このページは役に立ちましたか?
ありがとうございます。どのような点が役に立ちましたか?
より良いコンテンツを提供するには、どうすればよいでしょうか?
アンケートにご協力いただき、ありがとうございました。