Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

列の検索および置換

Data Prep検索と置換操作では、指定された列内にテキストを検索して置換できます。この例は、"Medical Specialty"列での検索と置換の操作を示しています。 ? 値はブランクに置き換えられます。

複数またはすべての列にわたって検索操作と置換操作を行うこともできます。詳細については、複数の検索および置換操作を参照してください。

検索と置換

1つの列でテキストを検索して置換するには:

  1. 値を検索して置き換える列を見つけます。

  2. 列メニューアイコンにカーソルを合わせて、検索 + 置換をクリックします。

  3. 検索フィールドでは、検索する値を指定します。

    または、検索する値を持つセルをダブルクリックすると、検索と置換のフィールドに、そのセルの値が自動的に設定されます。

  4. 使用フィールドで、検索フィールドで指定されたテキストを一致させる方法を選択します。

    • 次の値を含む:一致は、セル値のどの部分でもかまいません。
    • 次の値で始まる: セル値の始まりが一致する必要があります。
    • イコール:一致は正確である必要があります。
    • 次の値で終わる:セル値の終わりが一致する必要があります。
  5. 置換フィールドで、一致のどの部分を置き換えるかを選択します。

    • セル全体: セルの内容全体を置換します。
    • 一致: セルの一致部分のみを置換します。

    Data Prepは、変更を反映する元の列のコピーを生成します。次に例を示します。

  6. 上部にある保存をクリックし 変更を受け入れます。

例 1: 元のセル値 = "123456"検索:"123"およびMatch"321"で置換し、結果は"321456"です。

例 2: 元のセル値 = "123456""123"を検索し、[セル全体]を指定して"321"に置換すると、結果は"321"です。

ヒント

ステップツールを無効にした場合、保存ボタンは検索 + 置換ペインに表示されます。ステップツールを有効にすると、保存ボタンはステップペインの上部に表示されます。

複数回の検索と置換操作

置換を継続し、すべての検索と置換による変換を現在のステップに保存する場合は、ここで保存せずに、プラス(+)をクリックして続行します。

追加の検索および置換操作は、それぞれが反復的です。つまり、追加の検索は直前の検索および置換操作の結果に対して実行され、その後にすべての置換が、検索して置換ペインに表示されているとおり、上から下に順番に適用されます。

複数回の検索と置換操作の例

次の例では、最初の操作で"memorial"のすべてのインスタンスが検索され、一致したテキストだけでなくセル全体がnull値に置き換えられます。

以下に、別の例を示します。

"Detroit"を見つけて"San Francisco"に置換します。"San Francisco"を見つけて"San Jose"に置換します。この結果、"Detroit"が"San Jose"に変換されます。

パネルで検索および置換操作を別の位置にドラッグ&ドロップすれば、変換の順番をいつでも並べ替えることができます。

このステップのすべての検索および置換変換を保存するには、保存ボタンをクリックします。またこのステップの検索して置換の操作を削除するには、その操作の(-)ボタンをクリックします。

検索と置換に関する重要な注意

  • デフォルトでは、検索で大文字小文字の区別が無視されます。たとえば、テキストcatは、テキストCaTと同じです。大文字の使用に重要な意味がある場合は、[大/小文字の区別を無視する]チェックボックスの選択を解除します。

  • デフォルトでは、単一のプロジェクト ステップでの検索および置換操作は、250 回に制限されています。この回数を超えると、ステップツールにエラーメッセージが表示され、列に対する検索および置換変換を続行できません。この制限回数を多くする必要がある場合は、システム管理者に連絡してください。

  • グリッドのハイライト機能は、単一の検索+置換変換でのみ使用できます。 別の検索+置換変換を追加した場合は、使用できません。

複数列にわたる検索と置換

データセット全体または特定の列セット全体で検索と置換を実行する必要がある場合は、高度な検索+置換ペインを使用します。 高度な機能が役立ついくつかの例を次に示します。

  • データセット全体にわたって"incorporated"と"Inc"の両方が存在していて、データセット全体が"Inc"値のみとなるように標準化する場合。データセット全体を標準化して、"Inc"値のみになるようにします。
  • データセットはどこにでも「組み込まれて」おり、ほとんどの場合それは精度の高いです。ただし、データセット内の_特定の列_の値を"Inc"に変更する必要があります。
  • 2つのデータセットをプロジェクトに取り込みました。1つは"NA"とし、もう1つは適用できない値を表すためにブランクを使用します。すべての"NA"値をブランクに変更したいとします。

複数の列にわたって検索して置換するには:

  1. 列のメニューアイコン にカーソルを合わせて、検索+置換をクリックします。

  2. 検索+置換ペインに表示される列名をクリックします。

  3. 高度な検索+置換ペインで、検索と置換の操作に含める各列の横にあるチェックボックスをクリックします。

    複数の列にわたる検索と置換の残りの手順は、単一の列を検索して置換する手順と同じです。検索と置換を参照してください。

名前または基準による検索と置換

高度な検索+置換ペインでは、名前または基準のいずれかで複数の列を選択できます。

名前で検索して置換

名前で選択して置換は、選択した特定の列_のみに_変更が適用されます。

名前に基づいて列を選択するには:

  • 選択する列の隣にあるチェックボックスをクリックします。
  • 最上部のチェックボックスをクリックすると、すべての列が選択されます。
  • パネル上部の列フィルターと型フィルターを使用すると、操作対象として選択する列を迅速にフィルタリングできます。
  • 検索機能を使用して、列を名前で検索します。

基準で検索して置換:

基準で検索して置換すると、指定した基準を満たすすべての列に変更が適用されます。

たとえば、データセットに文字列型の列があり、文字列型の列に対して置換操作を指定した場合、データセット内にあるこの型の既存の列と、このステップの前にデータセットに追加された新しい文字列型の列のすべてが動的に置換されます。

基準に基づいて列を選択するには:

  • 必要に応じて列のデータ型(ブール値、日時、数値、文字列)を指定します。
  • 必要に応じて列名のパターン(次の値で始まる、次の値を含む、次の値に等しい、次の値で終わる)を指定します。

ヘッダーのメッセージが更新され、その基準に基づいて選択した列の数が表示されます。これより前のステップに新しいデータが取り込まれ、基準を満たした列が追加または削除された場合は、選択した列の数が増加または減少することがあります。

備考

置換操作を保存する前に名前オプションと基準オプションを切り替えた場合には、Data Prepは選択内容を記憶します。このとき、直前の選択を復元のためのリンクをクリックすると、最初の選択方法に戻ります。


更新しました April 13, 2022
Back to top