Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

テキストが計算された列関数

このセクションでは、Data Prep 計算ツールで使用できるテキストが計算された列関数の構文と例を示します。

CHAR

指定された ASCII 値の文字を戻します。

構文

CHAR(INT)

INTは文字が戻る ASCII 値です。

CHAR(ASCII)

CONCATENATE

一連のテキスト文字列を単一のテキスト文字列に結合するには、[+] 演算子を使用できます。この例では、これらの間で 2 つの列とハイフンを組み合わせます:

@Last@ +"-" + @First@

または、CONCATENATE関数を使用することもできます。

CONCATENATE(@Last@ , "-" , @First@ )

構文

CONCATENATE(STRING_1, [STRING_2, ...])

  • STRING_1は最初の値です。
  • STRING_2, ...[オプション]は追加の文字列です。

CONCATENATE(@Applicant Last@ ,", ",@Applicant First@ , " of ",@City@)

使用に関する注意

指定するSTRINGはテキスト文字列または数値、テキスト文字列または数値を含む列、またはテキスト文字列または数値を返す関数です。

FIND

2 番目のテキストで 1 つの単語(またはテキストの文字列)が見つかるかどうかを決定します。見つかった場合、FIND関数は2番目のテキスト文字列内のテキスト文字列の数値位置を返します。2 番目の文字列の文字がカウントされ、最初のテキストが 2 番目のテキストの文字列で重なる文字を数値が示します。

この関数では、オプションの 3 番目の引数(数値)を指定できます。この数字は、 2番目の文字列で検索を開始したい位置を表示します(文字の個数により)。3番目の引数を省略すると、2番目の文字列の検索が最初の文字から開始されます。

最初の文字列が2番目の文字列中で見つからない場合、この関数は 0 を返します。

構文

FIND(STRING_1, STRING_2, [VALUE])

  • STRING_1は見つけたい文字列です。
  • STRING_2は検索したい文字列です。
  • オプションのVALUEは、検索を開始したいSTRING_2内の数値位置です。

FIND("Tech",@School@)

FIND("the", "The quick sly fox jumped over the lazy brown dog laying next to the other dog.")31という値を返します。

FIND("dog", "The quick sly fox jumped over the lazy brown dog laying next to the other dog.")46 という値を返しますが、これは 2 番目の文字列において「dog」の最初の発生に対応します。

FIND("dog", "The quick sly fox jumped over the lazy brown dog laying next to the other dog.", 47)75 という値を返します。これは、47 の第 3 引数が、過去の文字 46(最初の "dog" が発生する場所)の検索の開始をプッシュし、文字列で 2 番目の "dog" を見つけるように関数を強制するためです。

使用に関する注意

指定するSTRINGはテキスト文字列、テキスト文字列を含む列、またはテキスト文字列を返す関数である必要があります。同様に、VALUEは数値、数値を含む列、または数値を返す関数である必要があります。

STRING_1STRING_2で複数回発生した場合、FINDは最初に一致した位置のみを示し、ペア内で連続する一致は示しません。

FIND関数は大文字と小文字を区別するため、TrueTRUE、およびtrueを個別に扱います。

この関数は、単なる単語ではなく、テキスト全体で重なる部分を探します。したがって、テキスト "jump" は位置 1での文字列 "jumped" 内にあると判断されます。

単語だけでなく、テキスト文字も検索文字列として使用でき、2番目の文字列で発見されます。

HASHVALUE

あいまい一致を簡単にするために、テキスト文字列を変換します。

構文

HASHVALUE(STRING, OPTION, [VALUE])

  • STRINGは変換したい文字列です。
  • OPTIONは変換に使用するアルゴリズムです。使用可能なオプション: METAPHONE
  • NGRAM FINGERPRINT
  • VALUEは、NGRAMと一緒に使用すると、使用する Nグラムの数を指定します。

HASHVALUE(@Current Employer@, "metaphone")

使用に関する注意

指定するSTRINGはテキスト文字列、テキスト文字列を含む列、またはテキスト文字列を返す関数である必要があります。OPTIONVALUEは文字列として扱われ、引用符で、"metaphone" のように囲む必要があります。

HASHVALUEは指定された文字列値に基づいてハッシュを生成するアルゴリズムを使用します。使用するアルゴリズムは、列内の値の間に近い一致を見つけるための列の操作 [Cluster + Edit] によっても使用できます。METAPHONE、NGRAM、およびFINGERPRINT の詳細については、Cluster + Edit を参照してください。

LEFT

テキスト文字列の左端(最初)の位置から開始する、指定された文字数を返します。

構文

LEFT(STRING, VALUE)

  • STRINGは検索したい文字列です。
  • VALUEは返す文字の数です。デフォルト設定では 1 が指定されています。

LEFT(@School@,4)

使用に関する注意

指定するSTRINGはテキスト文字列、テキスト文字列を含む列、またはテキスト文字列を返す関数である必要があります。

LEN

テキスト文字列に含まれる文字の数をカウントします。

構文

LEN(STRING)

STRINGは評価したいテキスト文字列です。

LEN(@School@)

使用に関する注意

指定するSTRINGはテキスト文字列、テキスト文字列を含む列、またはテキスト文字列を返す関数である必要があります。

LOWER

列のテキストをすべての小文字に変換します。

構文

LOWER(STRING, LOCALE)

  • STRINGは小文字に変換したい文字列または列です。
  • LOCALE(オプション)はロケールで、小文字に必要な文字を出力するには指定する必要があります。

サポートされているロケール値については、https://www.oracle.com/java/techangues/jdk8-jree8-jreed-loceles.htmlを参照してください。

LOWER(@Values@, "tr")

MID

テキスト文字列の中央から指定された文字の数を返します。

構文

MID(STRING, VALUE_1, VALUE_2)

  • STRINGは評価したいテキスト文字列です。
  • VALUE_1は開始位置です。
  • VALUE_2は返す文字の数です。

:

MID(@School@,4, 5)

使用に関する注意

指定するSTRINGはテキスト文字列、テキスト文字列を含む列、またはテキスト文字列を返す関数である必要があります。指定する値は数値、数値を含む列、または数値を返す関数である必要があります。

PADLEFT

指定された回数の間、指定された文字を含む文字列をパッドします。これは、MySQL LPADと同じ出力を提供します。

構文

PADLEFT(STRING, NUMBER, VALUE)

  • STRINGまたは列はパッドする値です。
  • NUMBERはその値に置き換える回数です。
  • VALUEは文字どおりの置換値です。

PADLEFT(@set@, 10, "-")

PADRIGHT

指定された回数の間、指定された文字を含む文字列をパッドします。これは、MySQL LPAD および RPAD と同じ出力を提供します。

構文

PADRIGHT(STRING, NUMBER, VALUE)

  • STRINGまたは列はパッドする値です。
  • NUMBERは、そのVALUEに置き換える回数です。
  • VALUEは文字どおりの置換値です。

PADRIGHT(@set@, 10, "-")

REGEXP

正規表現を使用してテキスト文字列上で検索と置換を実行します。この関数は、Java Regex に基づいています。

ヒント

置換を行うことなく、文章内から特定テキストの検索のみを行う場合については、FIND 関数を参照してください。FIND関数には、使用可能な構文の数が若干多いという利点がありますが、その代わりにFINDがパターンマッチングの面で若干効果が劣ります。

構文

REGEXP(STRING_1, STRING_2, STRING_3)

  • STRING_1は検索したいテキスト文字列です。
  • STRING_2は検索しているテキストです。
  • STRING_3は、STRING_2 を置き換えたいテキストです。

3 つの引数は必須です。STRING_1はテキスト文字列、テキスト文字列を含む列、またはテキスト文字列を返す関数である必要があります。STRING_2および STRING_3は、検索および置換アクティビティを定義する文字列の組み合わせで構成されます。

備考

正規表現には、特殊な意味を持つ12文字があります:
\ ^ $ . | ? * + ( )[ と開き波括弧です。
こうした実際の文字とその特殊な意味のないものを検索したい場合は、その前にダブルバックスラッシュ (シングルバックスラッシュではなく)を追加します。例えば、正規表現でアスタリスク文字を検索するには「」ではなく「\」を入力します。正規表現でバックスラッシュ文字を検索するには、4 つのバックスラッシュ文字を入力します。

空白文字をアンダースコアに変換

REGEXP(@School@," ", "_")

テキスト文字列を別のテキスト文字列に置き換える

REGEXP(@ProductID@ , "ABC", "DEF")

スラッシュをハイフンに変換

REGEXP("The/quick/sly/fox." , "/", "-")The-quick-sly-fox を返します。

バックスラッシュ(特殊文字)をハイフンに変換

REGEXP(@ProductID@ , "\\\\", "-")

アスタリスク(特殊文字)をハイフンに変換するには

REGEXP(@ProductID@ , "\\*", "-")

数値ではない列 1 から文字を削除

REGEXP(_column1_ ,"[^0-9]", "")

抽出および置換のパターンの例

コマンド 戻り値
RegexpExtract("replace me", "e m") "e m"
RegexpExtract("replace me", "e.?m") "e m"
RegexpExtract("replace me", "r.*c") "replac"
RegexpExtract("123123456789", "(123)+456(.*)") "123123456789"
RegexpExtract("123123456789", "(123)+456(.*)", 0) "123123456789"
RegexpExtract("123123456789", "(123)+456(.*)", 1) "123"
RegexpExtract("123123456789", "(123)+456(.*)", 2) "789"
RegexpExtract("456789", "(123)*456(.*)", 2) "789"
RegexpReplace("replace me", "e m", "---") "replac---e"
RegexpReplace("replace me", "e.?m", "---") "replac---e"
RegexpReplace("replace me", "r.*c", "--") "--e me"
RegexpReplace("123123456789", "(123)+456(.*)", "---") "---"
RegexpReplace("123123456789", "abc", "---") "123123456789"

使用に関する注意

Regex パターンマッチングの詳細については、以下を参照してください:

https://docs.oracle.com/javase/8/docs/api/java/util/regex/Pattern.html

REPEAT

指定された文字列 N を何度も繰り返します。

構文

REPEAT(VALUE,REPEAT)

  • VALUEは検索して繰り返す文字列または列です。
  • REPEATは、VALUEを繰り返す回数です。

REPEAT(@set4@, 3)

REPLACE

指定した文字の数に基づいて、テキスト文字列の一部を異なるテキスト文字列と置き換えます。

構文

REPLACE(VALUE, START NUM,NUM CHARS, NEW VALUE)

  • VALUEは文字を置き換えたいテキストまたは列です。
  • START NUMは置き換えたい値にある文字の開始位置です。
  • NUM CHARSは新しい文字列に置き換えたいテキスト内の文字の数です。
  • NEW VALUEは置換値です。これは大文字と小文字を区別するので注意してください。

REPLACE(@timestamp@,10,5," ")

使用に関する注意

テキスト文字列の指定位置で発生するテキストを置き換えたい場合にREPLACEを使用します。テキスト文字列で指定したテキストを置き換えたい場合はSUBSTITUTEを使用します。例: REPLACE(@Hospital Name@, Search(@Hospital Name@,"ADVOCATE"), 8, "ALPHA")

REVERSE

指定された文字列を反転します。

構文

REVERSE(STRING)

STRINGは反転する列の値または文字列です。

REVERSE(@set4@)

テキスト文字列の右端(終わり)の位置から開始する、指定された文字数を返します。

構文

RIGHT(STRING, VALUE)

  • STRINGは検索する文字列です。
  • VALUEは返す文字の数です。デフォルト設定では 1 が指定されています。

RIGHT(@School@,4)

使用に関する注意

指定するSTRINGはテキスト文字列、テキスト文字列を含む列、またはテキスト文字列を返す関数である必要があります。

指定された文字列を検索し、文字列のインデックスを返します。見つからない場合、-1 の値を返します。

構文

SEARCH(VALUE, STRING)

  • VALUEは文字を置換したいテキストまたは列です。
  • STRINGは検索する文字列です。

SEARCH(@Hospital Name@, "ADVENTIST")

使用に関する注意

SEARCHREPLACEと組み合わせることができます。

REPLACE(@Hospital Name@, Search(@Hospital Name@,"ADVOCATE"), 8, "ALPHA")

STR

引数内のデータをテキスト文字列に変換します。

構文

STR(VALUE)

VALUEはテキスト文字列に変換したい値です。

STR(@Date@)

使用に関する注意

指定する値は数値、数値を含む列、または数値を返す関数である必要があります。

STR関数は、数値をテキストに変換する場合や、テキストと数値が混ざった値の列の全体をテキストの列として処理することにより、その他のテキスト関数が正常に実行できることを保証する場合に便利です。

SUBSTITUTE

テキスト文字列内の古いテキストを新しいテキストに置換します

構文

SUBSTITUTE(VALUE, OLD TEXT, NEW TEXT)

  • VALUEは文字を置換したいテキストまたは列です。
  • OLD TEXTは置き換えたいテキストです。これは大文字と小文字を区別するので注意してください。
  • NEW TEXTは古いテキストを置き換えるために使用したいテキストです。これは大文字と小文字を区別するので注意してください。

SUBSTITUTE(@Hospital Name@ ,"CREIGHTON","Merton")

使用に関する注意

テキスト文字列中の特定のテキストを置き換える場合は、SUBSTITUTEを使用します。テキスト文字列の指定位置で発生する任意のテキストを置き換える場合は、REPLACEを使用します。

TRIM

指定された文字列のすべての先端および末尾のスペースを削除します。

備考

TRIM数は、テキストから 7 ビット の ACCII 空白文字(値32)を削除するように設計されています。Unicode文字セットには、十進値が 160 であるノーブレークスペース文字と呼ばれる追加のスペース文字があります。この文字は、HTML エンティティとして Web ページで一般的に使用されています。TRIM 関数自体はノーブレークスペース文字を削除しません。

構文

TRIM(STRING)

STRINGは削除したい値です。

列を次の例の文字列値として指定できます。

TRIM(@Company@)

TRIMLEFT

文字列の左端からホワイトスペースの削除された文字列を返します。

構文

TRIMLEFT(STRING)

STRINGは削除したい列の値です。

TRIMLEFT(@Company@)

TRIMRIGHT

文字列の右端からホワイトスペースの削除された文字列を返します。

構文

TRIMRIGHT(STRING)

STRINGは削除したい列の値です。

TRIMRIGHT(@Company@)

UPPER

列のテキストをすべて大文字に変換します。

構文

UPPER(STRING,LOCALE)

  • STRINGは大文字に変換したい文字列または列です。
  • LOCALE(オプション)はロケールで、大文字に必要な文字を出力するには指定する必要があります。

サポートされているロケール値については、https://www.oracle.com/java/techangues/jdk8-jree8-jreed-loceles.htmlを参照してください。

UPPER(@Values@, "tr")

VALUE

文字列の値として保存された数を数値に変換します。

構文

VALUE(STRING)

STRINGは数であり、数値に変換したいテキスト文字列として保存されています。

VALUE(@COLUMN@)

使用に関する注意

指定するSTRINGはテキスト文字列として保存された数値、テキスト文字列として保存された数値を含む列、またはテキスト文字列として保存された数を返す関数である必要があります。

STRINGが数以外の文字を含む場合、関数はエラーを返します。実数を作るには、引数内で一つのピリオド(小数点)が許可されます。

VALUE関数は、テキスト値を数に変換して、それに対して数字ベースの関数が正常に実行できるように、数値の列を数値の列として扱うようにするため、便利です。


更新しました March 24, 2022
Back to top