Skip to content

アプリケーション内で をクリックすると、お使いのDataRobotバージョンに関する全プラットフォームドキュメントにアクセスできます。

音声認識と機械学習の連携

GitHubでこのAIアクセラレーターにアクセス

このアクセラレーターは、OpenAIのWhisperモデルを使用して、音声ファイルの文字起こしをするワークフローを示します。 Whisperは、幅広い音声タイプやアクセントに対応できるよう設計された最先端の音声認識システムです。 音声ファイルの話し言葉を書き言葉に変換するのに非常に効果的です。

このワークフローには、Whisperを使用して音声ファイルを文字に起こし、効率的に処理し、さらに分析または使用するために構造化形式で書き起こしを保存するステップが含まれています。 これは、字幕の生成、会議の文字起こし、さまざまな音声源からの音声を機械学習用テキストに変換するなどの作業に特に役立ちます。

この例では、書き起こしデータを取得し、DataRobotで分類モデルを構築します。 DataRobotは、モデルのトレーニング、選択、デプロイ、およびインサイトのためのデータ評価に使用します。

このアクセラレーターでは、Python APIクライアントを使用して以下の操作を行う方法を紹介します。

  • 環境を設定します(Whisperや依存関係などの必要なライブラリをインストールしてインポートします)。
  • DataRobotに安全に接続します。
  • データ(この例で公開されている音声ファイル)を取得します。
  • Whisperで音声を書き起こします。
  • 書き起こしを使用して、DataRobotで分類モデルを作成します。
  • モデルのパフォーマンスとインサイトの取得および評価

更新しました March 13, 2024