JuliusRTCについて
Simple Wiki Based Contents Management System
関心分野 >> RTミドルウェア >> OpenHRIについて >> JuliusRTCについて

JuliusRTCについて

概要

Juliusは、音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。本コンポーネントは、受け取った音声データをJuliusを用いて音声認識して認識テキストに変換します。
音声認識の方式として、認識する文法を明示的に与える方法(文法音声認識モード)と文法を指定せず予め与えられた辞書を用いる方法(大語彙音声認識モード)の2つの方式で利用することができます。
本コンポーネントは、OpenHRIVoiceパッケージに含まれます。

動作確認OS

  • Ubuntu Linux 14.04以上を推奨
  • Windows 7以上を推奨

依存ライブラリ

  • OpenRTM-aist : OpenRTM-aist-1.1.2-RELEASE(Python)
  • Julius-dictation-kit : バージョン4.4以上を推奨

データポート

名前フローポートデータ型説明
dataInPortTimedOctetSeq認識する音声データ(パケット形式)
activegrammarInPortTimedString有効化する文法ID
statusOutPortTimedString音声認識器の状態(
‘LISTEN [音声入力受付中]’,
‘STARTREC [音声認識処理開始]’,
‘ENDREC [音声認識処理終了]’,
‘REJECTED [入力棄却]’
)
resultOutPortTimedString音声認識結果(XML形式)
logOutPortTimedOctetSeq音声データのログ

Configuration Parameters

名前データ型デフォルト値設定範囲説明
phonemodelstringmalemale音声認識器で利用する音響モデルを設定(現在は、男性用のみ選択可)
voiceactivitydetectionstringinternalinternal音声活動のトリガーを設定(現在は、internalのみ選択可)
languagestringjapanesejapanese,english,german音声認識する言語を設定(Windowsは、japaneseとenglishのみ)

使用方法

JuliusRTCは、通常、.grxmlという識別子を持つ文法ファイルを引数を与えて起動させます。ただし、引数を 'dictation' とすると大語彙音声認識モードで起動します。
Usage: JuliusRTC [-g] [-D] <grxmlファイル名 or dictation>
また、JuliusRTCは、起動オプションとして、'-g' と '-D'をとることができます。
  • '-g'オプションは、起動時に grxmlファイルを選択するためのファイルダイアログを表示します。
  • '-D'オプションは、大語彙音声認識モードで起動します。('dictation'を引数として指定した時と同じ)

使用例

  • マルチリンガル対話システム
  • 腕上げロボット
  • 介助予防リハビリ体操補助ロボット「たいぞう」