JuliusRTCについて
概要
Juliusは、音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。本コンポーネントは、受け取った音声データをJuliusを用いて音声認識して認識テキストに変換します。
音声認識の方式として、認識する文法を明示的に与える方法(文法音声認識モード)と文法を指定せず予め与えられた辞書を用いる方法(大語彙音声認識モード)の2つの方式で利用することができます。
本コンポーネントは、OpenHRIVoiceパッケージに含まれます。
動作確認OS
- Ubuntu Linux 14.04以上を推奨
- Windows 7以上を推奨
依存ライブラリ
- OpenRTM-aist : OpenRTM-aist-1.1.2-RELEASE(Python)
- Julius-dictation-kit : バージョン4.4以上を推奨
データポート
名前 | フローポート | データ型 | 説明 |
---|---|---|---|
data | InPort | TimedOctetSeq | 認識する音声データ(パケット形式) |
activegrammar | InPort | TimedString | 有効化する文法ID |
status | OutPort | TimedString | 音声認識器の状態( ‘LISTEN [音声入力受付中]’, ‘STARTREC [音声認識処理開始]’, ‘ENDREC [音声認識処理終了]’, ‘REJECTED [入力棄却]’ ) |
result | OutPort | TimedString | 音声認識結果(XML形式) |
log | OutPort | TimedOctetSeq | 音声データのログ |
Configuration Parameters
名前 | データ型 | デフォルト値 | 設定範囲 | 説明 |
---|---|---|---|---|
phonemodel | string | male | male | 音声認識器で利用する音響モデルを設定(現在は、男性用のみ選択可) |
voiceactivitydetection | string | internal | internal | 音声活動のトリガーを設定(現在は、internalのみ選択可) |
language | string | japanese | japanese,english,german | 音声認識する言語を設定(Windowsは、japaneseとenglishのみ) |
使用方法
JuliusRTCは、通常、.grxmlという識別子を持つ文法ファイルを引数を与えて起動させます。ただし、引数を 'dictation' とすると大語彙音声認識モードで起動します。
Usage: JuliusRTC [-g] [-D] <grxmlファイル名 or dictation>
また、JuliusRTCは、起動オプションとして、'-g' と '-D'をとることができます。
- '-g'オプションは、起動時に grxmlファイルを選択するためのファイルダイアログを表示します。
- '-D'オプションは、大語彙音声認識モードで起動します。('dictation'を引数として指定した時と同じ)
使用例
- マルチリンガル対話システム
- 腕上げロボット
- 介助予防リハビリ体操補助ロボット「たいぞう」