JuliusRTCについて

Juliusは、音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。本コンポーネントは、受け取った音声データをJuliusを用いて音声認識して認識テキストに変換します。

音声認識の方式として、認識する文法を明示的に与える方法（文法音声認識モード）と文法を指定せず予め与えられた辞書を用いる方法（大語彙音声認識モード）の2つの方式で利用することができます。

本コンポーネントは、OpenHRIVoiceパッケージに含まれます。

動作確認OS

名前	フローポート	データ型	説明
data	InPort	TimedOctetSeq	認識する音声データ（パケット形式)
activegrammar	InPort	TimedString	有効化する文法ID
status	OutPort	TimedString	音声認識器の状態( ‘LISTEN [音声入力受付中]’, ‘STARTREC [音声認識処理開始]’, ‘ENDREC [音声認識処理終了]’, ‘REJECTED [入力棄却]’ )
result	OutPort	TimedString	音声認識結果（XML形式）
log	OutPort	TimedOctetSeq	音声データのログ

名前	データ型	デフォルト値	設定範囲	説明
phonemodel	string	male	male	音声認識器で利用する音響モデルを設定（現在は、男性用のみ選択可）
voiceactivitydetection	string	internal	internal	音声活動のトリガーを設定（現在は、internalのみ選択可）
language	string	japanese	japanese,english,german	音声認識する言語を設定(Windowsは、japaneseとenglishのみ)

JuliusRTCは、通常、.grxmlという識別子を持つ文法ファイルを引数を与えて起動させます。ただし、引数を　'dictation' とすると大語彙音声認識モードで起動します。

Usage: JuliusRTC [-g] [-D] <grxmlファイル名 or dictation>

また、JuliusRTCは、起動オプションとして、'-g' と '-D'をとることができます。

	JuliusRTCについて
Simple Wiki Based Contents Management System
	Home Projects Memo Misc Topics Software