OpenHRIについて
OpeHRIは、知能化プロジェクトの成果のひとつ、コミュニケーション知能のRTコンポーネント群として、当時の産総研研究員であった松坂要佐さんによって開発されたものです。
現在は、産総研 ロボットイノベーション研究センター ロボットソフトウェアプラットフォーム研究チームの原がメンテ等を行っています。
オフィシャルサイト
現在のOpenHRIのオフィシャルサイトは、http://openrtc.org の方になっていますが、ドキュメントの更新は非常に遅くなっています。各ソフトウェアのリポジトリは、Githubにありますので、ダウンロードが可能になっています。
最新バージョンとリポジトリ
現在、OpenHRIで使用しているサードパーティのソフトウェアのバージョンアップに伴い、改修を行っています。
Windows用のバイナリは、https://www.intsys.org/pub/OpenHRI/ に置いています。OpenHRIVoiceに関しては、バイナリを展開のみでは、動作しません。3rdparyのパッケージも必要で、OpenHRIVoiceの下に展開する必要があります。
新しい機能
OpenHRIAudioに関しては、単にOpnRTM-aistのバージョンを1.1.2に対応したのみにとどまっています。OpenHRIVoiceに関しては、以下のバージョンアップを行っています。
- JuliusRTCの機能追加 : Juliusのdictation機能を追加いしました。新しいアルゴリズムへの対応は、まだなのですが、gmmであれば動作します。そのため、文法を書くことなく音声認識機能が使えます。引数にgrxmlファイルの代わりに dictation という引数にしてください。また、jconfファイルを指定することでオプションに上書きができるようになりました。この機能を使ってディクテーションモード時にDNN版で起動できます。
- GoogleSpeechRecogRTCの追加: Googleの音声認識を使うコンポーネントを作成しています。現在の仕様でバイナリ化しています。APIKEYを取得して、google_speech.confファイルに記入すれば、GoogleSpeechAPIが利用可能です。(1日50リクエストまで)
- OpenJTalkの改修:OpenJtalkの音声に関してなのですが、音響モデルを変更できるようにしようと思っています。(confファイルに記述することで指定可能)音響モデルは、Web上でたくさん公開されていますので、色々試すことができるようになります。OpenJTalkへのパラメータ設定は、RTCのコンフィグレーションパラメータにしています。
このページにWindows用のバイナリを置いています。展開すれば起動可能な状態なので、適当な場所に展開してください。
- Cloud APIの利用:最近、音声認識、音声合成に関しては、Cloudサービスが使えるようになってきました。そこで、様々なCloudサービスを使ったコンポーネントを作成していきたいと思います。調査と実装に関しては、こちらを参照してください。
リポジトリ
- OpenHRIAudio: https://github.com/openrtc/OpenHRIAudio/tree/ForCMake (ブランチ ForCMake)
- OpenHRIVoice: https://github.com/openrtc/OpenHRIVoice
- eSEAT: https://github.com/haraisao/eSEAT
資料