AQUEST社の音声合成LSIであるAquesTalkに、新製品「AquesTalk pico R5」が登場するようです。この新製品は小型スピーカに適しているようなので、発売前に現行のAquesTalkについて、書かせていただきます。
近年、バスの車内アナウンスなどで音声合成を耳にすることが増えたと思います。電車などで使われている録音による音声の場合、アナウンスの変更にコストがかかります。音声合成だと停留所が増えたり、停留所の名前が変わっても簡単に変更することが出来ます。
しかし、音声をスムーズに話すには様々なイントネーションの音声の組み合わせを複雑に合成して出力する必要があります。ここで紹介するAqesTalk picoは、簡単なテキスト(ローマ字)入力とアクセント記号などでスムーズな音声合成を行うことができるLSIです。
従来のAquesTalk picoシリーズは、秋月電子通商で販売されており、当方のウェブサイトなどでも利用させていただいています。
目次
新製品「R5」について
今回の新製品はロボット音声の「R」シリーズです。従来の「F4」の「かわいい声」を、より高音にしたような印象を受けました。
当方のサイトでも「F4が小型スピーカ向け」と紹介していましたが、今回の「R5」は、より小型スピーカに向いてそうです。
XBeeを使った「AquesTalk ワイヤレスおしゃべり端末」(当方サイト)
どんな音声が出るのか気になる方は、AQUEST社の下記のデモで確認することが出来ます。
AquesTalk pico LSIの応用例
使い方は、XBeeZBモジュールや、ESPモジュールをシリアルで接続し、読み上げるためのデータをAquesTalkに送信するだけです。
ESP-WROOM-02にAquesTalk pico ATP3012F5を接続し、小型スピーカから音声を出力する実験の様子。
中央のLSIはAquesTalkと呼ばれる音声合成LSIです。この写真に写っているものは従来品です。右側の金属部品はWi-Fi内蔵のマイコンESP-WROOM-02です。このESPモジュール用のプログラムも公開しています。
下図は、XBee ZigBeeモジュールに接続した時の様子です。
XBee ZBモジュールに接続した場合の一例。ATP3011シリーズの場合は、外部クロックが不要になる。
Raspberry Piであれば「LSI不要」で音声合成出力が可能
同じような機器をRaspberry Piだけで実現することもできます。AQUEST社からRaspberry Pi上で動作するソフトウェア「AquesTalk Pi」が無料(個人利用の場合)で配布されています。前述のようなLSIなしに、Raspberry Pi上のソフトウェア処理で音声を出力することが出来ます。
Raspberry Pi用のソフトウェア音声合成ソフト AquesTalk Pi
ダウンロード後、以下のコマンドでインストールし、動作確認を行うことが出来ます。ヘッドホン端子から音声が出力されます。
$ tar xzvf aquestalkpi-*.tgz$ aquestalkpi/AquesTalkPi -f aquestalkpi/test.txt |aplay$ aquestalkpi/AquesTalkPi "こんにちわ"|aplay
音声出力を切り替えるには、以下のコマンドを実行します。
ヘッドホン出力$ amixer cset numid=3 1HDMI音声出力$ amixer cset numid=3 2
パイプ入力に対応しているので、シリアルなどで受信した音声を出力することが出来ます。
$ echo "こんにちわ"|aquestalkpi/AquesTalkPi -f -|aplay
なお、RaspberryPi用のAquesTalk Piと、LSI版のAquosTalk picoとでは、音声データが異なります。Raspberry Pi用は日本語(漢字あり)で再生しますが、LSI版はローマ字入力です。
by ボクにもわかるRaspberry Pi