|
「人に優しいインターフェース」の一つとして、ATRが研究してきた音声合成技術を使った「CHATR」があります。
従来の音声合成は「あ」「か」「す」といった個別の音を基に合成する方法と、「次は」「とまります」といった単語を合成する方法がありました。
個別音の合成はどのような言葉もつなぎ合わせることができますが、抑揚、階調などが大変不自然になります。
一方、単語合成は自然なのですが、登録した単語以外の新しい言葉をつくりだすことができません。
「CHATR」はその両方をブレンドした技術で、より自然な言葉をつくりだす技術です。
まず被験者に1時間くらい自由に喋ってもらいます。これくらいで日常使用する言葉(音素)のほとんどを抽出することが出来ます。
それぞれの音素を母音、子音、音階といった面でデータベース化します。
音声合成時にはこのデータベースから、最適な音素を取り出し、合成することとなります。
「CHATR」はまだ強いアクセントやイントネーションを持つ表現が不得手ですが、定型的な文章では十分満足できるレベルに有ります。
例えば株式市況や天気予報のアナウンスは得意とする用途です。
|