PDAや電話等の組込み用途向けに不特定話者単語音声認識システム,テキスト音声合成システム(TTS)を開発した。音声認識やTTSは多くの計算量とメモリを必要とするため,コンパクト化が重要な課題であった。単語音声認識では高速尤度演算法と2段階の高速照合手法により,高い認識性能を確保しつつコンパクトな構成を可能にした。TTSでは音素別にスペクトル情報をベクトル量子化することで素片辞書を圧縮表現し,さらに人名の読み上げに特化した構成にすることでコンパクトかつ高品質なシステムとした。

 We have developed a speaker-independent discrete word recognition system and a text-to-speech synthesizer (TTS) for embedded use such as PDAs and telephones. Speech recognition and TTS require a large amount of computational cost and memory. So we have been trying to cope with these problems. We have successfully decreased the computational cost of the speech recognition system by a fast likelihood calculation method and a fast two-stage search method. We have also successfully compressed the phoneme dictionary of the TTS by a phoneme-wise vector quantization.




前ページ 次ページ
 
ホーム > シャープについて > 技術情報 > Technical Journal > No.9 > 記事
サイトポリシー COPYRIGHT