Speech Synthesis Middleware: ToSpeak™
與目前擁有同樣記憶體量的閉環訓練技術相比,能提供更逼真的語音。
- ToSpeak™使用了東芝公司的一項新專利技術,以減少音質劣化。該技術選擇了多個語音單元,並把他們融合在一起,從而使得合成聲音更逼真自然。
- 新一代記憶體駐留型ToSpeak™運行語音語料庫需要的記憶體與目前閉環訓練技術(約2MB)相同。

傳統和新語音合成技術的音質和記憶體要求對比
一般規格
- 輸入資料:拼音或純文本
- 輸出資料:脈衝編碼調製數位音頻
採樣頻率可從22 kHz、16 kHz、8 kHz等中選擇。 - 記憶體要求:幾百萬位元組(具體大小取決於系統結構,請向東芝公司諮詢。)
- 支援語言:日語、美式和英式英語、美式西班牙語、加拿大法語、漢語普通話等等。
- 支持工藝:ARM9(關於其他處理器,請與東芝公司聯繫。)
產品介紹
根據應用要求,提供兩種版本的語音合成中間件。

- SYN中間件特徵
-
- 輸入拼音串,並且加入自然的停頓和語調
- 無需語言分析,從而能節省記憶體。

- 文本轉語音中間件特徵
-
- 將純文本作為輸入資訊接收並將其轉換成語音。
- 支援將音標作為輸入資訊。

使用語音合成的好處
點擊此圖聽聲音樣本。
汽車導航系統的路線指導
使用ToSpeak™可以讓汽車導航系統方便地實現自然發音路線指導功能。ToSpeak™的更新很簡單,只要維護語音單元的語音字典就可以,無需記錄專業配音員的所有語音。
駕駛輔助
語音警告引起司機注意。
免提電話
開車時視線無需離開路面便能知道打電話的人是誰。
讀取收到的資訊
您能通過ToSpeak™讀取資訊服務供應商發送的內容。
讀取郵件
為何不用語音信箱來使您的郵件看起來更友好一些呢?





