語音合成中間件: ToSpeak™
與目前擁有同樣記憶體量的閉環訓練技術相比,能提供更逼真的語音。
- ToSpeak™使用了東芝公司的一項新專利技術,以減少音質劣化。該技術選擇了多個語音單元,並把他們融合在一起,從而使得合成聲音更逼真自然。
- 新一代記憶體駐留型ToSpeak™運行語音語料庫需要的記憶體與目前閉環訓練技術(約2MB)相同。

傳統和新語音合成技術的音質和記憶體要求對比
一般技術規格
| 日語 | 中文 | 英語 | |
|---|---|---|---|
| 所需記憶體 (包括代碼和詞典) |
約為5.5 Mbytes*1 | 約為8 Mbytes*1 | 約為8.5 Mbytes*1 |
| 系統結構實例 | 日本TTS: 約為4.0-Mbyte ROM 及約為2.0-Mbyte RAM*1 | ||
| API規格 | 東芝TTS API規格 (也可支援Android*2 TTS API) | ||
| 輸入文本 | 轉換JIS | GB18030 | UTF-16, Latin9 |
| 輸出語音格式 | 有符號的16位元線性PCM | ||
| 22.05 kHz | |||
*1: 這些值視條件而定。
*2: Android(安卓)是穀歌公司的注冊商標。
產品介紹
根據應用要求,提供兩種版本的語音合成中間件。

- SYN中間件特徵
-
- 輸入拼音串,並且加入自然的停頓和語調
- 無需語言分析,從而能節省記憶體。

- 文本轉語音中間件特徵
-
- 將純文本作為輸入資訊接收並將其轉換成語音。
- 支援將音標作為輸入資訊。

使用語音合成的好處
點擊此圖聽聲音樣本。
汽車導航系統的路線指導
使用ToSpeak™可以讓汽車導航系統方便地實現自然發音路線指導功能。ToSpeak™的更新很簡單,只要維護語音單元的語音字典就可以,無需記錄專業配音員的所有語音。
駕駛輔助
語音警告引起司機注意。
免提電話
開車時視線無需離開路面便能知道打電話的人是誰。
讀取收到的資訊
您能通過ToSpeak™讀取資訊服務供應商發送的內容。
讀取郵件
為何不用語音信箱來使您的郵件看起來更友好一些呢?
* Bluetooth®是藍牙SIG公司的商標,授權給東芝公司。
* 本文中涉及到的系統和產品名稱可能是相關公司或組織的商標或注冊商標。





