在 Hacker News 上看到 Mozilla 在 GitHub 上的 mozilla/DeepSpeech 這個專案,用 TensorFlow 實做了百度的「Deep Speech: Scaling up end-to-end speech recognition」論文:
A TensorFlow implementation of Baidu's DeepSpeech architecture
語音轉文字的方案,Mozilla 開專案實做出來了...
這程式碼需要安裝 Git Large File Storage 才能完整下載包含訓練資料的部份:
Manually install Git Large File Storage, then clone the repository normally:
git clone https://github.com/mozilla/DeepSpeech
而目前已經有的資料來自於 Mozilla 另外一個專案「Common Voice」:
The Common Voice project is Mozilla's initiative to help teach machines how real people speak.
Common Voice 這個專案目前只有英文,網頁上就可以參與 validation 過程...