目前在測試的幾個 GitHub projects
[1] 莫煩的 Keras examples
https://github.com/MorvanZhou/tutorials
要搭配這網站一起服用:https://morvanzhou.github.io/tutorials/machine-learning/keras/
[2] Panotti: A Convolutional Neural Network classifier for multichannel audio waveforms
https://github.com/drscotthawley/panotti
這個專案很棒,流程非常清楚,可惜不是轉成 spectrogram 還有這只是分類器,不是我要的。但是流程非常值得參考
[3] AIND-VUI-Capstone:In this notebook, you will build a deep neural network that functions as part of an end-to-end automatic speech recognition (ASR) pipeline!
https://github.com/udacity/AIND-VUI-Capstone
這專案也很棒,尤其使用 jupyter 方式,可以單獨 cell 進行執行,缺點是變數無法檢視(要另外寫輸出),以及無法做中斷點。
原始的專案有一些 todo 沒有補上,可以參考這個有補上的:https://github.com/lucko515/speech-recognition-neural-network
[4] sednn:deep learning based speech enhancement using keras python
https://github.com/yongxuUSTC/sednn
目前還沒跑出來,所以無法評論
[5] Voice Conversion with Non-Parallel Data
https://github.com/andabi/deep-voice-conversion
一樣還沒跑出來... 因為有一些需要修改的部份,指定參數使用 gpu 他一樣吃 cpu,所以還在修改中