目前在測試的幾個 GitHub projects


[1] 莫煩的 Keras examples
https://github.com/MorvanZhou/tutorials

要搭配這網站一起服用:https://morvanzhou.github.io/tutorials/machine-learning/keras/


[2] Panotti: A Convolutional Neural Network classifier for multichannel audio waveforms
https://github.com/drscotthawley/panotti

這個專案很棒,流程非常清楚,可惜不是轉成 spectrogram 還有這只是分類器,不是我要的。但是流程非常值得參考


[3] AIND-VUI-Capstone:In this notebook, you will build a deep neural network that functions as part of an end-to-end automatic speech recognition (ASR) pipeline!
https://github.com/udacity/AIND-VUI-Capstone

這專案也很棒,尤其使用 jupyter 方式,可以單獨 cell 進行執行,缺點是變數無法檢視(要另外寫輸出),以及無法做中斷點。
原始的專案有一些 todo 沒有補上,可以參考這個有補上的:https://github.com/lucko515/speech-recognition-neural-network


[4] sednn:deep learning based speech enhancement using keras python
https://github.com/yongxuUSTC/sednn

目前還沒跑出來,所以無法評論


[5] Voice Conversion with Non-Parallel Data
https://github.com/andabi/deep-voice-conversion

一樣還沒跑出來... 因為有一些需要修改的部份,指定參數使用 gpu 他一樣吃 cpu,所以還在修改中

這個網誌中的熱門文章

GAN 入門筆記

Linux (CentOS) 使用 Tensorflow-gpu (1080ti)

CNN 進階:RCNN、YOLO、SSD