Modèle Français 0.3
Pre-release
Pre-release
Jeux de données :
- Lingua Libre (~20h)
- Common Voice FR (v2) (~120h, en autorisant des duplicatas)
- Training Speech (~180h)
- African Accented French (~15h)
- M-AILABS French (~315h)
Total : ~650h
Paramètres :
- LEARNING_RATE=0.0001
- DROPOUT=0.3
- BATCH_SIZE=64
- LM_ALPHA=0.65
- LM_BETA=1.4
Language Model : dump wikipedia + dump débats assemblée nationale.
Fonctionne avec DeepSpeech v0.6.0-alpha.10
.