This repository has been archived on 2023-06-09. You can view files and clone it, but cannot push or open issues or pull requests.
jarvis-server/jarvis/utils/stt/vosk/model/README.md

92 lines
1.6 KiB
Markdown
Raw Normal View History

2021-09-17 15:05:32 +02:00
Modèle Kaldi en français.
Le modèle a été construit avec les scripts Zamia :
https://github.com/gooofy/zamia-speech
# Licence d'utilisation
Ce modèle est dérivé des corpus textuels et audio listés ci-dessous. Il est publié sous la licence CC BY-NC-SA 4.0 - Creative Common Attribution - Utilisation non commerciale - Partage dans les mêmes conditions 4.0 International.
# Corpus textuels
## Europarl
```
Europarl: A Parallel Corpus for Statistical Machine Translation, Philipp Koehn, MT Summit 2005
http://www.statmt.org/europarl/
```
Licence : non précisée ("not aware of any copyright restrictions")
## Est Républicain
Corpus mis à disposition par le CNRTL
```
https://cnrtl.fr/corpus/estrepublicain/
```
Licence : CC BY-NC-SA 2.0
# Corpus audio
## CFPP2000
```
Branca-Rosoff S., Fleury S., Lefeuvre F., Pires M., 2012,
Discours sur la ville. Corpus de Français Parlé Parisien des années 2000 (CFPP2000)
http://cfpp2000.univ-paris3.fr/CFPP2000.pdf
```
Licence : CC BY-NC-SA 3.0
## CLAPI
```
CLAPI, http://clapi.icar.cnrs.fr
```
Licence : CC BY-NC-SA 4.0
## ESLO-MD
```
http://eslo.huma-num.fr/
```
Licence : non précisée ("Accès public")
## M-AILABS Speech Dataset
```
https://www.caito.de/2019/01/the-m-ailabs-speech-dataset/
```
Enregistrements par [LibriVox](https://librivox.org/)
Licence : domaine public
## Mozilla Common Voice
````
https://voice.mozilla.org/fr/datasets
````
Licence : CC-0
## TCOF
````
https://www.cnrtl.fr/corpus/tcof/
````
Licence : CC BY-NC-SA 2.0
## Voxforge
````
http://www.voxforge.org/
````
Licence : GPL