This repository has been archived on 2023-06-09. You can view files and clone it, but cannot push or open issues or pull requests.
jarvis-server/jarvis/utils/stt/vosk/model/README.md

1.6 KiB

Modèle Kaldi en français.

Le modèle a été construit avec les scripts Zamia : https://github.com/gooofy/zamia-speech

Licence d'utilisation

Ce modèle est dérivé des corpus textuels et audio listés ci-dessous. Il est publié sous la licence CC BY-NC-SA 4.0 - Creative Common Attribution - Utilisation non commerciale - Partage dans les mêmes conditions 4.0 International.

Corpus textuels

Europarl

Europarl: A Parallel Corpus for Statistical Machine Translation, Philipp Koehn, MT Summit 2005
http://www.statmt.org/europarl/

Licence : non précisée ("not aware of any copyright restrictions")

Est Républicain

Corpus mis à disposition par le CNRTL

https://cnrtl.fr/corpus/estrepublicain/

Licence : CC BY-NC-SA 2.0

Corpus audio

CFPP2000

Branca-Rosoff S., Fleury S., Lefeuvre F., Pires M., 2012, 
Discours sur la ville. Corpus de Français Parlé Parisien des années 2000 (CFPP2000)
http://cfpp2000.univ-paris3.fr/CFPP2000.pdf

Licence : CC BY-NC-SA 3.0

CLAPI

CLAPI, http://clapi.icar.cnrs.fr

Licence : CC BY-NC-SA 4.0

ESLO-MD

http://eslo.huma-num.fr/

Licence : non précisée ("Accès public")

M-AILABS Speech Dataset

https://www.caito.de/2019/01/the-m-ailabs-speech-dataset/

Enregistrements par LibriVox

Licence : domaine public

Mozilla Common Voice

https://voice.mozilla.org/fr/datasets

Licence : CC-0

TCOF

https://www.cnrtl.fr/corpus/tcof/

Licence : CC BY-NC-SA 2.0

Voxforge

http://www.voxforge.org/

Licence : GPL