Archived

This repository has been archived on 2023-06-09. You can view files and clone it, but cannot push or open issues or pull requests.

Mathieu 9bc20638ba Renamed tts folder to stt (i mixed up the two)

2021-10-14 08:01:15 +02:00

1.6 KiB

Raw Permalink Blame History

Modèle Kaldi en français.

Le modèle a été construit avec les scripts Zamia : https://github.com/gooofy/zamia-speech

Licence d'utilisation

Ce modèle est dérivé des corpus textuels et audio listés ci-dessous. Il est publié sous la licence CC BY-NC-SA 4.0 - Creative Common Attribution - Utilisation non commerciale - Partage dans les mêmes conditions 4.0 International.

Corpus textuels

Europarl

Europarl: A Parallel Corpus for Statistical Machine Translation, Philipp Koehn, MT Summit 2005
http://www.statmt.org/europarl/

Licence : non précisée ("not aware of any copyright restrictions")

Est Républicain

Corpus mis à disposition par le CNRTL

https://cnrtl.fr/corpus/estrepublicain/

Licence : CC BY-NC-SA 2.0

Corpus audio

CFPP2000

Branca-Rosoff S., Fleury S., Lefeuvre F., Pires M., 2012, 
Discours sur la ville. Corpus de Français Parlé Parisien des années 2000 (CFPP2000)
http://cfpp2000.univ-paris3.fr/CFPP2000.pdf

Licence : CC BY-NC-SA 3.0

CLAPI

CLAPI, http://clapi.icar.cnrs.fr

Licence : CC BY-NC-SA 4.0

ESLO-MD

http://eslo.huma-num.fr/

Licence : non précisée ("Accès public")

M-AILABS Speech Dataset

https://www.caito.de/2019/01/the-m-ailabs-speech-dataset/

Enregistrements par LibriVox

Licence : domaine public

Mozilla Common Voice

https://voice.mozilla.org/fr/datasets

Licence : CC-0

TCOF

https://www.cnrtl.fr/corpus/tcof/