Added vosk basic tests
This commit is contained in:
parent
48c28b34c5
commit
cf448f624c
BIN
jarvis/audio_samples/audiobook_reading_english.wav
Normal file
BIN
jarvis/audio_samples/audiobook_reading_english.wav
Normal file
Binary file not shown.
BIN
jarvis/audio_samples/dailydoseofinternet.wav
Normal file
BIN
jarvis/audio_samples/dailydoseofinternet.wav
Normal file
Binary file not shown.
BIN
jarvis/audio_samples/i_will_find_you_and_kill_you.wav
Normal file
BIN
jarvis/audio_samples/i_will_find_you_and_kill_you.wav
Normal file
Binary file not shown.
BIN
jarvis/audio_samples/livre_audio_francais_1min.wav
Normal file
BIN
jarvis/audio_samples/livre_audio_francais_1min.wav
Normal file
Binary file not shown.
BIN
jarvis/audio_samples/test_jarvis_examples_french.wav
Normal file
BIN
jarvis/audio_samples/test_jarvis_examples_french.wav
Normal file
Binary file not shown.
57
jarvis/utils/tts/vosk/__init__.py
Normal file
57
jarvis/utils/tts/vosk/__init__.py
Normal file
@ -0,0 +1,57 @@
|
||||
import json
|
||||
import os
|
||||
import wave
|
||||
|
||||
from vosk import Model, KaldiRecognizer, SetLogLevel
|
||||
|
||||
from jarvis import get_path_file
|
||||
|
||||
SetLogLevel(-1)
|
||||
model, rec = None, None
|
||||
|
||||
|
||||
def loadModel():
|
||||
global model, rec
|
||||
if not os.path.exists("model"):
|
||||
print(
|
||||
"Please download the model from https://alphacephei.com/vosk/models and unpack as 'model' in the current folder.")
|
||||
exit(1)
|
||||
|
||||
print("Loading model...")
|
||||
model = Model("model")
|
||||
rec = KaldiRecognizer(model, 16000)
|
||||
rec.SetWords(True)
|
||||
print("Model loaded successfully.")
|
||||
|
||||
|
||||
def process_audio_file(file):
|
||||
global model, rec
|
||||
print("File : " + file)
|
||||
wf = wave.open(file, "rb")
|
||||
|
||||
if wf.getnchannels() != 1 or wf.getsampwidth() != 2 or wf.getcomptype() != "NONE":
|
||||
print("Audio file must be WAV format mono PCM.")
|
||||
exit(1)
|
||||
|
||||
while True:
|
||||
data = wf.readframes(4000)
|
||||
if len(data) == 0:
|
||||
break
|
||||
if rec.AcceptWaveform(data):
|
||||
pass
|
||||
# print(rec.Result())
|
||||
else:
|
||||
pass
|
||||
# print(rec.PartialResult())
|
||||
|
||||
print(json.loads(rec.FinalResult())['text'])
|
||||
|
||||
|
||||
if __name__ == '__main__':
|
||||
loadModel()
|
||||
|
||||
path = os.path.dirname(get_path_file.__file__) + "\\audio_samples\\"
|
||||
files = ["test_jarvis_examples_french.wav"]
|
||||
|
||||
for file in files:
|
||||
process_audio_file(path + file)
|
1
jarvis/utils/tts/vosk/model/AUTHORS
Normal file
1
jarvis/utils/tts/vosk/model/AUTHORS
Normal file
@ -0,0 +1 @@
|
||||
Paul Guyot <pguyot@kallisys.net>
|
BIN
jarvis/utils/tts/vosk/model/Gr.fst
Normal file
BIN
jarvis/utils/tts/vosk/model/Gr.fst
Normal file
Binary file not shown.
BIN
jarvis/utils/tts/vosk/model/HCLr.fst
Normal file
BIN
jarvis/utils/tts/vosk/model/HCLr.fst
Normal file
Binary file not shown.
96
jarvis/utils/tts/vosk/model/LICENSE
Normal file
96
jarvis/utils/tts/vosk/model/LICENSE
Normal file
@ -0,0 +1,96 @@
|
||||
Licence publique Creative Commons Attribution - Utilisation non commerciale - Partage dans les mêmes conditions 4.0 International
|
||||
|
||||
Lorsque Vous exercez les Droits accordés par la licence (définis ci-dessous), Vous acceptez d'être lié par les termes et conditions de la présente Licence publique Creative Commons Attribution - Utilisation non commerciale - Partage dans les mêmes conditions 4.0 International (la « Licence publique »). Dans la mesure où la présente Licence publique peut être interprétée comme un contrat, Vous bénéficiez des Droits accordés par la licence en contrepartie de Votre acceptation des présents termes et conditions, et le Donneur de licence Vous accorde ces droits en contrepartie des avantages que lui procure le fait de mettre à disposition l’Œuvre sous licence en vertu des présents termes et conditions.
|
||||
|
||||
Article 1 - Définitions.
|
||||
|
||||
Œuvre dérivée signifie œuvre protégée par les Droit d’auteur et droits connexes, dérivée ou adaptée de l’Œuvre sous licence et dans laquelle l’Œuvre sous licence est traduite, retouchée, arrangée, transformée, ou modifiée de telle façon que l’autorisation du Donneur de licence est nécessaire, conformément aux dispositions des Droit d’auteur et droits connexes. Dans le cas de la présente Licence publique, lorsque l’Œuvre sous licence est une œuvre musicale, une représentation publique ou un enregistrement sonore, la synchronisation de l'Œuvre sous licence avec une image animée sera considérée comme une Œuvre dérivée aux fins de la présente Licence publique.
|
||||
Licence d’Œuvre dérivée signifie licence par laquelle Vous accordez Vos Droit d'auteur et droits connexes portant sur Vos contributions à l'Œuvre dérivée, selon les termes et conditions de la présente Licence publique.
|
||||
Licence compatible BY-NC-SA signifie licence figurant à l'adresse suivante creativecommons.org/compatiblelicenses, approuvée par Creative Commons comme étant essentiellement équivalente à la présente Licence publique.
|
||||
Droit d’auteur et droits connexes signifie droit d’auteur et/ou droits connexes incluant, notamment, la représentation, la radio et télédiffusion, l’enregistrement sonore et le Droit sui generis des producteurs de bases de données, quelle que soit la classification ou qualification juridique de ces droits. Dans le cadre de la présente Licence publique, les droits visés à l’Article 2(b)(1)-(2) ne relèvent ni du Droit d’auteur ni de droits connexes.
|
||||
Mesures techniques efficaces signifie mesures techniques qui, en l’absence d’autorisation expresse, ne peuvent être contournées dans le cadre de lois conformes aux dispositions de l’Article 11 du Traité de l’OMPI sur le droit d’auteur adopté le 20 Décembre 1996 et/ou d’accords internationaux de même objet.
|
||||
Exceptions et limitations signifie utilisation loyale et équitable (fair use et fair dealing) et/ou toute autre exception ou limitation applicable à Votre utilisation de l’Œuvre sous licence.
|
||||
Eléments de licence signifie les composantes de la licence figurant dans l’intitulé de la Licence publique Creative Commons. Les éléments de la présente Licence publique sont : Attribution, Utilisation non commerciale et Partage dans les mêmes conditions.
|
||||
Œuvre sous licence signifie œuvre littéraire ou artistique, base de données ou toute autre œuvre pour laquelle le Donneur de licence a recours à la présente Licence publique.
|
||||
Droits accordés par la licence signifie droits qui Vous sont accordés selon les termes et conditions d’utilisation définis par la présente Licence publique, limités aux Droit d’auteur et droits connexes applicables à Votre utilisation de l’Œuvre sous licence et que le Donneur de licence a le droit d’accorder.
|
||||
Donneur de licence signifie un individu ou une entité octroyant la présente Licence publique et les droits accordés par elle.
|
||||
Utilisation non commerciale signifie que l’utilisation n’a pas principalement pour but ou pour objectif d'obtenir un avantage commercial ou une compensation financière. L’échange de l’Œuvre sous licence avec d’autres œuvres soumises aux Droit d’auteur et droits connexes par voie de partage de fichiers numériques ou autres moyens analogues constitue une Utilisation non commerciale à condition qu’il n’y ait aucun avantage commercial ni aucune compensation financière en relation avec la transaction.
|
||||
Partager signifie mettre une œuvre à la disposition du public par tout moyen ou procédé qui requiert l’autorisation découlant des Droits accordés par la licence, tels que les droits de reproduction, de représentation au public, de distribution, de diffusion, de communication ou d’importation, y compris de manière à ce que chacun puisse y avoir accès de l’endroit et au moment qu’il choisit individuellement.
|
||||
Droit sui generis des producteurs de bases de données signifie droits distincts du droit d'auteur résultant de la Directive 96/9/CE du Parlement européen et du Conseil du 11 mars 1996 sur la protection juridique des bases de données, ainsi que tout autre droit de nature équivalente dans le monde.
|
||||
Vous (preneur de licence) se rapporte à tout individu ou entité exerçant les Droits accordés par la licence. Votre et Vos renvoient également au preneur de licence.
|
||||
Article 2 - Champ d’application de la présente Licence publique.
|
||||
|
||||
Octroi de la licence.
|
||||
Sous réserve du respect des termes et conditions d'utilisation de la présente Licence publique, le Donneur de licence Vous autorise à exercer pour le monde entier, à titre gratuit, non sous-licenciable, non exclusif, irrévocable, les Droits accordés par la licence afin de :
|
||||
reproduire et Partager l’Œuvre sous licence, en tout ou partie, seulement pour une Utilisation non commerciale ; et
|
||||
produire, reproduire et Partager l’Œuvre dérivée seulement pour une Utilisation non commerciale.
|
||||
Exceptions et limitations. Afin de lever toute ambiguïté, lorsque les Exceptions et limitations s’appliquent à Votre utilisation, la présente Licence publique ne s’applique pas et Vous n’avez pas à Vous conformer à ses termes et conditions.
|
||||
Durée. La durée de la présente Licence publique est définie à l’Article 6(a).
|
||||
Supports et formats : modifications techniques autorisées. Le Donneur de licence Vous autorise à exercer les Droits accordés par la licence sur tous les supports et formats connus ou encore inconnus à ce jour, et à apporter toutes les modifications techniques que ceux-ci requièrent. Le Donneur de licence renonce et/ou accepte de ne pas exercer ses droits qui pourraient être susceptibles de Vous empêcher d’apporter les modifications techniques nécessaires pour exercer les Droits accordés par la licence, y compris celles nécessaires au contournement des Mesures techniques efficaces. Dans le cadre de la présente Licence publique, le fait de ne procéder qu’à de simples modifications techniques autorisées selon les termes du présent Article 2(a)(4) n’est jamais de nature à créer une Œuvre dérivée.
|
||||
Utilisateurs en aval.
|
||||
Offre du Donneur de licence – Œuvre sous licence. Chaque utilisateur de l’Œuvre sous licence reçoit automatiquement une offre de la part du Donneur de licence lui permettant d’exercer les Droits accordés par la licence selon les termes et conditions de la présente Licence publique.
|
||||
Offre additionnelle du Donneur de licence – Œuvre dérivée. Chaque utilisateur d’une Œuvre dérivée reçoit automatiquement une offre du Donneur de licence lui permettant d’exercer les Droits accordés par la licence sur l’Œuvre dérivée selon les termes et conditions de la Licence d’Œuvre dérivée que Vous appliquez.
|
||||
Pas de restrictions en aval pour les utilisateurs suivants. Vous ne pouvez proposer ou imposer des termes et conditions supplémentaires ou différents, ou appliquer quelque Mesure technique efficace que ce soit à l’Œuvre sous licence si ceux(celles)-ci sont de nature à restreindre l’exercice des Droits accordés par la licence aux utilisateurs de l’Œuvre sous licence.
|
||||
Non approbation. Aucun élément de la présente Licence publique ne peut être interprété comme laissant supposer que le preneur de licence ou que l’utilisation qu’il fait de l’Œuvre sous licence est lié à, parrainé, approuvé, ou doté d'un statut officiel par le Donneur de licence ou par toute autre personne à qui revient l’attribution de l’Œuvre sous licence, comme indiqué à l’Article 3(a)(1)(A)(i).
|
||||
Autres droits.
|
||||
|
||||
Les droits moraux, tel que le droit à l’intégrité de l’œuvre, ne sont pas accordés par la présente Licence publique, ni le droit à l’image, ni le droit au respect de la vie privée, ni aucun autre droit de la personnalité ou apparenté ; cependant, dans la mesure du possible, le Donneur de licence renonce et/ou accepte de ne pas faire valoir les droits qu’il détient de manière à Vous permettre d’exercer les Droits accordés par la licence.
|
||||
Le droit des brevets et le droit des marques ne sont pas concernés par la présente Licence publique.
|
||||
Dans la mesure du possible, le Donneur de licence renonce au droit de collecter des redevances auprès de Vous pour l’exercice des Droits accordés par la licence, directement ou indirectement dans le cadre d’un régime de gestion collective facultative ou obligatoire assorti de possibilités de renonciation quel que soit le type d’accord ou de licence. Dans tous les autres cas, le Donneur de licence se réserve expressément le droit de collecter de telles redevances, y compris en dehors des cas d'Utilisation non commerciale de l’Œuvre sous licence.
|
||||
Article 3 – Conditions d'utilisation de la présente Licence publique.
|
||||
|
||||
L’exercice des Droits accordés par la licence est expressément soumis aux conditions suivantes.
|
||||
|
||||
Attribution.
|
||||
|
||||
Si Vous partagez l’Œuvre sous licence (y compris sous une forme modifiée), Vous devez :
|
||||
|
||||
conserver les informations suivantes lorsqu’elles sont fournies par le Donneur de licence avec l’Œuvre sous licence :
|
||||
identification du(des) auteur(s) de l’Œuvre sous licence et de toute personne à qui revient l’attribution de l’Œuvre sous licence, dans la mesure du possible, conformément à la demande du Donneur de licence (y compris sous la forme d’un pseudonyme s’il est indiqué) ;
|
||||
l’indication de l’existence d’un droit d’auteur ;
|
||||
une notice faisant référence à la présente Licence publique ;
|
||||
une notice faisant référence aux limitations de garantie et exclusions de responsabilité ;
|
||||
un URI ou un hyperlien vers l’Œuvre sous licence dans la mesure du possible ;
|
||||
Indiquer si Vous avez modifié l’Œuvre sous licence et conserver un suivi des modifications précédentes ; et
|
||||
Indiquer si l’Œuvre sous licence est mise à disposition en vertu de la présente Licence publique en incluant le texte, l’URI ou l’hyperlien correspondant à la présente Licence publique.
|
||||
Vous pouvez satisfaire aux conditions de l’Article 3(a)(1) dans toute la mesure du possible, en fonction des supports, moyens et contextes dans lesquels Vous Partagez l’Œuvre sous licence. Par exemple, Vous pouvez satisfaire aux conditions susmentionnées en fournissant l’URI ou l’hyperlien vers la ressource incluant les informations requises.
|
||||
Bien que requises aux termes de l’Article 3(a)(1)(A), certaines informations devront être retirées, dans la mesure du possible, si le Donneur de licence en fait la demande.
|
||||
Partage dans les mêmes conditions.
|
||||
Outre les conditions indiquées à l’Article 3(a), si Vous Partagez une Œuvre dérivée que Vous avez réalisée, les conditions suivantes s’appliquent aussi.
|
||||
|
||||
La Licence d’Œuvre dérivée que Vous appliquez doit être une licence Creative Commons avec les mêmes Eléments de licence, qu’il s’agisse de cette version ou d’une version ultérieure, ou une Licence compatible BY-NC-SA.
|
||||
Vous devez inclure le texte, l’URI ou l’hyperlien correspondant à la Licence d’Œuvre dérivée que Vous appliquez. Ces conditions peuvent être satisfaites dans la mesure du raisonnable suivant les supports, moyens et contextes via lesquels Vous Partagez l’Œuvre dérivée.
|
||||
Vous ne pouvez pas proposer ou imposer des termes ou des conditions supplémentaires ou différents ou appliquer des Mesures techniques efficaces à l’Œuvre dérivée qui seraient de nature à restreindre l’exercice des Droits accordés par la Licence d’Œuvre dérivée que Vous appliquez.
|
||||
Article 4 – Le Droit sui generis des producteurs de bases de données.
|
||||
|
||||
Lorsque les Droits accordés par la licence incluent le Droit sui generis des producteurs de bases de données applicable à Votre utilisation de l’Œuvre sous licence :
|
||||
|
||||
afin de lever toute ambiguïté, l’Article 2(a)(1) Vous accorde le droit d’extraire, réutiliser, reproduire et Partager la totalité ou une partie substantielle du contenu de la base de données uniquement pour une Utilisation non commerciale ;
|
||||
si Vous incluez la totalité ou une partie substantielle du contenu de la base de données dans une base de données pour laquelle Vous détenez un Droit sui generis de producteur de bases de données, la base de données sur laquelle Vous détenez un tel droit (mais pas ses contenus individuels) sera alors considérée comme une Œuvre dérivée, y compris pour l’application de l’Article 3(b) ; et
|
||||
Vous devez respecter les conditions de l’Article 3(a) si Vous Partagez la totalité ou une partie substantielle du contenu des bases de données.
|
||||
Afin de lever toute ambiguïté, le présent Article 4 complète mais ne remplace pas Vos obligations découlant des termes de la présente Licence publique lorsque les Droits accordés par la licence incluent d’autres Droit d’auteur et droits connexes.
|
||||
Article 5 – Limitations de garantie et exclusions de responsabilité.
|
||||
|
||||
Sauf indication contraire et dans la mesure du possible, le Donneur de licence met à disposition l’Œuvre sous licence telle quelle, et n’offre aucune garantie de quelque sorte que ce soit, notamment expresse, implicite, statutaire ou autre la concernant. Cela inclut, notamment, les garanties liées au titre, à la valeur marchande, à la compatibilité de certaines utilisations particulières, à l’absence de violation, à l’absence de vices cachés ou autres défauts, à l’exactitude, à la présence ou à l’absence d’erreurs connues ou non ou susceptibles d’être découvertes dans l’Œuvre sous licence. Lorsqu’une limitation de garantie n’est pas autorisée en tout ou partie, cette clause peut ne pas Vous être applicable.
|
||||
Dans la mesure du possible, le Donneur de licence ne saurait voir sa responsabilité engagée vis-à-vis de Vous, quel qu’en soit le fondement juridique (y compris, notamment, la négligence), pour tout préjudice direct, spécial, indirect, incident, conséquentiel, punitif, exemplaire, ou pour toutes pertes, coûts, dépenses ou tout dommage découlant de l’utilisation de la présente Licence publique ou de l’utilisation de l’Œuvre sous licence, même si le Donneur de licence avait connaissance de l’éventualité de telles pertes, coûts, dépenses ou dommages. Lorsqu’une exclusion de responsabilité n’est pas autorisée en tout ou partie, cette clause peut ne pas Vous être applicable.
|
||||
Les limitations de garantie et exclusions de responsabilité ci-dessus doivent être interprétées, dans la mesure du possible, comme des limitations et renonciations totales de toute responsabilité.
|
||||
Article 6 – Durée et fin.
|
||||
|
||||
La présente Licence publique s’applique pendant toute la durée de validité des Droits accordés par la licence. Cependant, si Vous manquez à Vos obligations prévues par la présente Licence publique, Vos droits accordés par la présente Licence publique seront automatiquement révoqués.
|
||||
Lorsque les Droits accordés par la licence ont été révoqués selon les termes de l’Article 6(a), ils seront rétablis :
|
||||
|
||||
automatiquement, à compter du jour où la violation aura cessé, à condition que Vous y remédiiez dans les 30 jours suivant la date à laquelle Vous aurez eu connaissance de la violation ; ou
|
||||
à condition que le Donneur de licence l’autorise expressément.
|
||||
Afin de lever toute ambiguïté, le présent Article 6(b) n’affecte pas le droit du Donneur de licence de demander réparation dans les cas de violation de la présente Licence publique.
|
||||
Afin de lever toute ambiguïté, le Donneur de licence peut également proposer l’Œuvre sous licence selon d’autres termes et conditions et peut cesser la mise à disposition de l’Œuvre sous licence à tout moment ; une telle cessation n’entraîne pas la fin de la présente Licence publique.
|
||||
Les Articles 1, 5, 6, 7, et 8 continueront à s’appliquer même après la résiliation de la présente Licence publique.
|
||||
Article 7 – Autres termes et conditions.
|
||||
|
||||
Sauf accord exprès, le Donneur de licence n’est lié par aucune modification des termes de Votre part.
|
||||
Tous arrangements, ententes ou accords relatifs à l’Œuvre sous licence non mentionnés dans la présente Licence publique sont séparés et indépendants des termes et conditions de la présente Licence publique.
|
||||
Article 8 – Interprétation.
|
||||
|
||||
Afin de lever toute ambiguïté, la présente Licence publique ne doit en aucun cas être interprétée comme ayant pour effet de réduire, limiter, restreindre ou imposer des conditions plus contraignantes que celles qui sont prévues par les dispositions légales applicables.
|
||||
Dans la mesure du possible, si une clause de la présente Licence publique est déclarée inapplicable, elle sera automatiquement modifiée a minima afin de la rendre applicable. Dans le cas où la clause ne peut être modifiée, elle sera écartée de la présente Licence publique sans préjudice de l’applicabilité des termes et conditions restants.
|
||||
Aucun terme ni aucune condition de la présente Licence publique ne sera écarté(e) et aucune violation ne sera admise sans l’accord exprès du Donneur de licence.
|
||||
Aucun terme ni aucune condition de la présente Licence publique ne constitue ou ne peut être interprété(e) comme une limitation ou une renonciation à un quelconque privilège ou à une immunité s’appliquant au Donneur de licence ou à Vous, y compris lorsque celles-ci émanent d’une procédure légale, quel(le) qu’en soit le système juridique concerné ou l’autorité compétente.
|
91
jarvis/utils/tts/vosk/model/README.md
Normal file
91
jarvis/utils/tts/vosk/model/README.md
Normal file
@ -0,0 +1,91 @@
|
||||
Modèle Kaldi en français.
|
||||
|
||||
Le modèle a été construit avec les scripts Zamia :
|
||||
https://github.com/gooofy/zamia-speech
|
||||
|
||||
# Licence d'utilisation
|
||||
|
||||
Ce modèle est dérivé des corpus textuels et audio listés ci-dessous. Il est publié sous la licence CC BY-NC-SA 4.0 - Creative Common Attribution - Utilisation non commerciale - Partage dans les mêmes conditions 4.0 International.
|
||||
|
||||
# Corpus textuels
|
||||
|
||||
## Europarl
|
||||
|
||||
```
|
||||
Europarl: A Parallel Corpus for Statistical Machine Translation, Philipp Koehn, MT Summit 2005
|
||||
http://www.statmt.org/europarl/
|
||||
```
|
||||
|
||||
Licence : non précisée ("not aware of any copyright restrictions")
|
||||
|
||||
## Est Républicain
|
||||
|
||||
Corpus mis à disposition par le CNRTL
|
||||
|
||||
```
|
||||
https://cnrtl.fr/corpus/estrepublicain/
|
||||
```
|
||||
|
||||
Licence : CC BY-NC-SA 2.0
|
||||
|
||||
# Corpus audio
|
||||
|
||||
## CFPP2000
|
||||
|
||||
```
|
||||
Branca-Rosoff S., Fleury S., Lefeuvre F., Pires M., 2012,
|
||||
Discours sur la ville. Corpus de Français Parlé Parisien des années 2000 (CFPP2000)
|
||||
http://cfpp2000.univ-paris3.fr/CFPP2000.pdf
|
||||
```
|
||||
|
||||
Licence : CC BY-NC-SA 3.0
|
||||
|
||||
## CLAPI
|
||||
|
||||
```
|
||||
CLAPI, http://clapi.icar.cnrs.fr
|
||||
```
|
||||
|
||||
Licence : CC BY-NC-SA 4.0
|
||||
|
||||
## ESLO-MD
|
||||
|
||||
```
|
||||
http://eslo.huma-num.fr/
|
||||
```
|
||||
|
||||
Licence : non précisée ("Accès public")
|
||||
|
||||
## M-AILABS Speech Dataset
|
||||
|
||||
```
|
||||
https://www.caito.de/2019/01/the-m-ailabs-speech-dataset/
|
||||
```
|
||||
|
||||
Enregistrements par [LibriVox](https://librivox.org/)
|
||||
|
||||
Licence : domaine public
|
||||
|
||||
## Mozilla Common Voice
|
||||
|
||||
````
|
||||
https://voice.mozilla.org/fr/datasets
|
||||
````
|
||||
|
||||
Licence : CC-0
|
||||
|
||||
## TCOF
|
||||
|
||||
````
|
||||
https://www.cnrtl.fr/corpus/tcof/
|
||||
````
|
||||
|
||||
Licence : CC BY-NC-SA 2.0
|
||||
|
||||
## Voxforge
|
||||
|
||||
````
|
||||
http://www.voxforge.org/
|
||||
````
|
||||
|
||||
Licence : GPL
|
18
jarvis/utils/tts/vosk/model/disambig_tid.int
Normal file
18
jarvis/utils/tts/vosk/model/disambig_tid.int
Normal file
@ -0,0 +1,18 @@
|
||||
16355
|
||||
16356
|
||||
16357
|
||||
16358
|
||||
16359
|
||||
16360
|
||||
16361
|
||||
16362
|
||||
16363
|
||||
16364
|
||||
16365
|
||||
16366
|
||||
16367
|
||||
16368
|
||||
16369
|
||||
16370
|
||||
16371
|
||||
16372
|
BIN
jarvis/utils/tts/vosk/model/final.mdl
Normal file
BIN
jarvis/utils/tts/vosk/model/final.mdl
Normal file
Binary file not shown.
BIN
jarvis/utils/tts/vosk/model/ivector/final.dubm
Normal file
BIN
jarvis/utils/tts/vosk/model/ivector/final.dubm
Normal file
Binary file not shown.
BIN
jarvis/utils/tts/vosk/model/ivector/final.ie
Normal file
BIN
jarvis/utils/tts/vosk/model/ivector/final.ie
Normal file
Binary file not shown.
BIN
jarvis/utils/tts/vosk/model/ivector/final.mat
Normal file
BIN
jarvis/utils/tts/vosk/model/ivector/final.mat
Normal file
Binary file not shown.
3
jarvis/utils/tts/vosk/model/ivector/global_cmvn.stats
Normal file
3
jarvis/utils/tts/vosk/model/ivector/global_cmvn.stats
Normal file
@ -0,0 +1,3 @@
|
||||
[
|
||||
4.618818e+10 -3.489444e+09 -2.059763e+09 1.921726e+09 -5.841537e+09 -6.048164e+09 -7.75856e+09 -4.873308e+09 -4.763045e+09 -1.330406e+09 -3.983441e+09 -1.278057e+09 -2.862585e+09 -6.033062e+08 -2.847332e+09 -9.149903e+08 -1.936657e+09 -3.699679e+08 -1.09594e+09 -4.810378e+07 -4.374753e+08 4.246159e+07 -7.428497e+07 -1.315271e+07 1.453378e+08 -2.531438e+07 3.035138e+08 -1.289957e+08 2.417447e+08 -2.136708e+08 2.282068e+08 -1.382803e+08 3.409821e+08 7.512533e+07 3.788408e+08 9.763262e+07 1.820446e+08 -1.20177e+08 -1.124585e+08 -1.037246e+08 4.462964e+08
|
||||
5.022558e+12 2.20806e+11 1.743958e+11 2.220735e+11 2.631863e+11 3.043067e+11 3.330778e+11 2.465113e+11 2.175021e+11 1.655047e+11 1.836205e+11 1.388485e+11 1.366641e+11 1.075725e+11 1.048053e+11 7.125641e+10 6.302351e+10 4.087438e+10 2.970187e+10 1.567274e+10 8.540192e+09 2.760022e+09 3.835788e+08 1.028499e+08 1.296572e+09 3.176209e+09 5.578054e+09 7.290364e+09 8.997982e+09 9.935813e+09 1.04577e+10 1.036794e+10 1.072109e+10 1.081991e+10 9.500429e+09 7.211747e+09 6.830946e+09 5.747362e+09 4.416877e+09 3.020467e+09 0 ]
|
1
jarvis/utils/tts/vosk/model/ivector/online_cmvn.conf
Normal file
1
jarvis/utils/tts/vosk/model/ivector/online_cmvn.conf
Normal file
@ -0,0 +1 @@
|
||||
# configuration file for apply-cmvn-online, used in the script ../local/run_online_decoding.sh
|
2
jarvis/utils/tts/vosk/model/ivector/splice.conf
Normal file
2
jarvis/utils/tts/vosk/model/ivector/splice.conf
Normal file
@ -0,0 +1,2 @@
|
||||
--left-context=3
|
||||
--right-context=3
|
10
jarvis/utils/tts/vosk/model/mfcc.conf
Normal file
10
jarvis/utils/tts/vosk/model/mfcc.conf
Normal file
@ -0,0 +1,10 @@
|
||||
# config for high-resolution MFCC features, intended for neural network training
|
||||
# Note: we keep all cepstra, so it has the same info as filterbank features,
|
||||
# but MFCC is more easily compressible (because less correlated) which is why
|
||||
# we prefer this method.
|
||||
--use-energy=false # use average of log energy, not energy.
|
||||
--num-mel-bins=40 # similar to Google's setup.
|
||||
--num-ceps=40 # there is no dimensionality reduction.
|
||||
--low-freq=20 # low cutoff frequency for mel bins... this is high-bandwidth data, so
|
||||
# there might be some information at the low end.
|
||||
--high-freq=-400 # high cutoff frequently, relative to Nyquist of 8000 (=7600)
|
259
jarvis/utils/tts/vosk/model/word_boundary.int
Normal file
259
jarvis/utils/tts/vosk/model/word_boundary.int
Normal file
@ -0,0 +1,259 @@
|
||||
1 nonword
|
||||
2 begin
|
||||
3 end
|
||||
4 internal
|
||||
5 singleton
|
||||
6 nonword
|
||||
7 begin
|
||||
8 end
|
||||
9 internal
|
||||
10 singleton
|
||||
11 nonword
|
||||
12 begin
|
||||
13 end
|
||||
14 internal
|
||||
15 singleton
|
||||
16 begin
|
||||
17 end
|
||||
18 internal
|
||||
19 singleton
|
||||
20 begin
|
||||
21 end
|
||||
22 internal
|
||||
23 singleton
|
||||
24 begin
|
||||
25 end
|
||||
26 internal
|
||||
27 singleton
|
||||
28 begin
|
||||
29 end
|
||||
30 internal
|
||||
31 singleton
|
||||
32 begin
|
||||
33 end
|
||||
34 internal
|
||||
35 singleton
|
||||
36 begin
|
||||
37 end
|
||||
38 internal
|
||||
39 singleton
|
||||
40 begin
|
||||
41 end
|
||||
42 internal
|
||||
43 singleton
|
||||
44 begin
|
||||
45 end
|
||||
46 internal
|
||||
47 singleton
|
||||
48 begin
|
||||
49 end
|
||||
50 internal
|
||||
51 singleton
|
||||
52 begin
|
||||
53 end
|
||||
54 internal
|
||||
55 singleton
|
||||
56 begin
|
||||
57 end
|
||||
58 internal
|
||||
59 singleton
|
||||
60 begin
|
||||
61 end
|
||||
62 internal
|
||||
63 singleton
|
||||
64 begin
|
||||
65 end
|
||||
66 internal
|
||||
67 singleton
|
||||
68 begin
|
||||
69 end
|
||||
70 internal
|
||||
71 singleton
|
||||
72 begin
|
||||
73 end
|
||||
74 internal
|
||||
75 singleton
|
||||
76 begin
|
||||
77 end
|
||||
78 internal
|
||||
79 singleton
|
||||
80 begin
|
||||
81 end
|
||||
82 internal
|
||||
83 singleton
|
||||
84 begin
|
||||
85 end
|
||||
86 internal
|
||||
87 singleton
|
||||
88 begin
|
||||
89 end
|
||||
90 internal
|
||||
91 singleton
|
||||
92 begin
|
||||
93 end
|
||||
94 internal
|
||||
95 singleton
|
||||
96 begin
|
||||
97 end
|
||||
98 internal
|
||||
99 singleton
|
||||
100 begin
|
||||
101 end
|
||||
102 internal
|
||||
103 singleton
|
||||
104 begin
|
||||
105 end
|
||||
106 internal
|
||||
107 singleton
|
||||
108 begin
|
||||
109 end
|
||||
110 internal
|
||||
111 singleton
|
||||
112 begin
|
||||
113 end
|
||||
114 internal
|
||||
115 singleton
|
||||
116 begin
|
||||
117 end
|
||||
118 internal
|
||||
119 singleton
|
||||
120 begin
|
||||
121 end
|
||||
122 internal
|
||||
123 singleton
|
||||
124 begin
|
||||
125 end
|
||||
126 internal
|
||||
127 singleton
|
||||
128 begin
|
||||
129 end
|
||||
130 internal
|
||||
131 singleton
|
||||
132 begin
|
||||
133 end
|
||||
134 internal
|
||||
135 singleton
|
||||
136 begin
|
||||
137 end
|
||||
138 internal
|
||||
139 singleton
|
||||
140 begin
|
||||
141 end
|
||||
142 internal
|
||||
143 singleton
|
||||
144 begin
|
||||
145 end
|
||||
146 internal
|
||||
147 singleton
|
||||
148 begin
|
||||
149 end
|
||||
150 internal
|
||||
151 singleton
|
||||
152 begin
|
||||
153 end
|
||||
154 internal
|
||||
155 singleton
|
||||
156 begin
|
||||
157 end
|
||||
158 internal
|
||||
159 singleton
|
||||
160 begin
|
||||
161 end
|
||||
162 internal
|
||||
163 singleton
|
||||
164 begin
|
||||
165 end
|
||||
166 internal
|
||||
167 singleton
|
||||
168 begin
|
||||
169 end
|
||||
170 internal
|
||||
171 singleton
|
||||
172 begin
|
||||
173 end
|
||||
174 internal
|
||||
175 singleton
|
||||
176 begin
|
||||
177 end
|
||||
178 internal
|
||||
179 singleton
|
||||
180 begin
|
||||
181 end
|
||||
182 internal
|
||||
183 singleton
|
||||
184 begin
|
||||
185 end
|
||||
186 internal
|
||||
187 singleton
|
||||
188 begin
|
||||
189 end
|
||||
190 internal
|
||||
191 singleton
|
||||
192 begin
|
||||
193 end
|
||||
194 internal
|
||||
195 singleton
|
||||
196 begin
|
||||
197 end
|
||||
198 internal
|
||||
199 singleton
|
||||
200 begin
|
||||
201 end
|
||||
202 internal
|
||||
203 singleton
|
||||
204 begin
|
||||
205 end
|
||||
206 internal
|
||||
207 singleton
|
||||
208 begin
|
||||
209 end
|
||||
210 internal
|
||||
211 singleton
|
||||
212 begin
|
||||
213 end
|
||||
214 internal
|
||||
215 singleton
|
||||
216 begin
|
||||
217 end
|
||||
218 internal
|
||||
219 singleton
|
||||
220 begin
|
||||
221 end
|
||||
222 internal
|
||||
223 singleton
|
||||
224 begin
|
||||
225 end
|
||||
226 internal
|
||||
227 singleton
|
||||
228 begin
|
||||
229 end
|
||||
230 internal
|
||||
231 singleton
|
||||
232 begin
|
||||
233 end
|
||||
234 internal
|
||||
235 singleton
|
||||
236 begin
|
||||
237 end
|
||||
238 internal
|
||||
239 singleton
|
||||
240 begin
|
||||
241 end
|
||||
242 internal
|
||||
243 singleton
|
||||
244 begin
|
||||
245 end
|
||||
246 internal
|
||||
247 singleton
|
||||
248 begin
|
||||
249 end
|
||||
250 internal
|
||||
251 singleton
|
||||
252 begin
|
||||
253 end
|
||||
254 internal
|
||||
255 singleton
|
||||
256 begin
|
||||
257 end
|
||||
258 internal
|
||||
259 singleton
|
9
jarvis/utils/tts/vosk/model_en/README
Normal file
9
jarvis/utils/tts/vosk/model_en/README
Normal file
@ -0,0 +1,9 @@
|
||||
US English model for mobile Vosk applications
|
||||
|
||||
Copyright 2020 Alpha Cephei Inc
|
||||
|
||||
Accuracy: 10.38 (tedlium test) 9.85 (librispeech test-clean)
|
||||
Speed: 0.11xRT (desktop)
|
||||
Latency: 0.15s (right context)
|
||||
|
||||
|
BIN
jarvis/utils/tts/vosk/model_en/am/final.mdl
Normal file
BIN
jarvis/utils/tts/vosk/model_en/am/final.mdl
Normal file
Binary file not shown.
7
jarvis/utils/tts/vosk/model_en/conf/mfcc.conf
Normal file
7
jarvis/utils/tts/vosk/model_en/conf/mfcc.conf
Normal file
@ -0,0 +1,7 @@
|
||||
--sample-frequency=16000
|
||||
--use-energy=false
|
||||
--num-mel-bins=40
|
||||
--num-ceps=40
|
||||
--low-freq=20
|
||||
--high-freq=7600
|
||||
--allow-downsample=true
|
10
jarvis/utils/tts/vosk/model_en/conf/model.conf
Normal file
10
jarvis/utils/tts/vosk/model_en/conf/model.conf
Normal file
@ -0,0 +1,10 @@
|
||||
--min-active=200
|
||||
--max-active=3000
|
||||
--beam=10.0
|
||||
--lattice-beam=2.0
|
||||
--acoustic-scale=1.0
|
||||
--frame-subsampling-factor=3
|
||||
--endpoint.silence-phones=1:2:3:4:5:6:7:8:9:10
|
||||
--endpoint.rule2.min-trailing-silence=0.5
|
||||
--endpoint.rule3.min-trailing-silence=0.75
|
||||
--endpoint.rule4.min-trailing-silence=1.0
|
BIN
jarvis/utils/tts/vosk/model_en/graph/Gr.fst
Normal file
BIN
jarvis/utils/tts/vosk/model_en/graph/Gr.fst
Normal file
Binary file not shown.
BIN
jarvis/utils/tts/vosk/model_en/graph/HCLr.fst
Normal file
BIN
jarvis/utils/tts/vosk/model_en/graph/HCLr.fst
Normal file
Binary file not shown.
17
jarvis/utils/tts/vosk/model_en/graph/disambig_tid.int
Normal file
17
jarvis/utils/tts/vosk/model_en/graph/disambig_tid.int
Normal file
@ -0,0 +1,17 @@
|
||||
10015
|
||||
10016
|
||||
10017
|
||||
10018
|
||||
10019
|
||||
10020
|
||||
10021
|
||||
10022
|
||||
10023
|
||||
10024
|
||||
10025
|
||||
10026
|
||||
10027
|
||||
10028
|
||||
10029
|
||||
10030
|
||||
10031
|
166
jarvis/utils/tts/vosk/model_en/graph/phones/word_boundary.int
Normal file
166
jarvis/utils/tts/vosk/model_en/graph/phones/word_boundary.int
Normal file
@ -0,0 +1,166 @@
|
||||
1 nonword
|
||||
2 begin
|
||||
3 end
|
||||
4 internal
|
||||
5 singleton
|
||||
6 nonword
|
||||
7 begin
|
||||
8 end
|
||||
9 internal
|
||||
10 singleton
|
||||
11 begin
|
||||
12 end
|
||||
13 internal
|
||||
14 singleton
|
||||
15 begin
|
||||
16 end
|
||||
17 internal
|
||||
18 singleton
|
||||
19 begin
|
||||
20 end
|
||||
21 internal
|
||||
22 singleton
|
||||
23 begin
|
||||
24 end
|
||||
25 internal
|
||||
26 singleton
|
||||
27 begin
|
||||
28 end
|
||||
29 internal
|
||||
30 singleton
|
||||
31 begin
|
||||
32 end
|
||||
33 internal
|
||||
34 singleton
|
||||
35 begin
|
||||
36 end
|
||||
37 internal
|
||||
38 singleton
|
||||
39 begin
|
||||
40 end
|
||||
41 internal
|
||||
42 singleton
|
||||
43 begin
|
||||
44 end
|
||||
45 internal
|
||||
46 singleton
|
||||
47 begin
|
||||
48 end
|
||||
49 internal
|
||||
50 singleton
|
||||
51 begin
|
||||
52 end
|
||||
53 internal
|
||||
54 singleton
|
||||
55 begin
|
||||
56 end
|
||||
57 internal
|
||||
58 singleton
|
||||
59 begin
|
||||
60 end
|
||||
61 internal
|
||||
62 singleton
|
||||
63 begin
|
||||
64 end
|
||||
65 internal
|
||||
66 singleton
|
||||
67 begin
|
||||
68 end
|
||||
69 internal
|
||||
70 singleton
|
||||
71 begin
|
||||
72 end
|
||||
73 internal
|
||||
74 singleton
|
||||
75 begin
|
||||
76 end
|
||||
77 internal
|
||||
78 singleton
|
||||
79 begin
|
||||
80 end
|
||||
81 internal
|
||||
82 singleton
|
||||
83 begin
|
||||
84 end
|
||||
85 internal
|
||||
86 singleton
|
||||
87 begin
|
||||
88 end
|
||||
89 internal
|
||||
90 singleton
|
||||
91 begin
|
||||
92 end
|
||||
93 internal
|
||||
94 singleton
|
||||
95 begin
|
||||
96 end
|
||||
97 internal
|
||||
98 singleton
|
||||
99 begin
|
||||
100 end
|
||||
101 internal
|
||||
102 singleton
|
||||
103 begin
|
||||
104 end
|
||||
105 internal
|
||||
106 singleton
|
||||
107 begin
|
||||
108 end
|
||||
109 internal
|
||||
110 singleton
|
||||
111 begin
|
||||
112 end
|
||||
113 internal
|
||||
114 singleton
|
||||
115 begin
|
||||
116 end
|
||||
117 internal
|
||||
118 singleton
|
||||
119 begin
|
||||
120 end
|
||||
121 internal
|
||||
122 singleton
|
||||
123 begin
|
||||
124 end
|
||||
125 internal
|
||||
126 singleton
|
||||
127 begin
|
||||
128 end
|
||||
129 internal
|
||||
130 singleton
|
||||
131 begin
|
||||
132 end
|
||||
133 internal
|
||||
134 singleton
|
||||
135 begin
|
||||
136 end
|
||||
137 internal
|
||||
138 singleton
|
||||
139 begin
|
||||
140 end
|
||||
141 internal
|
||||
142 singleton
|
||||
143 begin
|
||||
144 end
|
||||
145 internal
|
||||
146 singleton
|
||||
147 begin
|
||||
148 end
|
||||
149 internal
|
||||
150 singleton
|
||||
151 begin
|
||||
152 end
|
||||
153 internal
|
||||
154 singleton
|
||||
155 begin
|
||||
156 end
|
||||
157 internal
|
||||
158 singleton
|
||||
159 begin
|
||||
160 end
|
||||
161 internal
|
||||
162 singleton
|
||||
163 begin
|
||||
164 end
|
||||
165 internal
|
||||
166 singleton
|
BIN
jarvis/utils/tts/vosk/model_en/ivector/final.dubm
Normal file
BIN
jarvis/utils/tts/vosk/model_en/ivector/final.dubm
Normal file
Binary file not shown.
BIN
jarvis/utils/tts/vosk/model_en/ivector/final.ie
Normal file
BIN
jarvis/utils/tts/vosk/model_en/ivector/final.ie
Normal file
Binary file not shown.
BIN
jarvis/utils/tts/vosk/model_en/ivector/final.mat
Normal file
BIN
jarvis/utils/tts/vosk/model_en/ivector/final.mat
Normal file
Binary file not shown.
3
jarvis/utils/tts/vosk/model_en/ivector/global_cmvn.stats
Normal file
3
jarvis/utils/tts/vosk/model_en/ivector/global_cmvn.stats
Normal file
@ -0,0 +1,3 @@
|
||||
[
|
||||
1.682383e+11 -1.1595e+10 -1.521733e+10 4.32034e+09 -2.257938e+10 -1.969666e+10 -2.559265e+10 -1.535687e+10 -1.276854e+10 -4.494483e+09 -1.209085e+10 -5.64008e+09 -1.134847e+10 -3.419512e+09 -1.079542e+10 -4.145463e+09 -6.637486e+09 -1.11318e+09 -3.479773e+09 -1.245932e+08 -1.386961e+09 6.560655e+07 -2.436518e+08 -4.032432e+07 4.620046e+08 -7.714964e+07 9.551484e+08 -4.119761e+08 8.208582e+08 -7.117156e+08 7.457703e+08 -4.3106e+08 1.202726e+09 2.904036e+08 1.231931e+09 3.629848e+08 6.366939e+08 -4.586172e+08 -5.267629e+08 -3.507819e+08 1.679838e+09
|
||||
1.741141e+13 8.92488e+11 8.743834e+11 8.848896e+11 1.190313e+12 1.160279e+12 1.300066e+12 1.005678e+12 9.39335e+11 8.089614e+11 7.927041e+11 6.882427e+11 6.444235e+11 5.151451e+11 4.825723e+11 3.210106e+11 2.720254e+11 1.772539e+11 1.248102e+11 6.691599e+10 3.599804e+10 1.207574e+10 1.679301e+09 4.594778e+08 5.821614e+09 1.451758e+10 2.55803e+10 3.43277e+10 4.245286e+10 4.784859e+10 4.988591e+10 4.925451e+10 5.074584e+10 4.9557e+10 4.407876e+10 3.421443e+10 3.138606e+10 2.539716e+10 1.948134e+10 1.381167e+10 0 ]
|
1
jarvis/utils/tts/vosk/model_en/ivector/online_cmvn.conf
Normal file
1
jarvis/utils/tts/vosk/model_en/ivector/online_cmvn.conf
Normal file
@ -0,0 +1 @@
|
||||
# configuration file for apply-cmvn-online, used in the script ../local/run_online_decoding.sh
|
2
jarvis/utils/tts/vosk/model_en/ivector/splice.conf
Normal file
2
jarvis/utils/tts/vosk/model_en/ivector/splice.conf
Normal file
@ -0,0 +1,2 @@
|
||||
--left-context=3
|
||||
--right-context=3
|
Reference in New Issue
Block a user