Moved everything to jarvis/... and added spacy for stopwords

2021-07-27 17:44:51 +02:00 · 2021-07-27 17:44:51 +02:00 · ab86509e61
commit ab86509e61
parent 3bf6737f45
36 changed files with 45 additions and 37 deletions
--- a/.gitignore
+++ b/.gitignore
@ -135,4 +135,4 @@ dmypy.json


 /ffmpeg/
-/config/secrets.json
+/jarvis/config/secrets.json
--- a/jarvis/init.py
+++ b/jarvis/init.py
--- a/jarvis/config/config.json
+++ b/jarvis/config/config.json
--- a/jarvis/config/languages.json
+++ b/jarvis/config/languages.json
--- a/jarvis/get_path_file.py
+++ b/jarvis/get_path_file.py
--- a/skills/daily/date_and_time/init.py
+++ b/skills/daily/date_and_time/init.py
--- a/jarvis/ia/model.py
+++ b/jarvis/ia/model.py
--- a/jarvis/ia/nltk_utils.py
+++ b/jarvis/ia/nltk_utils.py
@ -2,7 +2,7 @@ import nltk
 import numpy as np
 from nltk.stem.porter import PorterStemmer

-from utils import languages_utils
+from jarvis.utils import languages_utils

 stemmer = PorterStemmer()

--- a/jarvis/ia/process.py
+++ b/jarvis/ia/process.py
@ -3,9 +3,9 @@ import os
 import torch
 from unidecode import unidecode

-import get_path_file
-from ia.model import NeuralNet
-from ia.nltk_utils import bag_of_words, tokenize
+from jarvis import get_path_file
+from jarvis.ia.model import NeuralNet
+from jarvis.ia.nltk_utils import bag_of_words, tokenize

 print("Loading, might take a few seconds...")

--- a/jarvis/ia/train.py
+++ b/jarvis/ia/train.py
@ -5,10 +5,10 @@ import torch
 import torch.nn as nn
 from torch.utils.data import Dataset, DataLoader

-import get_path_file
-from ia.model import NeuralNet
-from ia.nltk_utils import bag_of_words, tokenize, stem
-from utils import intents_utils
+from jarvis import get_path_file
+from jarvis.ia.model import NeuralNet
+from jarvis.ia.nltk_utils import bag_of_words, tokenize, stem
+from jarvis.utils import intents_utils

 path = os.path.dirname(get_path_file.__file__)

--- a/jarvis/ia/trained_model.pth
+++ b/jarvis/ia/trained_model.pth
--- a/jarvis/main.py
+++ b/jarvis/main.py
@ -1,7 +1,6 @@
 import flask
 from flask import Flask, request, jsonify, Response

-import ia.process
 from utils import config_utils, flask_utils, intents_utils, utils

 app = Flask(__name__)
@ -15,7 +14,7 @@ def process_request():
        flask.abort(Response('You must provide a \'sentence\' parameter (not empty aswell)!'))

    sentence = data['sentence']
-    tag_for_request = ia.process.get_tag_for_sentence(sentence)
+    tag_for_request = src.ia.process.get_tag_for_sentence(sentence)

    print("SENTENCE : " + sentence + " /// TAG : " + tag_for_request)

--- a/skills/entertainement/jokes/init.py
+++ b/skills/entertainement/jokes/init.py
--- a/skills/test/wikipedia_search/init.py
+++ b/skills/test/wikipedia_search/init.py
--- a/jarvis/skills/daily/date_and_time/init.py
+++ b/jarvis/skills/daily/date_and_time/init.py
--- a/jarvis/skills/daily/date_and_time/info.json
+++ b/jarvis/skills/daily/date_and_time/info.json
--- a/jarvis/skills/daily/date_and_time/intent.py
+++ b/jarvis/skills/daily/date_and_time/intent.py
@ -1,7 +1,7 @@
 import time
 from datetime import datetime

-from utils import config_utils, intents_utils
+from jarvis.utils import intents_utils, config_utils


 def what_time_is_it():
--- a/jarvis/skills/daily/date_and_time/lang/en-en.json
+++ b/jarvis/skills/daily/date_and_time/lang/en-en.json
--- a/jarvis/skills/daily/date_and_time/lang/fr-fr.json
+++ b/jarvis/skills/daily/date_and_time/lang/fr-fr.json
--- a/jarvis/skills/entertainement/init.py
+++ b/jarvis/skills/entertainement/init.py
--- a/jarvis/skills/entertainement/jokes/init.py
+++ b/jarvis/skills/entertainement/jokes/init.py
--- a/jarvis/skills/entertainement/jokes/info.json
+++ b/jarvis/skills/entertainement/jokes/info.json
--- a/jarvis/skills/entertainement/jokes/intent.py
+++ b/jarvis/skills/entertainement/jokes/intent.py
@ -1,6 +1,6 @@
 import requests as requests

-from utils import languages_utils, config_utils
+from jarvis.utils import languages_utils, config_utils


 def tell_me_a_joke():
--- a/jarvis/skills/entertainement/jokes/lang/en-en.json
+++ b/jarvis/skills/entertainement/jokes/lang/en-en.json
--- a/jarvis/skills/entertainement/jokes/lang/fr-fr.json
+++ b/jarvis/skills/entertainement/jokes/lang/fr-fr.json
--- a/jarvis/skills/research/init.py
+++ b/jarvis/skills/research/init.py
--- a/jarvis/skills/research/wikipedia_search/init.py
+++ b/jarvis/skills/research/wikipedia_search/init.py
--- a/jarvis/utils/init.py
+++ b/jarvis/utils/init.py
--- a/jarvis/utils/client_utils.py
+++ b/jarvis/utils/client_utils.py
@ -3,7 +3,7 @@ import json
 import requests
 from requests.structures import CaseInsensitiveDict

-from utils import config_utils
+from jarvis.utils import config_utils

 client_url = config_utils.get_in_config("CLIENT_URL")

--- a/jarvis/utils/config_utils.py
+++ b/jarvis/utils/config_utils.py
@ -1,7 +1,7 @@
 import json
 import os

-import get_path_file
+from jarvis import get_path_file

 path = os.path.dirname(get_path_file.__file__)

--- a/jarvis/utils/flask_utils.py
+++ b/jarvis/utils/flask_utils.py
--- a/jarvis/utils/intents_utils.py
+++ b/jarvis/utils/intents_utils.py
@ -3,8 +3,8 @@ import json
 import os
 import random

-import get_path_file
-from utils import languages_utils
+from jarvis import get_path_file
+from jarvis.utils import languages_utils

 all_intents = dict()
 path = os.path.dirname(get_path_file.__file__)
--- a/jarvis/utils/languages_utils.py
+++ b/jarvis/utils/languages_utils.py
@ -1,8 +1,8 @@
 import json
 import os

-import get_path_file
-from utils import config_utils
+from jarvis import get_path_file
+from jarvis.utils import config_utils

 path = os.path.dirname(get_path_file.__file__)

--- a/jarvis/utils/nlp_utils.py
+++ b/jarvis/utils/nlp_utils.py
@ -0,0 +1,27 @@
+import spacy
+from nltk.corpus import stopwords
+
+
+def get_spacy_nlp():
+    """
+
+    :return: spacy
+    """
+    nlp = spacy.load("en_core_web_sm")
+    return nlp
+
+
+def get_text_without_stopwords(sentence):
+    stopwords_spacy = get_spacy_nlp().Defaults.stop_words
+
+    stop_words = set(stopwords_spacy)
+    filtered_sentence = [w for w in sentence.lower().split() if w not in stop_words]
+    filtered_sentence = " ".join(filtered_sentence)
+    return filtered_sentence
+
+
+def get_text_without_stopwords_nltk(sentence, language='english'):
+    stop_words = set(stopwords.words(language))
+    filtered_sentence = [w for w in sentence.lower().split() if w not in stop_words]
+    filtered_sentence = " ".join(filtered_sentence)
+    return filtered_sentence
--- a/jarvis/utils/utils.py
+++ b/jarvis/utils/utils.py
--- a/utils/nlp_utils.py
+++ b/utils/nlp_utils.py
@ -1,18 +0,0 @@
-from nltk.corpus import stopwords
-
-from utils.languages_utils import get_language_full_name
-
-
-def get_text_without_stopwords(sentence, language='english'):
-    # if the language given is something like en-us, get the full variant (english)
-    if '-' in language:
-        language = get_language_full_name(language)
-
-    stop_words = set(stopwords.words(language))
-    filtered_sentence = [w for w in sentence.lower().split() if w not in stop_words]
-    filtered_sentence = " ".join(filtered_sentence)
-    return filtered_sentence
-
-
-if __name__ == '__main__':
-    print(get_text_without_stopwords("Hey give me some info about Elon Musk please"))