Preprocess merge (!2) · Merge requests · Projets-INFO4 / 18-19 / 21 / BackEnd

Preprocess des mots plus avancé : pouctuation, racinisation des mots, utilisation de la fonction de tokenization de NLTK (un module pour la natural language processing), etc
Train word2vec model sur un corpus de texte wikipedia bien plus grand qu'actuellement
Ajout d'un paramètre pour gérer l'init du word2vec indépendamment de l'init du CNN pour les prédictions de formations
Ajout d'un fichier de contribution pour définir les conventions utilisées
Ajout d'une fonction pour visualiser les descriptors des mots en 2D
Refactor tout le code en PEP8 (style guide)

Edited Mar 08, 2019 by Romain Guillot

Due to inactivity, this project is scheduled to be deleted on 2035-04-24. Why is this scheduled?