Skip to content

Preprocess merge

Romain Guillot requested to merge preprocess into master
  • Preprocess des mots plus avancé : pouctuation, racinisation des mots, utilisation de la fonction de tokenization de NLTK (un module pour la natural language processing), etc
  • Train word2vec model sur un corpus de texte wikipedia bien plus grand qu'actuellement
  • Ajout d'un paramètre pour gérer l'init du word2vec indépendamment de l'init du CNN pour les prédictions de formations
  • Ajout d'un fichier de contribution pour définir les conventions utilisées
  • Ajout d'une fonction pour visualiser les descriptors des mots en 2D
  • Refactor tout le code en PEP8 (style guide)
Edited by Romain Guillot

Merge request reports