Preprocess merge
- Preprocess des mots plus avancé : pouctuation, racinisation des mots, utilisation de la fonction de tokenization de NLTK (un module pour la natural language processing), etc
- Train word2vec model sur un corpus de texte wikipedia bien plus grand qu'actuellement
- Ajout d'un paramètre pour gérer l'init du word2vec indépendamment de l'init du CNN pour les prédictions de formations
- Ajout d'un fichier de contribution pour définir les conventions utilisées
- Ajout d'une fonction pour visualiser les descriptors des mots en 2D
- Refactor tout le code en PEP8 (style guide)
Edited by Romain Guillot