Définition formalisme nouveau lexique
En lien avec #88, besoin de définir formalisme pour lexiques présents dans le dépôt (fr, en) et ceux déposables:
- Format du lexique, csv avec a minima
- forme, (lemme|racine|relation), catégorie:sous-catégorie, trait1=value1:traitn=valuen
- Description des labels et values des traits (optionnel)
- Description de la hiérarchie des traits (optionnel)
- Description (voir #88) règles réécriture diacritique & score lettres
Pour les traits, prévoir une refonte des tables gender/number/tense/mood/person et coder à plat l'ensemble des traits de chaque formes par des triplets /label-value-parent/ ? (ex pour not en anglais: /Polarity-Neg-/)
Pour le codage des catégories/sous-catégories & traits, possibilité pour l'utilisateur de déposer un lexique avec un tagset propre ou de se conformer aux UD (Universal Dependencies):
- POS → https://universaldependencies.org/u/pos/
- Features → https://universaldependencies.org/u/feat/index.html
New Issue ? -> intégrer les infos présentes sur universaledependencies.org pour illustrer les cat/sous-cat/features automatiquement.