Commit eb514090 authored by Sylvain Coulange's avatar Sylvain Coulange
Browse files

màj wikicolor font + optimisation dico syllabation

parent a7a36add
......@@ -89,7 +89,11 @@ def makeWord2trans(alemDic):
# on met que les mots simples en mémoire (pas les expressions (=avec une espace))
if q['w'] not in word2trans.keys():
cpt+=1
word2trans[q['w']] = { "t" : q['t'] } # pas besoin de mettre en mémoire le reste pour l'instant (catégories, traductions, fantizi...)
# word2trans[q['w']] = { "t" : q['t'] } # pas besoin de mettre en mémoire le reste pour l'instant (catégories, traductions, fantizi...)
qt = []
for t in q['t']:
qt.append({'tt':t['tt'].replace('.',''),'tr':t['tr']})
word2trans[q['w']] = { "t" : qt }
print("Mise en mémoire...",cpt,end='\r',flush=True)
else:
print('DOUBLON DÉTECTÉ :', q['w'])
......@@ -243,7 +247,7 @@ def traitement(mot, lang, liaison): # LIAISON : avec le caractere liaison en arg
transList = []
shortmem = [] # pour pas afficher plusieurs fois un même alignement (avec et sans syllabation typiquement; le visuel est identique)
for trans in word2trans[mot]['t']:
newT = trans['tt'].replace('.','')
newT = trans['tt']#.replace('.','')
if newT not in shortmem:
transList.append((newT,trans['tr']))
shortmem.append(newT)
......@@ -442,19 +446,19 @@ def checkIfWordExists(w,t,lang='fr'):
if mot == w:
res['w']=True;
for trans in transs['t']:
if trans['tt'].replace(".","") == t:
if trans['tt'] == t:
res['wt']=True
res['t']=True
break
for trans in transs['t']:
if trans['tt'].replace(".","") == t:
if trans['tt'] == t:
res['t']=True
if res['w']: break
if len(w)==0 and len(t)>0:
for mot,transs in dico.items():
for trans in transs['t']:
if trans['tt'].replace(".","") == t:
if trans['tt'] == t:
res['t']=True
break
......
......@@ -9,12 +9,12 @@ import json, spacy, subprocess, re
print('Chargement des modèles de langue...')
print('fr_core_news_md...')
nlpFr = spacy.load('fr_core_news_md')
print('en_core_web_sm...')
nlpEn = spacy.load("en_core_web_sm")
print('zh_core_web_sm...')
nlpZh = spacy.load("zh_core_web_sm")
print('OK.')
logFile = "../logs/dico_frwiktionary-20200301_v2.log"
# print('en_core_web_sm...')
# nlpEn = spacy.load("en_core_web_sm")
# print('zh_core_web_sm...')
# nlpZh = spacy.load("zh_core_web_sm")
# print('OK.')
# logFile = "../logs/dico_frwiktionary-20200301_v2.log"
## RÉCUPÉRATION DE LA LISTE DES EXCEPTIONS POUR L'ANGLAIS
......
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment