Commit a84acdb8 authored by Sylvain Coulange's avatar Sylvain Coulange
Browse files

mise à jour phon2graph_fr + début nouvelle version phon2graph_zh

parent 684918f3
......@@ -12,14 +12,14 @@
# Sylvain Coulange (2020)
# cf. README pour explications détaillées
import re
from phon2graph import decoupage
import re, json
from phon2graph_french import decoupage
############ DÉCLARATIONS DES CHEMINS ############
phonColFile = "data/class-phoneme_v2.csv"
fidelFilePath = "data/phoneme-graphies_fr.scsv"
dicoFilePath = "../wikiphon/dico_frwiktionary-20200301-alpha.csv"
dicoFilePath = "../wikiphon/dico_frwiktionary-20200301_v2.json"
##################################################
# LECTURE DU DICTIONNAIRE PHONEME-CLASSE
......@@ -61,51 +61,37 @@ print(graphCpt,"graphies extraites du Fidel français.")
fidel.close()
# LECTURE DU DICTIONNAIRE PHONÉTISÉ
dicoFile = open(dicoFilePath,mode="r")
wordtrans = []
wordCpt = 0
print("Chargement de",dicoFilePath,"...")
word2trans = {}
with open(dicoFilePath,'r') as dic:
word2trans = json.load(dic)
for line in dicoFile:
line = line.strip()
l = line.split('§')
if len(l) == 2:
mot,trans = l
wordCpt += 1
wordtrans.append((mot,trans))
print("OK.")
print(len(word2trans.keys()),"mots enregistrés dans le dictionnaire phonétisé.")
print(wordCpt,"mots enregistrés depuis le dictionnaire phonétisé.")
dicoFile.close()
# INTERFACE
quit = False
while not quit:
print("Tapez un mot à découper (ou $ pour quitter)...")
mot = input()
result = []
if mot == "$":
quit = True
break
for mottrans in wordtrans:
if mottrans[0].lower() == mot:
result.append(mottrans)
bolres = True
print(len(result),'résultats trouvés !')
for i,j in result:
print(i,':',j,' → découpage :',decoupage(i,j,phon2graph,phon2class))
wordtrans = []
# problèmes restants : couvent/couvent fils/fils est/est → analyse syntaxique avec Spacy possible
# problèmes restants : CD-ROM, T-shirt, SNCF...
print("Tapez un mot à découper (ou $ pour quitter)...")
mot = input()
resbol = False
if mot == "$":
quit = True
break
for w,tt in word2trans.items():
if mot == w:
resbol = True
print("Trouvé :",w,tt)
for t in tt:
print(decoupage(w,t,phon2graph,phon2class,verb=True))
if resbol:
print("Mot non trouvé dans le dictionnaire.")
print("À bientôt !")
word2trans = {}
# REMARQUES:
# Pistes : Apprentissage automatique des patterns de transcription →quel algo?
# Pistes : modèle statistique (dans tel contexte graphique, quel pourcentage pour chaque graphie du phonème?) →ngram
# Pistes : grammaire de règles prenant en compte la position de la graphie dans le mot. [ɛ] ne s'écrira "aid" qu'à la fin d'un mot.
# Débat sur forum : https://openclassrooms.com/forum/sujet/comment-decoupe-une-chaine-de-caractere-en-syllabe-23388
#source : https://terpconnect.umd.edu/~nsw/chinese/pinyin.htm
Big5 GB HZ ZhuYin PinYin Wade Yale
啊 陛 _ ㄚ A A A
哀 飢 ~{0'~} ㄞ Ai Ai Ai
安 假 ~{02~} ㄢ An An An
骯 偎 ~{09~} ㄤ Ang Ang Ang
熬 偏 _ ㄠ Ao Ao Ao
八 匐 ~{0K~} ㄅㄚ Ba Pa Ba
白 啞 ~{0W~} ㄅㄞ Bai Pai Bai
扳 售 ~{0b~} ㄅㄢ Ban Pan Ban
邦 堊 ~{0n~} ㄅㄤ Bang Pang Bang
包 婦 ~{0|~} ㄅㄠ Bao Pao Bau
卑 掠 ~{10~} ㄅㄟ Bei Pei Bei
奔 掉 ~{1<~} ㄅㄣ Ben Pen Ben
崩 推 ~{1@~} ㄅㄥ Beng Peng Beng
逼 排 ~{1F~} ㄅㄧ Bi Pi Bi
編 晤 ~{1`~} ㄅㄧㄢ Bian Pien Byan
彪 梵 ~{1k~} ㄅㄧㄠ Biao Piao Byau
鱉 梱 ~{1n~} ㄅㄧㄝ Bie Pieh Bye
彬 梃 ~{1r~} ㄅㄧㄣ Bin Pin Bin
冰 梨 ~{1y~} ㄅㄧㄥ Bing Ping Bing
波 疏 ~{2(~} ㄅㄛ Bo Po Bwo
不 祥 ~{2;~} ㄅㄨ Bu Pu Bu
擦 笠 ~{2A~} ㄘㄚ Ca Ts'a Tsa
猜 笨 ~{2B~} ㄘㄞ Cai Ts'ai Tsai
參 統 ~{2N~} ㄘㄢ Can Ts'an Tsan
倉 累 ~{2V~} ㄘㄤ Cang Ts'ang Tsang
操 紱 ~{2Y~} ㄘㄠ Cao Ts'ao Tsau
冊 聊 ~{2a~} ㄘㄜ Ce Ts'e Tse
岑 嶍 ~{a/~} ㄘㄣ Cen Ts'en Tsen
曾 崠 ~{Tx~} ㄘㄥ Ceng Ts'eng Tseng
叉 脫 ~{2f~} ㄔㄚ Cha Ch'a Cha
拆 莞 ~{2p~} ㄔㄞ Chai Ch'ai Chai
摻 莖 ~{2t~} ㄔㄢ Chan Ch'an Chan
昌 荻 ~{2}~} ㄔㄤ Chang Ch'ang Chang
吵 陶 ~{33~} ㄔㄠ Chao Ch'ao Chau
車 陬 ~{35~} ㄔㄜ Che Ch'e Che
琛 銵 ~{h!~} ㄔㄣ Chen Ch'en Chen
稱 備 ~{3F~} ㄔㄥ Cheng Ch'eng Cheng
吃 勛 ~{3T~} ㄔ Chi Ch'ih Chr
充 喃 ~{3d~} ㄔㄨㄥ Chong Ch'ung Chung
抽 喲 ~{3i~} ㄔㄡ Chou Ch'ou Chou
出 堤 ~{3v~} ㄔㄨ Chu Ch'u Chu
揣 揮 ~{4'~} ㄔㄨㄞ Chuai Ch'uai Chwai
川 捶 ~{4(~} ㄔㄨㄢ Chuan Ch'uan Chwan
創 斐 ~{44~} ㄔㄨㄤ Chuang Ch'uang Chwang
吹 斯 ~{45~} ㄔㄨㄟ Chui Ch'ui Chwei
春 景 ~{4:~} ㄔㄨㄣ Chun Ch'un Chwun
綽 朝 ~{4B~} ㄔㄨㄛ Chuo Ch'o Chwo
疵 棺 ~{4C~} ㄘ Ci Tz'u Tsz
匆 棍 ~{4R~} ㄘㄨㄥ Cong Ts'ung Tsung
粗 棉 ~{4V~} ㄘㄨ Cu Ts'u Tsu
竄 欽 ~{4\~} ㄘㄨㄢ Cuan Ts'uan Tswan
崔 殖 ~{4^~} ㄘㄨㄟ Cui Ts'ui Tswei
村 游 ~{4e~} ㄘㄨㄣ Cun Ts'un Tswun
撮 湧 ~{4i~} ㄘㄨㄛ Cuo Ts'o Tswo
答 湘 ~{4p~} ㄉㄚ Da Ta Da
呆 渭 ~{4t~} ㄉㄞ Dai Tai Dai
丹 竣 ~{5$~} ㄉㄢ Dan Tan Dan
當 絞 ~{51~} ㄉㄤ Dang Tang Dang
刀 絮 ~{56~} ㄉㄠ Dao Tao Dau
得 腕 ~{5C~} ㄉㄜ De Te De
得 腕 ~{5C~} ㄉㄟ Dei Tei Dei
登 腎 ~{5G~} ㄉㄥ Deng Teng Deng
低 腴 ~{5M~} ㄉㄧ Di Ti Di
滇 菲 ~{5a~} ㄉㄧㄢ Dian Tien Dyan
刁 街 ~{5s~} ㄉㄧㄠ Diao Tiao Dyau
爹 註 ~{5y~} ㄉㄧㄝ Die Tieh Dye
丁 間 ~{6!~} ㄉㄧㄥ Ding Ting Ding
丟 隍 ~{6*~} ㄉㄧㄡ Diu Tiu Dyou
冬 隄 ~{6,~} ㄉㄨㄥ Dong Tung Dung
兜 項 ~{65~} ㄉㄡ Dou Tou Dou
督 飭 ~{6=~} ㄉㄨ Du Tu Du
端 傷 ~{6K~} ㄉㄨㄢ Duan Tuan Dwan
堆 剽 ~{6Q~} ㄉㄨㄟ Dui Tui Dwei
敦 嗟 ~{6X~} ㄉㄨㄣ Dun Tun Dwun
多 嗣 ~{6`~} ㄉㄨㄛ Duo To Dwo
誒 睎 _ ㄝ E E E
娥 塔 ~{6p~} ㄜ E E E
誒 睎 _ ㄟ Ei Ei Ei
恩 塋 ~{6w~} ㄣ En En En
鞥 典 _ ㄥ Eng Eng Eng
兒 嫁 ~{6y~} ㄦ Er Erh Er
伐 極 ~{7%~} ㄈㄚ Fa Fa Fa
反 毀 ~{74~} ㄈㄢ Fan Fan Fan
方 源 ~{7=~} ㄈㄤ Fang Fang Fang
妃 漦 ~{ez~} ㄈㄟ Fei Fei Fei
分 煦 ~{7V~} ㄈㄣ Fen Fen Fen
丰 猿 ~{7a~} ㄈㄥ Feng Feng Feng
佛 痰 ~{7p~} ㄈㄛ Fo Fo Fwo
浮 腹 ~{8!~} ㄈㄡ Fou Fou Fou
仆 ⼳ ~{FM~} ㄈㄨ Fu Fu Fu
尬 痸 ~{^N~} ㄍㄚ Ga Ka Ga
垓 跍 ~{[r~} ㄍㄞ Gai Kai Gai
干 補 ~{8I~} ㄍㄢ Gan Kan Gan
亢 蕩 ~{?:~} ㄍㄤ Gang Kang Gang
高 詢 ~{8_~} ㄍㄠ Gao Kao Gau
戈 資 ~{8j~} ㄍㄜ Ge Ke Ge
給 跤 ~{8x~} ㄍㄟ Gei Kei Gei
根 跦 ~{8y~} ㄍㄣ Gen Ken Gen
耕 較 ~{8{~} ㄍㄥ Geng Keng Geng
工 馱 ~{9$~} ㄍㄨㄥ Gong Kung Gung
勾 僑 ~{94~} ㄍㄡ Gou Kou Gou
估 嘛 ~{9@~} ㄍㄨ Gu Ku Gu
瓜 圖 ~{9O~} ㄍㄨㄚ Gua Kua Gwa
乖 墊 ~{9T~} ㄍㄨㄞ Guai Kuai Gwai
官 夥 ~{9Y~} ㄍㄨㄢ Guan Kuan Gwan
光 嫖 ~{9b~} ㄍㄨㄤ Guang Kuang Gwang
圭 寧 ~{9g~} ㄍㄨㄟ Gui Kuei Gwei
滾 幗 ~{9v~} ㄍㄨㄣ Gun Kun Gwun
郭 廖 ~{9y~} ㄍㄨㄛ Guo Kuo Gwo
哈 慇 ~{9~~} ㄏㄚ Ha Ha Ha
孩 滯 ~{:"~} ㄏㄞ Hai Hai Hai
酣 漕 ~{:(~} ㄏㄢ Han Han Han
夯 獄 ~{:;~} ㄏㄤ Hang Hang Hang
壕 瑣 ~{:>~} ㄏㄠ Hao Hao Hau
呵 瘉 ~{:G~} ㄏㄜ He He He
黑 窪 ~{:Z~} ㄏㄟ Hei Hei Hei
痕 窩 ~{:[~} ㄏㄣ Hen Hen Hen
亨 箋 ~{:`~} ㄏㄥ Heng Heng Heng
哄 箏 ~{:e~} ㄏㄨㄥ Hong Hung Hung
侯 綜 ~{:n~} ㄏㄡ Hou Hou Hou
乎 綱 ~{:u~} ㄏㄨ Hu Hu Hu
化 趙 ~{;/~} ㄏㄨㄚ Hua Hua Hwa
徊 輔 ~{;2~} ㄏㄨㄞ Huai Huai Hwai
歡 辣 ~{;6~} ㄏㄨㄢ Huan Huan Hwan
肓 蹅 ~{kA~} ㄏㄨㄤ Huang Huang Hwang
灰 閡 ~{;R~} ㄏㄨㄟ Hui Hui Hwei
昏 餉 ~{;h~} ㄏㄨㄣ Hun Hun Hwun
豁 魁 ~{;m~} ㄏㄨㄛ Huo Huo Hwo
几 撓 ~{<8~} ㄐㄧ Ji Chi Ji
加 樓 ~{ ㄐㄧㄚ Jia Chia Jya
奸 潮 ~{ ㄐㄧㄢ Jian Chien Jyan
江 蔬 ~{=-~} ㄐㄧㄤ Jiang Chiang Jyang
交 蝠 ~{=;~} ㄐㄧㄠ Jiao Chiao Jyau
皆 諂 ~{=T~} ㄐㄧㄝ Jie Chieh Jye
巾 踫 ~{=m~} ㄐㄧㄣ Jin Chin Jin
京 儔 ~{>)~} ㄐㄧㄥ Jing Ching Jing
窘 噬 ~{>=~} ㄐㄩㄥ Jiong Chiung Jyung
九 嬝 ~{>E~} ㄐㄧㄡ Jiu Chiu Jyou
居 懈 ~{>S~} ㄐㄩ Ju Chu: Jyu
娟 樽 ~{>j~} ㄐㄩㄢ Juan Chuan: Jywan
孓 箵 ~{f^~} ㄐㄩㄝ Jue Chueh: Jywe
君 澱 ~{>}~} ㄐㄩㄣ Jun Chun: Jyun
卡 縐 ~{?(~} ㄎㄚ Ka K'a Ka
開 羲 ~{?*~} ㄎㄞ Kai K'ai Kai
刊 膳 ~{?/~} ㄎㄢ Kan K'an Kan
康 艙 ~{?5~} ㄎㄤ Kang K'ang Kang
考 蕉 ~{?<~} ㄎㄠ Kao K'ao Kau
刻 覦 ~{?L~} ㄎㄜ Ke K'e Ke
肯 諫 ~{?O~} ㄎㄣ Ken K'en Ken
坑 諧 ~{?S~} ㄎㄥ Keng K'eng Keng
空 諾 ~{?U~} ㄎㄨㄥ Kong K'ung Kung
口 諳 ~{?Z~} ㄎㄡ Kou K'ou Kou
枯 豫 ~{?]~} ㄎㄨ Ku K'u Ku
夸 蹂 ~{?d~} ㄎㄨㄚ Kua K'ua Kwa
快 辦 ~{?l~} ㄎㄨㄞ Kuai K'uai Kwai
寬 遵 ~{?m~} ㄎㄨㄢ Kuan K'uan Kwan
匡 選 ~{?o~} ㄎㄨㄤ Kuang K'uang Kwang
盔 錳 ~{?x~} ㄎㄨㄟ Kui K'uei Kwei
坤 壑 ~{@$~} ㄎㄨㄣ Kun K'un Kwun
括 嬤 ~{@(~} ㄎㄨㄛ Kuo K'uo Kwo
拉 嶺 ~{@-~} ㄌㄚ La La La
來 懂 ~{@4~} ㄌㄞ Lai Lai Lai
婪 懋 ~{@7~} ㄌㄢ Lan Lan Lan
郎 檔 ~{@I~} ㄌㄤ Lang Lang Lang
撈 檜 ~{@L~} ㄌㄠ Lao Lao Lau
勒 毚 ~{@U~} ㄌㄜ Le Le Le
淚 濡 ~{@a~} ㄌㄟ Lei Lei Lei
愣 蒹 ~{c6~} ㄌㄥ Leng Leng Leng
哩 薇 ~{A(~} ㄌㄧ Li Li Li
倆 薨 ~{A)~} ㄌㄧㄚ Lia Lia Lya
連 蟀 ~{A,~} ㄌㄧㄢ Lian Lien Lyan
良 謎 ~{A<~} ㄌㄧㄤ Liang Liang Lyang
撩 謄 ~{AC~} ㄌㄧㄠ Liao Liao Lyau
咧 萻 ~{_V~} ㄌㄧㄝ Lie Lieh Lye
林 輿 ~{AV~} ㄌㄧㄣ Lin Lin Lin
令 鍔 ~{An~} ㄌㄧㄥ Ling Ling Ling
溜 闊 ~{Ao~} ㄌㄧㄡ Liu Liu Lyou
隆 癒 ~{B!~} ㄌㄨㄥ Long Lung Lung
摟 禮 ~{B'~} ㄌㄡ Lou Lou Lou
盧 竅 ~{B,~} ㄌㄨ Lu Lu Lu
巒 蟬 ~{BM~} ㄌㄨㄢ Luan Luan Lwan
掠 謨 ~{BS~} ㄌㄩㄝ Lue: Lueh: Lywe
掄 謬 ~{BU~} ㄌㄨㄣ Lun Lun Lwun
囉 蹕 ~{B^~} ㄌㄨㄛ Luo Luo Lwo
媽 鎔 ~{Bh~} ㄇㄚ Ma Ma Ma
埋 鎚 ~{Bq~} ㄇㄞ Mai Mai Mai
顢 簼 ~{r)~} ㄇㄢ Man Man Man
忙 疆 ~{C&~} ㄇㄤ Mang Mang Mang
貓 癡 ~{C(~} ㄇㄠ Mao Mao Mau
沒 羶 ~{C;~} ㄇㄟ Mei Mei Mei
悶 蟻 ~{CF~} ㄇㄣ Men Men Men
矇 蟹 ~{CI~} ㄇㄥ Meng Meng Meng
咪 蛷 ~{_d~} ㄇㄧ Mi Mi Mi
眠 蹺 ~{C_~} ㄇㄧㄢ Mian Mien Myan
喵 裚 ~{_w~} ㄇㄧㄠ Miao Miao Myau
羋 娷 ~{XB~} ㄇㄧㄝ Mie Mieh Mye
民 鏍 ~{Cq~} ㄇㄧㄣ Min Min Min
名 靡 ~{C{~} ㄇㄧㄥ Ming Ming Ming
謬 韻 ~{C}~} ㄇㄧㄡ Miu Miu Myou
摸 類 ~{C~~} ㄇㄛ Mo Mo Mwo
牟 觸 ~{D2~} ㄇㄡ Mou Mou Mou
木 躂 ~{D>~} ㄇㄨ Mu Mu Mu
那 饒 ~{DG~} ㄋㄚ Na Na Na
乃 騰 ~{DK~} ㄋㄞ Nai Nai Nai
男 鹹 ~{DP~} ㄋㄢ Nan Nan Nan
囊 黨 ~{DR~} ㄋㄤ Nang Nang Nang
惱 齣 ~{DU~} ㄋㄠ Nao Nao Nau
內 囀 ~{DZ~} ㄋㄟ Nei Nei Nei
能 夔 ~{D\~} ㄋㄥ Neng Neng Neng
尼 攝 ~{Da~} ㄋㄧ Ni Ni Ni
年 爛 ~{Dj~} ㄋㄧㄢ Nian Nien Nyan
娘 矓 ~{Do~} ㄋㄧㄤ Niang Niang Nyang
鳥 纏 ~{Dq~} ㄋㄧㄠ Niao Niao Nyau
捏 羼 ~{Ds~} ㄋㄧㄝ Nie Nieh Nye
您 蠟 ~{Dz~} ㄋㄧㄣ Nin Nin Nin
寧 譴 ~{D~~} ㄋㄧㄥ Ning Ning Ning
牛 籟 ~{E#~} ㄋㄧㄡ Niu Niu Nyou
農 觼 ~{E)~} ㄋㄨㄥ Nong Nung Nung
耨 嚭 ~{qq~} ㄋㄨㄡ Nou Nou Nou
奴 贖 ~{E+~} ㄋㄨ Nu Nu Nu
女 躓 ~{E.~} ㄋㄩ Nu: Nu: Nyu
暖 轡 ~{E/~} ㄋㄨㄢ Nuan Nuan Nwan
虐 酈 ~{E0~} ㄋㄩㄝ Nue: Nueh: Nywe
挪 鑑 ~{E2~} ㄋㄨㄛ Nuo No Nwo
偶 髒 ~{E<~} ㄡ Ou Ou Ou
芭 剪 ~{0E~} ㄆㄚ Pa P'a Pa
拍 鼴 ~{ED~} ㄆㄞ Pai P'ai Pai
潘 攣 ~{EK~} ㄆㄢ Pan P'an Pan
乓 籤 ~{ER~} ㄆㄤ Pang P'ang Pang
拋 纔 ~{EW~} ㄆㄠ Pao P'ao Pau
坏 輓 ~{;5~} ㄆㄟ Pei P'ei Pei
噴 驗 ~{Eg~} ㄆㄣ Pen P'en Pen
朋 攬 ~{Es~} ㄆㄥ Peng P'eng Peng
匹 ⑤ ~{F%~} ㄆㄧ Pi P'i Pi
片 ⑵ ~{F,~} ㄆㄧㄢ Pian P'ien Pyan
票 ⑺ ~{F1~} ㄆㄧㄠ Piao P'iao Pyau
撇 ⑻ ~{F2~} ㄆㄧㄝ Pie P'ieh Pye
拚 皙 ~{^U~} ㄆㄧㄣ Pin P'in Pin
乒 ⅴ ~{F9~} ㄆㄧㄥ Ping P'ing Ping
坡 亠 ~{FB~} ㄆㄛ Po P'o Pwo
剖 夊 ~{FJ~} ㄆㄡ Pou P'ou Pou
仆 ⼳ ~{FM~} ㄆㄨ Pu P'u Pu
七 仝 ~{F_~} ㄑㄧ Qi Ch'i Chi
掐 じ ~{F~~} ㄑㄧㄚ Qia Ch'ia Chya
千 カ ~{G'~} ㄑㄧㄢ Qian Ch'ien Chyan
羌 ダ ~{G<~} ㄑㄧㄤ Qiang Ch'iang Chyang
悄 ト ~{GD~} ㄑㄧㄠ Qiao Ch'iao Chyau
切 ピ ~{GP~} ㄑㄧㄝ Qie Ch'ieh Chye
侵 ペ ~{GV~} ㄑㄧㄣ Qin Ch'in Chin
青 ヤ ~{G`~} ㄑㄧㄥ Qing Ch'ing Ching
穹 騇 ~{q7~} ㄑㄩㄥ Qiong Ch'iung Chyung
丘 ヴ ~{Gp~} ㄑㄧㄡ Qiu Ch'iu Chyou
曲 Ж ~{Gz~} ㄑㄩ Qu Ch'u: Chyu
圈 � ~{H&~} ㄑㄩㄢ Quan Ch'uan: Chywan
缺 � ~{H1~} ㄑㄩㄝ Que Ch'ueh: Chywe
群 � ~{H:~} ㄑㄩㄣ Qun Ch'un: Chyun
然 � ~{H;~} ㄖㄢ Ran Jan Ran
嚷 � ~{HB~} ㄖㄤ Rang Jang Rang
嬈 甈 ~{f,~} ㄖㄠ Rao Jao Rau
熱 � ~{HH~} ㄖㄜ Re Je Re
人 � ~{HK~} ㄖㄣ Ren Jen Ren
扔 ℡ ~{HS~} ㄖㄥ Reng Jeng Reng
日 ゜ ~{HU~} ㄖ Ri Jih R
戎 ⺀ ~{HV~} ㄖㄨㄥ Rong Jung Rung
柔 ⺥ ~{Ha~} ㄖㄡ Rou Jou Rou
如 ⺼ ~{Hg~} ㄖㄨ Ru Ju Ru
阮 ⻖ ~{Hn~} ㄖㄨㄢ Ruan Juan Rwan
瑞 ⻞ ~{Hp~} ㄖㄨㄟ Rui Jui Rwei
閏 � ~{Hr~} ㄖㄨㄣ Run Jun Rwun
若 � ~{Ht~} ㄖㄨㄛ Ruo Jo Rwo
卅 埵 ~{X&~} ㄙㄚ Sa Sa Sa
塞 ø ~{H{~} ㄙㄞ Sai Sai Sai
三 ʊ ~{H}~} ㄙㄢ San San San
桑 氿 ~{I#~} ㄙㄤ Sang Sang Sang
搔 犰 ~{I&~} ㄙㄠ Sao Sao Sau
色 伎 ~{I+~} ㄙㄜ Se Se Se
森 伬 ~{I-~} ㄙㄣ Sen Sen Sen
僧 仵 ~{I.~} ㄙㄥ Seng Seng Seng
沙 伈 ~{I3~} ㄕㄚ Sha Sha Sha
晒 伄 ~{I9~} ㄕㄞ Shai Shai Shai
山 刓 ~{I=~} ㄕㄢ Shan Shan Shan
商 妀 ~{IL~} ㄕㄤ Shang Shang Shang
捎 孖 ~{IS~} ㄕㄠ Shao Shao Shau
奢 异 ~{I]~} ㄕㄜ She She She
誰 阰 ~{K-~} ㄕㄟ Shei Shei Shei
申 扠 ~{Ij~} ㄕㄣ Shen Shen Shen
升 汔 ~{I}~} ㄕㄥ Sheng Sheng Sheng
尸 坌 ~{J,~} ㄕ Shi Shih Shr
收 彶 ~{JU~} ㄕㄡ Shou Shou Shou
書 抎 ~{Ji~} ㄕㄨ Shu Shu Shu
刷 芃 ~{K"~} ㄕㄨㄚ Shua Shua Shwa
衰 迉 ~{K%~} ㄕㄨㄞ Shuai Shuai Shwai
拴 邥 ~{K)~} ㄕㄨㄢ Shuan Shuan Shwan
霜 邞 ~{K*~} ㄕㄨㄤ Shuang Shuang Shwang
誰 阰 ~{K-~} ㄕㄨㄟ Shui Shui Shwei
吮 丳 ~{K1~} ㄕㄨㄣ Shun Shun Shwun
說 佽 ~{K5~} ㄕㄨㄛ Shuo Shuo Shwo
司 侗 ~{K>~} ㄙ Si Ssu Sz
松 碪 ~{bl~} ㄙㄨㄥ Song Sung Sung
叟 袹 ~{[E~} ㄙㄡ Sou Sou Sou
疏 抌 ~{Jh~} ㄙㄨ Su Su Su
酸 呫 ~{Ka~} ㄙㄨㄢ Suan Suan Swan
雖 呥 ~{Kd~} ㄙㄨㄟ Sui Sui Swei
孫 呤 ~{Ko~} ㄙㄨㄣ Sun Sun Swun
唆 坭 ~{Kt~} ㄙㄨㄛ Suo So Swo
他 坻 ~{K{~} ㄊㄚ Ta T'a Ta
台 怢 ~{L(~} ㄊㄞ Tai T'ai Tai
坍 怌 ~{L.~} ㄊㄢ Tan T'an Tan
湯 抸 ~{L@~} ㄊㄤ Tang T'ang Tang
桃 朊 ~{LR~} ㄊㄠ Tao T'ao Tau
特 杻 ~{LX~} ㄊㄜ Te T'e Te
騰 枆 ~{LZ~} ㄊㄥ Teng T'eng Teng
剔 枌 ~{L^~} ㄊㄧ Ti T'i Ti
天 毞 ~{Ll~} ㄊㄧㄢ Tian T'ien Tyan
佻 椄 ~{Y,~} ㄊㄧㄠ Tiao T'iao Tyau
帖 泃 ~{L{~} ㄊㄧㄝ Tie T'ieh Tye
聽 泭 ~{L}~} ㄊㄧㄥ Ting T'ing Ting
同 肮 ~{M,~} ㄊㄨㄥ Tong T'ung Tung
偷 芚 ~{M5~} ㄊㄡ Tou T'ou Tou
禿 芮 ~{M:~} ㄊㄨ Tu T'u Tu
團 芶 ~{ME~} ㄊㄨㄢ Tuan T'uan Twan
推 芢 ~{MF~} ㄊㄨㄟ Tui T'ui Twei
吞 迒 ~{ML~} ㄊㄨㄣ Tun T'un Twun
佗 晬 ~{Y"~} ㄊㄨㄛ Tuo T'o Two
娃 俅 ~{M^~} ㄨㄚ Wa Wa Wa
歪 俉 ~{Ma~} ㄨㄞ Wai Wai Wai
剜 嵑 ~{X`~} ㄨㄢ Wan Wan Wan
亡 厗 ~{Mv~} ㄨㄤ Wang Wang Wang
委 巹 ~{N/~} ㄨㄟ Wei Wei Wei
文 恅 ~{ND~} ㄨㄣ Wen Wen Wen
翁 恟 ~{NL~} ㄨㄥ Weng Weng Weng
倭 椑 ~{YA~} ㄨㄛ Wo O O
圬 訹 ~{[X~} ㄨ Wu Wu Wu
兮 殽 ~{Yb~} ㄒㄧ Xi Hsi Xyi
匣 牰 ~{O;~} ㄒㄧㄚ Xia Hsia Sya
仙 珈 ~{OI~} ㄒㄧㄢ Xian Hsien Syan
相 眈 ~{O`~} ㄒㄧㄤ Xiang Hsiang Syang
削 祅 ~{Ow~} ㄒㄧㄠ Xiao Hsiao Syau
些 虳 ~{P)~} ㄒㄧㄝ Xie Hsieh Sye
心 陑 ~{PD~} ㄒㄧㄣ Xin Hsin Syin
星 陎 ~{PG~} ㄒㄧㄥ Xing Hsin Sying
凶 倜 ~{PW~} ㄒㄩㄥ Xiong Hsiung Syung
休 倎 ~{P]~} ㄒㄧㄡ Xiu Hsiu Syou
徐 剢 ~{Pl~} ㄒㄩ Xu Hsu: Syu
宣 哫 ~{P{~} ㄒㄩㄢ Xuan Hsuan: Sywan
靴 悒 ~{Q%~} ㄒㄩㄝ Xue Hsueh: Sywe
勛 悗 ~{Q+~} ㄒㄩㄣ Xun Hsun: Syun
丫 挩 ~{Q>~} ㄧㄚ Ya Ya Ya
奄 栟 ~{QY~} ㄧㄢ Yan Yan Yan
央 栝 ~{Qk~} ㄧㄤ Yang Yang Yang
堯 牶 ~{R"~} ㄧㄠ Yao Yao Yau
夜 珗 ~{R9~} ㄧㄝ Ye Yeh Ye
一 珨 ~{R;~} ㄧ Yi I Yi
因 秪 ~{Rr~} ㄧㄣ Yin Yin Yin
英 荎 ~{S"~} ㄧㄥ Ying Ying Ying
邕 諅 ~{g_~} ㄩㄥ Yong Yung Yung
攸 惎 ~{X|~} ㄧㄡ You Yu You
迂 衯 ~{SX~} ㄩ Yu Yu: Yu
元 啋 ~{T*~} ㄩㄢ Yuan Yuan: Ywan
月 堎 ~{TB~} ㄩㄝ Yue Yueh: Ywe
暈 婠 ~{TN~} ㄩㄣ Yun Yun: Yun
匝 婧 ~{TQ~} ㄗㄚ Za Tsa Dza
災 婐 ~{TV~} ㄗㄞ Zai Tsai Dzai
簪 穮 ~{t"~} ㄗㄢ Zan Tsan Dzan
臧 穈 ~{j0~} ㄗㄤ Zang Tsang Dzang
遭 婈 ~{Tb~} ㄗㄠ Zao Tsao Dzau
則 寀 ~{Tr~} ㄗㄜ Ze Tse Dze
賊 崞 ~{Tt~} ㄗㄟ Zei Tsei Dzei
怎 崋 ~{Tu~} ㄗㄣ Zen Tsen Dzen
曾 崠 ~{Tx~} ㄗㄥ Zeng Tseng Dzeng
扎 崨 ~{Tz~} ㄓㄚ Zha Cha Ja
摘 晡 ~{U*~} ㄓㄞ Zhai Chai Jai
占 梩 ~{U<~} ㄓㄢ Zhan Chan Jan
張 桲 ~{UE~} ㄓㄤ Zhang Chang Jang
召 欸 ~{UY~} ㄓㄠ Zhao Chao Jau
遮 殑 ~{UZ~} ㄓㄜ Zhe Che Je
珍 湴 ~{Ud~} ㄓㄣ Zhen Chen Jen
正 淏 ~{U}~} ㄓㄥ Zheng Cheng Jeng
之 眳 ~{V.~} ㄓ Zhi Chih Jr
中 笢 ~{VP~} ㄓㄨㄥ Zhong Chung Jung
州 笣 ~{V]~} ㄓㄡ Zhou Chou Jou
朱 紾 ~{Vl~} ㄓㄨ Zhu Chu Ju
抓 蚰 ~{W%~} ㄓㄨㄚ Zhua Chua Jwa
拽 蚹 ~{W'~} ㄓㄨㄞ Zhuai Chuai Jwai
專 蚳 ~{W(~} ㄓㄨㄢ Zhuan Chuan Jwan
妝 衒 ~{W1~} ㄓㄨㄤ Zhuang Chuang Jwang
隹 鶹 ~{v?~} ㄓㄨㄟ Zhui Chui Jwei
准 袧 ~{W<~} ㄓㄨㄣ Zhun Chun Jwun
卓 袗 ~{W?~} ㄓㄨㄛ Zhuo Cho Jwo
子 赽 ~{WS~} ㄗ Zi Tzu Dz
宗 跁 ~{WZ~} ㄗㄨㄥ Zong Tsung Dzung
鄒 軜 ~{W^~} ㄗㄡ Zou Tsou Dzou
租 逤 ~{Wb~} ㄗㄨ Zu Tsu Dzu
鑽 郰 ~{Wj~} ㄗㄨㄢ Zuan Tsuan Dzwan
嘴 郲 ~{Wl~} ㄗㄨㄟ Zui Tsui Dzwei
尊 郬 ~{Wp~} ㄗㄨㄣ Zun Tsun Dzwun
作 釬 ~{Ww~} ㄗㄨㄛ Zuo Tso Dzwo
\ No newline at end of file
import json
py2zh = {}
with open('correspondances_big5GbHzZhuyinPinyinWadeYale.tsv', 'r') as inf:
for line in inf:
line = line.strip()
l = line.split('\t')
if len(l) == 7 and l[0]!="Big5":
big5, gb, hz, zhuyin, pinyin, wade, yale = l
py2zh[pinyin.lower().strip()] = {
"Big5":big5.strip(),
"GB":gb.strip(),
"HZ":hz.strip(),
"ZhuYin":zhuyin.strip(),
"PinYin":pinyin.lower().strip(),
"Wade":wade.lower().strip(),
"Yale":yale.lower().strip()
}
cpt=0
for i in py2zh.keys():
cpt+=1
print(cpt,"entrées enregistrées.")
with open("pinyin2zhuyin.json","w") as outf:
outf = json.dump(py2zh, outf, ensure_ascii=False, indent=4)
print('Export terminé.')
#### ATTENTION IL FAUT REMPLACER MANUELEMENT LES U: par Ü
\ No newline at end of file
......@@ -7,7 +7,7 @@ a:a,à,ac,ach,achs,acs,ae,ah,ahs,ao,ap,aps,as,at,ats,e,ê,ha,has,he,i,î,id,ids,
ə:ai,e,ent,es,on
b:b,bb,bbe,bbes,be,bent,bes,bh,bs
d:d,dd,ddh,de,dent,des,dh,ds,g,z,d’,gd
e:a,æ,aî,aie,ay,e,é,ê,ë,ea,ed,eds,ee,ée,éent,ées,ees,ef,efs,eh,èh,ehe,ehes,ehs,èhs,ei,ept,er,ers,ës,és,es,et,ez,ha,hai,he,hé,ier,iers,œ,ai
e:a,æ,aî,aie,ay,e,é,ê,ë,ea,ed,eds,ee,ée,éent,ées,ees,ef,efs,eh,èh,ehe,ehes,ehs,èhs,ei,ept,er,ers,ës,és,es,et,ez,ha,hai,he,hé,œ,ai
ɛ:ä,a,ai,aî,aid,aids,aie,aient,aies,ais,ait,aît,aits,aix,ay,aye,ayes,ays,e,è,ê,ë,ea,ect,ects,ee,ef,efs,egs,eh,èh,ei,eî,es,ès,est,êt,et,ets,êts,ey,eys,ez,hai,haie,haies,hais,hait,haits,he,hè,hê,hea,hee,hei,œ,é
ɛ̃:aim,aims,ain,ainc,aincs,aing,aings,ains,aint,aints,ein,eing,eings,eins,eint,eints,en,ens,ent,hein,hen,hin,im,in,în,ïn,inc,inct,incts,ing,ings,ingt,ingts,ins,int,înt,ints,ym,yms,yn,inq
f:f,fe,fent,fes,ff,ffe,ffent,ffes,ffs,fs,gh,ghs,ph,phe,phent,phes,phs
......@@ -20,9 +20,9 @@ k:c,cc,cch,ccu,ch,chs,ck,cke,ckent,ckes,cks,cqu,cque,cques,cs,cu,g,gs,k,ke,kes,k
l:l,ld,le,lent,les,ll,lle,llent,lles,lls,lp,ls,l’
m:m,me,ment,mes,mm,mme,mment,mmes,mms,ms,m’
n:kn,mn,mne,mnent,mnes,n,ne,ned,nent,nes,nn,nne,nnent,nnes,nns,ns,n’,gn,‿
nj:gn,gne,gnent,gnes,gni,ñ,ign,ni
nj:gn,gne,gnent,gnes,gni,ñ,ni
ŋ:n,ng,ngs
o:a,ach,ao,aos,au,aud,auds,aul,ault,aults,aulx,aus,aut,auts,aux,aw,eau,eaux,ha,hau,haut,hauts,haw,heau,ho,hô,hot,hots,o,ô,oa,oc,ocs,ods,oh,op,ops,os,ot,ôt,oth,oths,ôts,ots,ow,ows,u,oo
o:a,ach,ao,aos,au,aud,auds,aul,ault,aults,aulx,aus,aut,auts,aux,aw,eau,eaux,ha,hau,haut,hauts,haw,heau,ho,hô,hot,hots,o,ô,oa,oc,ocs,ods,oh,op,ops,os,ot,ôt,oth,oths,ôts,ots,ow,ows,u,oo,oi
ɔ:a,al,au,aw,eo,hau,ho,hô,o,oa,oe,oen,oho,oo,ow,u,ü,oi
ɔ̃:hon,om,omb,ombs,omp,omps,ompt,ompts,oms,on,onc,ond,onds,ong,ongs,ons,ont,onts,oncs
p:p,pe,pent,pes,pp,ppe,ppent,ppes,ps,b,‿
......@@ -47,5 +47,5 @@ ks:x,xe,xes,xent,xc
ɡz:x
ɥi:u
ts:ts,t
ɲ:gn,gne,gnent,gnes,gni,ñ,ign,ni
ɲ:gn,gne,gnent,gnes,gni,ñ
wɑ:oix,ois,oids
\ No newline at end of file
er : a˞, ɤ˞ *** si
i : ɨ *** seulement avec les initiales <zh> <ch> <sh> <s>
eng : oŋ, ɤŋ *** seulement avec les initiales <b> <p> <m> <f>
weng : woŋ, wɤŋ *** seulement avec les initiales <b> <p> <m> <f>
uan : ɥɛn, ɥɛn *** seulement avec les initiales <j> <q> <x>
un : ɥyn, yn *** seulement avec les initiales <j> <q> <x>
a : a
i : i
o : wo
e : ɯɤ, ɤ
er : ɤ˞
ai : aj
ei : ɛj, ej
ao : aw
ou : ow
an : an
en : ɤn
un : wun, wɤn
ang :
eng : ɤŋ
ong : uŋ, wuŋ, woŋ,
yi : i, ji
ia : ja
ya : ja
iao : jaw
yao : jaw
ie : ej, ɛj
ye : ej, ɛj
iu : jow, jo
you : jow, jo
in : jin, in
yin : jin, in
ing : jiŋ,
ying : jiŋ,
ian : jɛn
iang : jaŋ
iong : joŋ
wu : wu, u
ua : wa
uan : wan
wa : wa
uai : waj
wai : waj
wan : wan
uang : waŋ
wang : waŋ
weng : wɤŋ
wen : wɤn
ui : wɛj, wej
wei : wɛj, wej
uo : wo
wo : wo
ü : y
yu : ɥy, y
ue : ɥe, ɥɛ
üe : ɥe, ɥɛ
yue : ɥe, ɥɛ
yuan : ɥɛn, ɥan
b : p
p :
m : m
f : f
d : t
t :
n : n