Автоматическая транскрипция с русского на китайский

Транскрипция основана на таблицах, составленных для переводчиков-китаистов. За основу была взята таблица, размещенная в одном из изданных в Китае русско-китайских словарей

Также ее можно скачать с нашего сайта. Основные замены последовательностей русских символов на китайские создавались комбинацией всех начал слогов с их окончаниями. Иероглифы в круглых скобках не использовались. В таблице замен получилось 1192 замены. Приводить их здесь пока не буду. Когда доделаю вывод таблиц транскрипции прямо из базы, тогда и добавлю ссылку на нее.

Примечания к таблице транскрипции:

Буква м перед б и п транскрибируется как н

В исходной таблице нет ни одного окончания на м, значит перед б и п онавстретится нам только как отдельная буква, а не в составе предыдущего слога.

Добавляем замены для слогов начинающихся с б и п:

мб - 恩布
мба - 恩把
мбя - 恩比亚
мбэ - 恩贝
мбэй - 恩贝
...и так далее, и тому подобное до...
мбонь - 恩邦
мбун - 恩本
мбунь - 恩本

Всего 39 замен

Добавляем замены для слогов начинающихся с п:

мп - 恩普
мпа - 恩帕
мпя - 恩皮亚
мпэ - 恩佩
...и так далее, и тому подобное до...
мпонь - 恩逢
мпун - 恩逢
мпунь - 恩逢

Тоже 39 замен

В сочетании согласных чт согласный ч читается как ш и транскрибируется иероглифом 什

Добавляем пары сочетаний начинающихся с чт:

чт - 什特
чта - 什塔
чтя - 什佳
чтэ - 什泰
чтэй - 什泰
чте - 什捷
чты - 什特
чтый - 什特
...и так далее, и тому подобное до...
чтун - 什通
чтунь - 什通
чтюн - 什琼
чтюнь - 什琼

Всего 41 замена

В сочетании согласных гк согласный г читается как х и транскрибируется иероглифом 赫

Добавляем пары

гк - 赫克
гка - 赫卡
гкя - 赫基亚
гкэ - 赫凯
гкэй - 赫凯
...и так далее, и тому подобное до...
гконь - 赫孔
гкун - 赫昆
гкунь - 赫昆
гкюн - 赫穹
гкюнь - 赫穹

Всего 41 пара

Сочетания -ей- и -ой- транскрибируются по таблице как е и о с добавлени-
ем иероглифа 伊.

Добавляем пару, которая также восполнит отсутствие в таблице и пояснениях ёй, юй, яй и самого й.

й – 伊

В словах, начинающихся с р или л, за которыми следует согласный, начальные согласные транскрибируются иероглифом 勒

Пока у меня нет простой возможности добавить это в алгоритм не переписав с буквами р и л по половине таблицы.

Иероглифы специфичные для начала и окончания географических названий.

 

Работа над алгоритмом продолжается... Текущий вариант его работы