Автоматическая транскрипция с русского на китайский
Опубликовано admin в Сб, 17/01/2009 - 11:13
Транскрипция основана на таблицах, составленных для переводчиков-китаистов. За основу была взята таблица, размещенная в одном из изданных в Китае русско-китайских словарей
Также ее можно скачать с нашего сайта. Основные замены последовательностей русских символов на китайские создавались комбинацией всех начал слогов с их окончаниями. Иероглифы в круглых скобках не использовались. В таблице замен получилось 1192 замены. Приводить их здесь пока не буду. Когда доделаю вывод таблиц транскрипции прямо из базы, тогда и добавлю ссылку на нее.
Примечания к таблице транскрипции:
Буква м перед б и п транскрибируется как н
В исходной таблице нет ни одного окончания на м, значит перед б и п онавстретится нам только как отдельная буква, а не в составе предыдущего слога.
Добавляем замены для слогов начинающихся с б и п:
мб - 恩布
мба - 恩把
мбя - 恩比亚
мбэ - 恩贝
мбэй - 恩贝
...и так далее, и тому подобное до...
мбонь - 恩邦
мбун - 恩本
мбунь - 恩本
Всего 39 замен
Добавляем замены для слогов начинающихся с п:
мп - 恩普
мпа - 恩帕
мпя - 恩皮亚
мпэ - 恩佩
...и так далее, и тому подобное до...
мпонь - 恩逢
мпун - 恩逢
мпунь - 恩逢
Тоже 39 замен
В сочетании согласных чт согласный ч читается как ш и транскрибируется иероглифом 什
Добавляем пары сочетаний начинающихся с чт:
чт - 什特
чта - 什塔
чтя - 什佳
чтэ - 什泰
чтэй - 什泰
чте - 什捷
чты - 什特
чтый - 什特
...и так далее, и тому подобное до...
чтун - 什通
чтунь - 什通
чтюн - 什琼
чтюнь - 什琼
Всего 41 замена
В сочетании согласных гк согласный г читается как х и транскрибируется иероглифом 赫
Добавляем пары
гк - 赫克
гка - 赫卡
гкя - 赫基亚
гкэ - 赫凯
гкэй - 赫凯
...и так далее, и тому подобное до...
гконь - 赫孔
гкун - 赫昆
гкунь - 赫昆
гкюн - 赫穹
гкюнь - 赫穹
Всего 41 пара
Сочетания -ей- и -ой- транскрибируются по таблице как е и о с добавлени-
ем иероглифа 伊.
Добавляем пару, которая также восполнит отсутствие в таблице и пояснениях ёй, юй, яй и самого й.
й – 伊
В словах, начинающихся с р или л, за которыми следует согласный, начальные согласные транскрибируются иероглифом 勒
Пока у меня нет простой возможности добавить это в алгоритм не переписав с буквами р и л по половине таблицы.
Иероглифы специфичные для начала и окончания географических названий.
Работа над алгоритмом продолжается... Текущий вариант его работы
