![]() |
стандарт на транслитерацию
вот когда пишешь русские слова лат. буквами, все делают это собсно по разному, по своему.
Где найти хоть какой-то стандарт на это. Заранее спбо! |
например, KOI8-R. пишем по-русски, отрезаем 8 бит каждого байта, получаем транслит.
|
>>>отрезаем 8 бит каждого байта
Как это так??? Байт же состоит из 8 бит. Может не от одного байта?? Или как? |
vadimiron, koi-8 - НЕ однобайтная кодировка ;)
ihc, хорошо, а как быть с "ж", "щ", "ш"? Lad Jack, а на кой ляд тебе стандарт? Если кто-то пишет так, что ты его\её не понимаешь - скажи ему/ей об этом.. Если хочешь набирать на транслите - поставь KeyboardNinja ( http://www.intelife.net/ninja ) - кроме автоматического переключения раскладки, он умеет ещё и параллельно со вводом на русском набивать в транслите(сразу при вводе - используем русские подписи кнопок, а набирается в транслите)... А вообще-то, транслит - это костыль... А костыль должен быть не стандартным, а удобным :) Если это был просто информационный вопрос - извини, что информации мало ;) |
Новичёк
KOI-8 всё-таки однобайтная кодировка. Цифра 8 как раз говорит об использовании 8 бит, в отличие от KOI-7, где кодировка 7-ми битовая, но опять же однобайтная. Можно посмотреть http://koi8.pp.ru :) |
Lad Jack
Если говорить именно о принятых стандартах, то имеем следующее: 1) Приложение №6 к "Инструкции о порядке оформления и выдачи паспортов гражданам Российской Федерации". Полные реквизиты: Цитата:
Главный минус - данная транслитерация не 100% обратима. 2) ГОСТ 7.79-2000 (ИСО 9-95) Группа Т62. "Правила транслитерации кирилловского письма латинским алфавитом". В нем кроме русского приведены правила для Азербайджана, Армении, Беларуссии, Узбекистана и др.). Включает две системы транслитерации: а) с использованием диакритики (т.е. символов со всякими точечками и палочками сверху). Является строгой, задает единое отображение расширенного кирилловского алфавита на расширенный латинский алфавит (1 символ кирилицы = 1 символ латиницы). б)Транслитерация с использованием буквосочетаний. Является ослабленной транслитерацией, задает для каждой кирилловской буквы представление в виде одной буквы основного (ограниченного) латинского алфавита (в него входит так же и апостроф) или в виде такого сочетания букв, к-ое не может встретиться в тексте иначе чем при представлении данной буквы. Обе системы данного стандарта 100% обратимы. К сожаление данного ГОСТа в инете так найти и не удалось...:( Все просят деньги, что, мягко-говоря, для подобного рода стандарта выглядит странным, что он не опубликован в открытом доступе. Со временем таки удалось достать экземпляр, т.ч. если кому надо, то могу и отсканить основное (а может и весь потихоньку), да куда-нить выложить (вот тока время появеться свободное...). |
THNX 2 All
|
shurikan, елы-палы :( Я с unicode перепутал. Простите дурака :(
|
Время: 18:59. |
Время: 18:59.
© OSzone.net 2001-