Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » Кодировка текста

Ответить
Настройки темы
Кодировка текста

Ветеран


Сообщения: 596
Благодарности: 6


Конфигурация

Профиль | Отправить PM | Цитировать


Не могу понять в какой кодировке текст. Все декодере перерыл так и не понял. Текст выглядит во так: CØEÅATÓ B ÚÝCT¾HH¾X PEÕÜOHAX Ü ÁEÒ ÜCÚOÅÓÒOBAHÜ¥ CÚEÇÜAÅÓH¾X
Это русский текст в текстовом файле локализации игры, но в самой игре он отображается русским шрифтом.

Отправлено: 21:02, 03-08-2017

 

Ветеран


Сообщения: 3806
Благодарности: 824

Профиль | Отправить PM | Цитировать


такие вещи надо в бинарном виде выклыдывать

зачастую, локализаторам не получается использовать стандартные кодировки, т.к. часть необходимых кодов символов уже занята какими-либо спецсимволами
Это сообщение посчитали полезным следующие участники:

Отправлено: 21:27, 03-08-2017 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.

mwz mwz вне форума

Аватара для mwz

Ушел из жизни


Сообщения: 8595
Благодарности: 2127

Профиль | Сайт | Отправить PM | Цитировать


8Toxa8, очень похоже на не-юникодовый шрифт, символы которого, лежащие в верхней половине кодовой таблицы, в игре интерпретируются как кириллические (так, как это делалось в Win-3.1 и Win95/98).

Но точнее можно было бы сказать если бы вы последовали рекомендации Busla, выложив этот текст в виде тех кодов, которыми он представлен в файле..

-------
Mikhail Zhilin

Это сообщение посчитали полезным следующие участники:

Отправлено: 21:40, 03-08-2017 | #3


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Цитата Busla:
такие вещи надо в бинарном виде выклыдывать »
Цитата mwz:
выложив этот текст в виде тех кодов, которыми он представлен в файле.. »

8Toxa8, перевожу на русский : упакуйте файл:
Цитата 8Toxa8:
в текстовом файле локализации »
в архив и приложите к сообщению, либо выложите на RGhost или Яндекс.Диск.
Это сообщение посчитали полезным следующие участники:

Отправлено: 22:42, 03-08-2017 | #4


Ветеран


Сообщения: 1142
Благодарности: 267

Профиль | Отправить PM | Цитировать


Могли просто при записи текста на бит сдвинуть или прибавить\вычесть (символы - они тоже числа) - для защиты

Отправлено: 06:09, 04-08-2017 | #5


Ветеран


Сообщения: 596
Благодарности: 6

Профиль | Отправить PM | Цитировать


Вот сам файл:

Последний раз редактировалось 8Toxa8, 19-05-2018 в 01:13.


Отправлено: 18:38, 04-08-2017 | #6

mwz mwz вне форума

Аватара для mwz

Ушел из жизни


Сообщения: 8595
Благодарности: 2127

Профиль | Сайт | Отправить PM | Цитировать


8Toxa8, примерно что я предполагал — но веселее: не однобайтная, как я думал, а
— двухбайтная кодировка с использованием 00 вместо 04 для русского (т.е. вроде как чистая латиница),
— для представления русских букв, имеющих аналоги по начертанию в латинице, использована латиница,
— для остальных использована доморощенная перекодировка (видимо чтобы не перехлестнуться с символами, используемыми в других местах — как и предположил Busla).

Исходник и результат на скриншоте.

Сдуру сквозную замену проводил в шестнадцатеричном режиме, шестнадцатеричных кодов на ANSI-коды заглавных русских букв: в HEX-редакторе проще было сквозной заменой символа на символ; при замене был невнимателен и вместо З получил Ц (при том, что истинную Ц подставил правильно), а вместо У — мягкий знак (Ь) при том, что сам мягкий знак сделал правильно. Исправлять не стал: идея и так ясна.



PS
Не примазываюсь к чужой славе: использован метод Ш.Холмса из рассказа А.Конан-Дойла "Пляшущие человечки" — при том, что исходной полезной информации здесь было, мягко говоря, гораздо больше, чем в первоисточнике.

-------
Mikhail Zhilin


Последний раз редактировалось mwz, 04-08-2017 в 22:12.

Это сообщение посчитали полезным следующие участники:

Отправлено: 22:01, 04-08-2017 | #7


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Цитата mwz:
не однобайтная, как я думал, а
— двухбайтная кодировка »
Добавлю для 8Toxa8, что файл в кодировке юникод (UTF-16 LE/1200) с BOM. Хотя меня и терзают сомнения, что это сам коллега 8Toxa8 сделал его таким, а оригинальный файл не юникод.

Цитата mwz:
— для представления русских букв, имеющих аналоги по начертанию в латинице, использована латиница,
— для остальных использована доморощенная перекодировка (видимо чтобы не перехлестнуться с символами, используемыми в других местах — как и предположил Busla). »
Вот давно такого не видел, со времён DOS. Словно окунулся в старые славные времена .

8Toxa8, а что за игра?
Это сообщение посчитали полезным следующие участники:

Отправлено: 05:14, 05-08-2017 | #8


Ветеран


Сообщения: 596
Благодарности: 6

Профиль | Отправить PM | Цитировать


Да действительно я удалил лишнее в файле чтобы по меньше весил, видимо нарушил кодировку, изначально он был ANSI. Оригинал во вложении.
Игра 7 Days to Die. Не ожидал что все окажется на столько сложно.

Последний раз редактировалось 8Toxa8, 19-05-2018 в 01:13.


Отправлено: 08:09, 05-08-2017 | #9


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


8Toxa8, вот почему я всегда и настаиваю именно на оригинальном файле и в архиве — дабы сохранить в неприкосновенности оригинальный формат, в том числе кодировку, BOM и концы строк.

Да, там оригинально. Файл в кодировке UTF-8 без BOM. На место английского засунут перевод на русский в волапюке из-за того, что оригинальный шрифт не содержит кириллицы, а другие игра не кушает. Посему используют такой подход и перерисованный шрифт.
Это сообщение посчитали полезным следующие участники:

Отправлено: 09:47, 05-08-2017 | #10



Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » Кодировка текста

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
Интернет - Кодировка текста писем у Почта Windows Live (Windows Live Mail) Valmont Windows Live (архив) 8 23-03-2013 04:41
CMD/BAT - вставка текста в *.PS (DOS кодировка) в нужную строку и столбец lexis1980 Скриптовые языки администрирования Windows 5 31-08-2012 09:00
Прочее - [решено] Кодировка текста при членстве в домене Surround Сетевые технологии 2 28-01-2010 16:23
Кодировка JCooper Вебмастеру 6 06-01-2004 12:37
Кодировка!!! kvm Вебмастеру 3 18-12-2003 02:25




 
Переход