Войти

Показать полную графическую версию : ANSI<->ASCII


akrav
09-01-2008, 16:46
Подскажите, пожалуйста, как можно командной строкой конвертировать текстовой файл из dos кодировки в windows?

hasherfrog
11-01-2008, 13:56
UPDATE: решение найдено, см. ниже.
К сожалению, командной строкой я не смог. Никак*. Проблема в том, что даже смена кодовой страницы (командами mode con cp select=XXX или chcp XXX) не может повлиять на результаты команд type или echo**, поскольку они внутри себя явно заточены на использование дефолтной 866-й страницы (и весь вывод пропускают через CharToOem()-функцию). Это можете проверить, можете поверить на слово.

Вариантами решения могут быть:
1. Использование сторонних перекодировщиков (я использовал recode), есть масса других консольных утилит.
2. Написание своего перекодировщика (см. тут (http://forum.oszone.net/archive/index.php/t-84655.html) что-то вроде образца).

___
* В принципе, может кто и сможет это сделать. Но тогда как объяснить вот такое поведение cmd.exe:
Microsoft Windows XP [Версия 5.1.2600]
(С) Корпорация Майкрософт, 1985-2001.

C:\Documents and Settings\hasherfrog>chcp 866
Текущая кодовая страница: 866

C:\Documents and Settings\hasherfrog>echo йцукен > 1.txt

C:\Documents and Settings\hasherfrog>chcp 1251
╥хъє∙р ъюфютр ёЄЁрэшЎр: 1251

C:\Documents and Settings\hasherfrog>type 1.txt
йцукен <- ??? должны быть кракозябли

C:\Documents and Settings\hasherfrog>for /f %i in (1.txt) do echo %i

C:\Documents and Settings\hasherfrog>echo йцукен
йцукен <- ???


__
** Сначала я ляпнул про echo, но вообще-то она тут не при чём, конечно (ей что дали, то она и вывела). Другое дело, что её использовать тоже не получится. Пример:
Файл 1.bat, кодировка ДОСа:chcp 1251
@echo йцукен
chcp 866
@echo йцукен
Результат выполнения:
C:\Documents and Settings\hasherfrog>1.bat

C:\Documents and Settings\hasherfrog>chcp 1251
╥хъє∙р ъюфютр ёЄЁрэшЎр: 1251
йцукен

C:\Documents and Settings\hasherfrog>chcp 866
Текущая кодовая страница: 866
йцукен

ven00m
11-01-2008, 22:05
Неуверен но можт так:

text.bat
type text1.txt>>text2.txt
run.bat
cmd.exe /u /c text.bat

Если запустить run то

Получается на входе text1.txt:
йцукен
На выходе text2.txt:
щЎєъхэ

если надо наоборот то вместо /u написать /a

hasherfrog
14-01-2008, 11:57
ven00m, не совсем так (/u даст юникод, а не window-кодировку), но идея правильная.

Решение вот такое, текст файла typea.bat
@if "%1"=="" goto error
@if "%2"=="" goto error
@if not exist %2 goto error

@if "%1"=="/a" (
@chcp 866 >nul
@goto print
)
@if "%1"=="/w" (
@chcp 1251 >nul
@goto print
)
@goto error

:print
@type %2 >> ___tmptxt
@type ___tmptxt
@del ___tmptxt
@chcp 866 >nul
@goto exithere

:error
@echo Usage:
@echo typea /a filename.txt - Print filename.txt as dos-866
@echo typea /w filename.txt - Print filename.txt as win-1251

:exithere

akrav
14-01-2008, 13:35
Спасибо, hasherfrog!
только вот что-то под xp не работает из дос в win кодировку. перенаправил вывод в файл, а он как был, так и остался...

hasherfrog
15-01-2008, 14:50
akrav, вот с перенаправлением нужно подумать. Вы обратите внимание на код. Мне кажется, в виде конвейера или перенаправления не получится использовать отдельный (приведённый выше) батник, вместо этого Вам надо его код переделать (встроиться туда, где @type ___tmptxt).

akrav
16-01-2008, 11:22
Очень интересно! Однако пока с полезным результатом напряженка. Ни туда, ни обратно конвертации не происходит, что можно пронаблюдать в файле ___tmptxt, который насколько я понял создается перенаправление вывода.




© OSzone.net 2001-2012