PDA

Показать полную графическую версию : проверка кодировки текстовых файлов


shmel_sv@vk
21-10-2014, 12:41
Доброго времени суток
Появилась нужда в проверке кодировки текстовых файлов. Тоесть есть куча текстовых файлов. Нужно создавать отсчет в какой кодировке каждый файл
Спасибо

Iska
21-10-2014, 13:19
В ряде случаев — никак нельзя определить.

Нужно создавать отсчет в какой кодировке каждый файл »
Чем вызвана именно такая задача?

shmel_sv@vk
21-10-2014, 14:55
есть куча тхт файлов (и они прибавляются) которые комбинирую в один большой тхт
иногда попадаются инные кодировки и оно либо не комбинирует в один тхт либо делает это неправильно

Iska
21-10-2014, 15:23
Тогда только «ручками». Даже детектор Far Manager'а нет-нет да и ошибается.

Georgio
21-10-2014, 15:40
shmel_sv@vk, перечислите все кодировки этих текстовых файлов.


Даже детектор Far Manager'а нет-нет да и ошибается. »

И другие программы также могут ошибаться. Думаю, что алгоритм определения кодировок построен на частоте встречаемости характерных символов в тексте.

Iska
21-10-2014, 16:11
Думаю, что алгоритм определения кодировок построен на частоте встречаемости характерных символов в тексте. »
Угу. Код Far Manager'а открыт, желающие могут использовать тамошний алгоритм.

shmel_sv@vk
21-10-2014, 19:13
Georgio, ну мне важно чтоб все кодировки были ansi. в основном так. но попадаются кирилические. поэтому батник иногда не справляется

Iska
21-10-2014, 20:19
чтоб все кодировки были ansi »
ANSI много. В том числе и кириллическая ANSI-1251. Потому Вас и просят перечислить их. Если затрудняетесь — выложите по нескольку штук во всех кодировках, упаковав их в архив, и укажите целевую кодировку.

yurfed
21-10-2014, 20:46
поэтому батник иногда не справляется »Примерчик вашего Батника, плиз.
Только точно задачу нарисуйте.




© OSzone.net 2001-2012