Показать полную графическую версию : проверка кодировки текстовых файлов
shmel_sv@vk
21-10-2014, 12:41
Доброго времени суток
Появилась нужда в проверке кодировки текстовых файлов. Тоесть есть куча текстовых файлов. Нужно создавать отсчет в какой кодировке каждый файл
Спасибо
В ряде случаев — никак нельзя определить.
Нужно создавать отсчет в какой кодировке каждый файл »
Чем вызвана именно такая задача?
shmel_sv@vk
21-10-2014, 14:55
есть куча тхт файлов (и они прибавляются) которые комбинирую в один большой тхт
иногда попадаются инные кодировки и оно либо не комбинирует в один тхт либо делает это неправильно
Тогда только «ручками». Даже детектор Far Manager'а нет-нет да и ошибается.
shmel_sv@vk, перечислите все кодировки этих текстовых файлов.
Даже детектор Far Manager'а нет-нет да и ошибается. »
И другие программы также могут ошибаться. Думаю, что алгоритм определения кодировок построен на частоте встречаемости характерных символов в тексте.
Думаю, что алгоритм определения кодировок построен на частоте встречаемости характерных символов в тексте. »
Угу. Код Far Manager'а открыт, желающие могут использовать тамошний алгоритм.
shmel_sv@vk
21-10-2014, 19:13
Georgio, ну мне важно чтоб все кодировки были ansi. в основном так. но попадаются кирилические. поэтому батник иногда не справляется
чтоб все кодировки были ansi »
ANSI много. В том числе и кириллическая ANSI-1251. Потому Вас и просят перечислить их. Если затрудняетесь — выложите по нескольку штук во всех кодировках, упаковав их в архив, и укажите целевую кодировку.
поэтому батник иногда не справляется »Примерчик вашего Батника, плиз.
Только точно задачу нарисуйте.
© OSzone.net 2001-2012
vBulletin v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.