Поддержка различных кодовых страниц в NHRPLC

Обсуждение программы nhrt - замена текста в файлах (прежнее название nhrplc)
Закрыто
nhutils
Сообщения: 595
Зарегистрирован: 09 дек 2009, 18:08
Контактная информация:

Поддержка различных кодовых страниц в NHRPLC

Сообщение nhutils »

Начиная с NHRPLC v2.3 поддерживаются не только активные на компьютере кодировки (ANSI и OEM), но и любые кодировки, которые можно задать числом. Следующий пример показывает, как на компьютере с русскими настройками (ANSI 1251 и OEM 866) прочитать файл в кодировке 1252 - западно-европейские символы, например, французский язык, немецкий, шведский и т.д.).
Возьмём, например, файл README_fr.txt на французском языке в однобайтной кодировке 1252. В текстовом редакторе при активной кодировке ANSI 1251 все специальные символы французского языка будут заменены на русские:

Код: Выделить всё

Dictionnaire orthographique du franзais comportant les nouvelles et les
anciennes graphies des mots concernйs par les rectifications de l'orthographe
proposйes en 1990 par le Conseil supйrieur а la langue franзaise et
par l'Acadйmie franзaise.
Программа NHRPLC поможет преобразовать файл к читаемому виду, для этого необходимо сменить кодировку с 1252 на, например, UTF-8:

Код: Выделить всё

nhrplc -cp:1252,utf8 README_fr.txt
В результате получаем файл в кодировке UTF-8 с корректным текстом:

Код: Выделить всё

Dictionnaire orthographique du français comportant les nouvelles et les
anciennes graphies des mots concernés par les rectifications de l'orthographe
proposées en 1990 par le Conseil supérieur à la langue française et
par l'Académie française.
В приложенном ZIP находятся исходные TXT файлы и примеры командных файлов преобразования в UTF-8 и Unicode. Просматривать TXT файлы лучше программами Notepad++ http://notepad-plus-plus.org/ или FAR Manager http://www.farmanager.com/
Вложения
CodePageSample.zip
(3.53 КБ) 515 скачиваний
Закрыто