Этот пример показывает, как с помощью программы nhrplc можно преобразовать одну или несколько html страниц, написанных в Windows 1251, в кодировку UTF-8.
Чтобы сменить кодировку, нам надо изменить значение тега
charset c
Windows-1251 на
UTF-8 и перекодировать html файлы. Программа nhrplc позволяет сделать это одной строкой:
Код: Выделить всё
nhrplc -i -s:"charset=windows-1251" -t:"charset=utf8" -cp:auto,utf8 *.htm
Эти параметры указывают программе обработать файлы *.htm, заменяя вхождение текста
charset=windows-1251 на
charset=utf8 и пересохраняя обрабатываемые файлы в кодировке UTF-8.
Вывод программы показывает, что произведена замена:
В файле можно увидеть, что строка <META HTTP-EQUIV="Content-Type" content="text/html;
charset=Windows-1251"> была заменена на <META HTTP-EQUIV="Content-Type" content="text/html;
charset=utf8">, а кодировка файла сменилась на UTF-8, т.е. получили то, что и требовалось.