Перекодировка из Win в UCS-2 на Perl'e
В первой строчке цикла происходит замены буквы Ё,
во второй - ё, в третьей - латинские буквы и символы оставляются
на нулевой странице UCS-2, в четвертой - меняются кириллические символы.
Perl
В примере $text - исходный текст в кодировке windows-1251,
$ucs - получаемый текст в кодировке UCS-2.
my $ucs='';
foreach $byte (split //, $text) {
if (ord($byte) == 168) {$ucs="$ucs\4\1"}
elsif (ord($byte) == 184) {$ucs="$ucs\4\121"}
elsif (ord($byte) <= 176) {$ucs="$ucs\0$byte"}
else {$ucs="$ucs\4".chr(ord($byte)-176)}
}
|
|