eprints-dev: /home/dpavlin/mtoolkit/utf8-fix.pl [commit]
[eprints3-migration.git] / mtoolkit / utf8-fix.pl
index 2cb5a1b..0ab25f5 100755 (executable)
@@ -33,6 +33,8 @@ s/\xC3\x83\xC2\x83\xC3\xA2\xC2\x80\xC2\x99/V/gs && $stat->{'V fake'}++;
 s/\xC3\x83\xC2\x83\xC3\x85\xC2\xB8/ß/gs && $stat->{'ss'}++;
 
 s/$junk\xC3\x82\xC2\x8D/č/gs && $stat->{'cv'}++;
+s/\xC3\x84\xC2\x8D/č/gs && $stat->{'cv 84'}++;
+
 s/$junk\xC2\x80\xC2\xA1/ć/gs && $stat->{"c"}++;
 # #Buri\xC3\x84\xC2\x87.pdf
 s/\xC3\x84\xC2\x87/ć/gs && $stat->{'c C384C287'}++;
@@ -51,8 +53,10 @@ s/$junk\xC2\x80\xC2\x92/Č/gs && $stat->{'Cv'}++;
 s/$junk\xC3\x85\xC2\x92/Č/gs && $stat->{'Cv C385'}++;
 s/$junk\xC2\x80\xC2\xA0/Ć/gs && $stat->{'C'}++;
 s/$junk\xC3\x82\xC2\xBD/Ž/gs && $stat->{'Z'}++;
+s/\xC3\x85\xC2\xBD/Ž/gs && $stat->{'Z'}++;
 s/$junk\xC3\x82\xC2\xA0/Š/gs && $stat->{'S'}++;
 s/$junk\xC3\x82\xC2\xA6/Š/gs && $stat->{'S C2A6'}++;
+s/\xC3\x85\xC2\xA0/Š/gs && $stat->{'S C385C2A0'}++;
 
 s/$junk\xC2\xAB/"/gs && $stat->{'" open'}++;
 s/$junk\xC2\xBB/"/gs && $stat->{'" close'}++;