eprints-dev: /home/dpavlin/mtoolkit/utf8-fix.pl [commit]
authorDobrica Pavlinusic <dpavlin@rot13.org>
Tue, 19 Oct 2010 00:20:03 +0000 (02:20 +0200)
committerDobrica Pavlinusic <dpavlin@rot13.org>
Tue, 19 Oct 2010 00:20:03 +0000 (02:20 +0200)
mtoolkit/utf8-fix.pl

index f78aa3c..3946bcd 100755 (executable)
@@ -64,6 +64,8 @@ s/$junk\xC2\xAD/-/gs && $stat->{'-'}++;
 s/$junk\xC2\x80\xC2\x9C/-/gs && $stat->{'--'}++;
 s/$junk\xC2\x9D/-/gs && $stat->{'-- ?'}++;
 
+s/$junk\xC3\x82\xC2\xA2/- /gs && $stat->{'dot'}++;
+
 
        my $e = $_;
        if ( $e =~ m/([\xC0-\xC4][\x80-\xff]{4,8})/s ) {