Bug 8435: DBRev 3.13.00.038
[koha.git] / t / Charset.t
index 9919daa..7de3414 100755 (executable)
 #!/usr/bin/perl
-#
 
 use strict;
-use C4::Interface::CGI::Output;        # 
-
-use vars qw( @tests );
-use vars qw( $loaded );
+use warnings;
 
+use Test::More tests => 6;
 BEGIN {
-   @tests = (
-   [
-      'Normal HTML without meta tag',
-      sub { guesscharset($_[0]) },
-      undef,
-      <<EOF
-<title>control case</title>
-EOF
-   ], [
-      'Result of guesscharset with normal HTML with irrelevant meta tag',
-      sub { guesscharset($_[0]) },
-      undef,
-      <<EOF
-<meta http-equiv="Content-Language" content="zh-TW">
-EOF
-   ], [
-      'Result of guesstype with normal HTML with irrelevant meta tag',
-      sub { guesstype($_[0]) },
-      'text/html',
-      <<EOF
-<meta http-equiv="Content-Language" content="zh-TW">
-EOF
-   ], [
-      'Result of guesscharset with normal HTML with relevant meta tag',
-      sub { guesscharset($_[0]) },
-      'big5',
-      <<EOF
-<meta http-equiv="Content-Type" content="text/html; charset=big5">
-EOF
-   ], [
-      'Result of guesstype with normal HTML with relevant meta tag',
-      sub { guesstype($_[0]) },
-      'text/html; charset=big5',
-      <<EOF
-<meta http-equiv="Content-Type" content="text/html; charset=big5">
-EOF
-   ], [
-      'Variant 1 using single quotes',
-      sub { guesstype($_[0]) },
-      'text/html; charset=iso-2022-jp',
-      <<EOF
-<meta http-equiv="Content-Type" content='text/html; charset=iso-2022-jp'>
-EOF
-   ], [
-      'Variant 2 using single quotes',
-      sub { guesstype($_[0]) },
-      'text/html; charset=utf-8',
-      <<EOF
-<meta http-equiv='Content-Type' content="text/html; charset=utf-8">
-EOF
-   ], [
-      'Unquoted Content-Type',
-      sub { guesstype($_[0]) },
-      'text/html; charset=big5',
-      <<EOF
-<meta http-equiv=Content-Type content="text/html; charset=big5">
-EOF
-   ], [
-      'XML syntax',
-      sub { guesstype($_[0]) },
-      'text/html; charset=iso-8859-2',
-      <<EOF
-<meta http-equiv=Content-Type content="text/html; charset=iso-8859-2" />
-EOF
-   ], [
-      'Expected attributes in reverse order',
-      sub { guesstype($_[0]) },
-      'text/html; charset=big5',
-      <<EOF
-<meta content="text/html; charset=big5" http-equiv="Content-Type">
-EOF
-   ], [
-      'Extra whitespace at end',
-      sub { guesstype($_[0]) },
-      'text/html; charset=big5',
-      <<EOF
-<meta http-equiv="Content-Type" content="text/html; charset=big5"   >
-EOF
-   ], [
-      'Multiple lines',
-      sub { guesstype($_[0]) },
-      'text/html; charset=big5',
-      <<EOF
-<meta
-http-equiv="Content-Type"
-content="text/html; charset=big5"
->
-EOF
-   ], [
-      # FIXME - THIS IS NOT A WELL-WRITTEN TEST CASE!!!
-      'With surrounding HTML',
-      sub { guesstype($_[0]) },
-      'text/html; charset=us-ascii',
-      <<EOF
-<html>
-<head>
-<title>Test case with surrounding HTML</title>
-<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
-</head>
-<body>
-The return value should not be contaiminated with any surround HTML
-FIXME: Auth.pm returns in code that can contaminate the charset
-FIXME: if we do not explicitly disallow whitespace in the charset
-</body>
-</html>
-EOF
-   ],
-);
-}
-
-BEGIN { $| = 1; printf "1..%d\n", scalar(@tests); }
-END {print "not ok 1\n" unless $loaded;}
-$loaded = 1;
-
-
-# Run all tests in sequence
-for (my $i = 1; $i <= scalar @tests; $i += 1) {
-   my $test = $tests[$i - 1];
-   my($title, $f, $expected, $input) = @$test;
-   die "not ok $i (malformed test case)\n"
-      unless @$test == 4 && ref $f eq 'CODE';
-
-   my $output = &$f($input);
-   if (
-        (!defined $output && !defined $expected)
-      || (defined $output && defined $expected && $output eq $expected)
-   ) {
-      print "ok $i - $title\n";
-   } else {
-      print "not ok $i - $title: got ",
-           (defined $output? "\"$output\"": 'undef'),
-           ', expected ',
-           (defined $expected? "\"$expected\"": 'undef'),
-           "\n";
-   }
+    use_ok('C4::Charset');
 }
 
+my $octets = "abc";
+ok(IsStringUTF8ish($octets), "verify octets are valid UTF-8 (ASCII)");
 
+$octets = "flamb\c3\a9";
+ok(!utf8::is_utf8($octets), "verify that string does not have Perl UTF-8 flag on");
+ok(IsStringUTF8ish($octets), "verify octets are valid UTF-8 (LATIN SMALL LETTER E WITH ACUTE)");
+ok(!utf8::is_utf8($octets), "verify that IsStringUTF8ish does not magically turn Perl UTF-8 flag on");
 
-
-
+$octets = "a\xc2" . "c";
+ok(!IsStringUTF8ish($octets), "verify octets are not valid UTF-8");