don't emit STDERR output without DEBUG envirment variable
[webpac2] / scripts / aleph2iso.pl
1 #!/usr/bin/perl
2 use warnings;
3 use strict;
4 use autodie;
5 use MARC::Record;
6 use Encode;
7 use Data::Dump qw(dump);
8
9 my $source = shift @ARGV || die "usage: $0 file.m21\n";
10 my $dest = $source;
11 $dest .= '.iso';
12
13 close(STDERR) unless $ENV{DEBUG};
14
15 open(my $m21, '<', $source);
16 open(my $out, '>:encoding(utf-8)', $dest);
17
18 warn "# convert $source => $dest\n";
19
20 my $last_id;
21 my @fields;
22 my $marc;
23
24 sub new_marc {
25         $marc = new MARC::Record;
26         $marc->encoding('utf-8');
27         return $marc;
28 }
29
30 $marc = new_marc();
31
32 while (<$m21>) {
33         chomp;
34         my ( $id, $rest ) = split(/\s/, $_, 2);
35         my ( $fffii, $sf ) = split(/\s+L\s+/,$rest,2);
36
37         warn "## ",dump( $id, $fffii, $sf );
38
39         $last_id = $id if ! defined $last_id;
40         if ( $id != $last_id ) {
41                 print $out $marc->as_usmarc;
42                 print "XXX $id\n";
43                 print $marc->as_formatted();
44                 print "\n";
45                 $marc = new_marc();
46                 $last_id = $id;
47         }
48
49         if ( $fffii eq 'LDR' ) {
50                 $sf =~ s/\^/ /g;
51                 $marc->leader( $sf );
52         } elsif ( $fffii =~ m/^00/ ) {
53                 warn "# $id clean $fffii" if $fffii =~ s/[a-z]//g;
54                 my $field = MARC::Field->new( $fffii, $sf );
55                 $marc->append_fields( $field );
56         } else {
57                 my $f = $1 if $fffii =~ s/^(...)//;
58                 my $i1 = $1 if $fffii =~ s/^(.)//;
59                 my $i2 = $1 if $fffii =~ s/^(.)//;
60                 $i1 ||= ' ';
61                 $i2 ||= ' ';
62
63                 warn "# $id $fffii -> ", dump($f,$i1,$i2), " [$sf]\n";
64
65                 my @f = ( $f, $i1, $i2 );
66
67                 while ( $sf =~ s/^\$\$(\w)([^\$]+)// ) {
68                         push @f, $1, decode('iso-8859-1', $2);
69                 }
70                 warn "### ",dump( @f );
71                 my $field;
72 again:
73                 eval { $field = MARC::Field->new( @f ) };
74                 if ( $@ ) {
75                         if ( $@ =~ m/must have indicators/ ) {
76                                 push @f, ' ', ' ';
77                                 goto again;
78                         }
79                         die $@;
80                 }
81                 $marc->append_fields( $field );
82         }
83 }
84         
85