1e8ffcfe51935f7dabc49869ea6cba94ba53c671
[webpac2] / scripts / aleph2iso.pl
1 #!/usr/bin/perl
2 use warnings;
3 use strict;
4 use autodie;
5 use MARC::Record;
6 use Encode;
7 use Data::Dump qw(dump);
8
9 my $source = shift @ARGV || die "usage: $0 file.m21\n";
10 my $dest = $source;
11 $dest .= '.iso';
12
13 close(STDERR) unless $ENV{DEBUG};
14
15 open(my $m21, '<', $source);
16 open(my $out, '>:encoding(utf-8)', $dest);
17
18 warn "# convert $source => $dest\n";
19
20 my $last_id;
21 my @fields;
22 my $marc;
23
24 sub new_marc {
25         $marc = new MARC::Record;
26         $marc->encoding('utf-8');
27         return $marc;
28 }
29
30 $marc = new_marc();
31
32 while (<$m21>) {
33         chomp;
34         s/\xC2\x98/<</g;
35         s/\xC2\x9C/>>/g;
36         my ( $id, $rest ) = split(/\s/, $_, 2);
37         my ( $fffii, $sf ) = split(/\s+L\s+/,$rest,2);
38
39         warn "## ",dump( $id, $fffii, $sf );
40
41         $last_id = $id if ! defined $last_id;
42         if ( $id != $last_id ) {
43                 print $out $marc->as_usmarc;
44                 print "XXX $id\n";
45                 print $marc->as_formatted();
46                 print "\n";
47                 $marc = new_marc();
48                 $last_id = $id;
49         }
50
51         if ( $fffii eq 'LDR' ) {
52                 $sf =~ s/\^/ /g;
53                 $marc->leader( $sf );
54         } elsif ( $fffii =~ m/^00/ ) {
55                 warn "# $id clean $fffii" if $fffii =~ s/[a-z]//g;
56                 my $field = MARC::Field->new( $fffii, $sf );
57                 $marc->append_fields( $field );
58         } else {
59                 my $f = $1 if $fffii =~ s/^(...)//;
60                 my $i1 = $1 if $fffii =~ s/^(.)//;
61                 my $i2 = $1 if $fffii =~ s/^(.)//;
62                 $i1 ||= ' ';
63                 $i2 ||= ' ';
64
65                 warn "# $id $fffii -> ", dump($f,$i1,$i2), " [$sf]\n";
66
67                 my @f = ( $f, $i1, $i2 );
68
69                 while ( $sf =~ s/^\$\$(\w)([^\$]+)// ) {
70                         push @f, $1, decode('iso-8859-1', $2);
71                 }
72                 warn "### ",dump( @f );
73                 my $field;
74 again:
75                 eval { $field = MARC::Field->new( @f ) };
76                 if ( $@ ) {
77                         if ( $@ =~ m/must have indicators/ ) {
78                                 push @f, ' ', ' ';
79                                 goto again;
80                         }
81                         die $@;
82                 }
83                 $marc->append_fields( $field );
84         }
85 }
86         
87