stop on empty next_marc
[Biblio-Z3950.git] / GoogleBooks.pm
1 package GoogleBooks;
2
3 use warnings;
4 use strict;
5
6 use MARC::Record;
7 use Data::Dump qw/dump/;
8 use JSON::XS;
9
10 use base 'Scraper';
11
12 my $debug = $ENV{DEBUG} || 0;
13
14 sub diag {
15         warn "# ", @_, $/;
16 }
17
18 # based on http://code.google.com/apis/books/docs/v1/using.html#PerformingSearch
19 #
20 # https://www.googleapis.com/books/v1/volumes?q=search+terms
21 #
22 # This request has a single required parameter:
23 #
24 # q - Search for volumes that contain this text string. There are special keywords you can specify in the search terms to search in particular fields, such as:
25 #     intitle: Returns results where the text following this keyword is found in the title.
26 #     inauthor: Returns results where the text following this keyword is found in the author.
27 #     inpublisher: Returns results where the text following this keyword is found in the publisher.
28 #     subject: Returns results where the text following this keyword is listed in the category list of the volume.
29 #     isbn: Returns results where the text following this keyword is the ISBN number.
30 #     lccn: Returns results where the text following this keyword is the Library of Congress Control Number.
31 #     oclc: Returns results where the text following this keyword is the Online Computer Library Center number.
32 #
33
34 # Koha Z39.50 query:
35 #
36 # Bib-1 @and @and @and @and @and @and @and @or
37 # @attr 1=4 title 
38 # @attr 1=7 isbn
39 # @attr 1=8 issn 
40 # @attr 1=1003 author 
41 # @attr 1=16 dewey 
42 # @attr 1=21 subject-holding 
43 # @attr 1=12 control-no 
44 # @attr 1=1007 standard-id 
45 # @attr 1=1016 any
46
47 sub usemap {{
48         4               => 'intitle:',
49         7               => 'isbn:',
50         8               => 'isbn:', # FIXME?
51         1003    => 'inauthor:',
52 #       16              => '',
53         21              => 'subject:',
54         12              => 'lccn:',
55 #       1007    => '',
56         1016    => '',
57 }};
58
59 sub search {
60         my ( $self, $query ) = @_;
61
62         die "need query" unless defined $query;
63
64         my $url = 'https://www.googleapis.com/books/v1/volumes?q=' . $query;
65
66 diag "get $url";
67
68         my $mech = $self->{mech} || die "no mech?";
69         $mech->get( $url );
70
71         my $json = decode_json $mech->content;
72         diag "# json = ", dump($json) if $debug;
73
74         my $hits = 0;
75
76         if ( exists $json->{items} ) {
77                 $hits = $#{ $json->{items} } + 1;
78         } else {
79                 diag "get't find results in ", $mech->content;
80                 return;
81         }
82
83 diag "got $hits results, get first one";
84
85         $self->{_json} = $json;
86         $self->{_json_item} = 0;
87
88         return $self->{hits} = $hits;
89 }
90
91
92 sub next_marc {
93         my ($self,$format) = @_;
94
95         $format ||= 'marc';
96
97         my $item = $self->{_json}->{items}->[ $self->{_json_item}++ ];
98
99         warn "# item = ",dump($item) if $debug;
100
101         my $id = $item->{id} || die "no id";
102
103         my $marc = MARC::Record->new;
104         $marc->encoding('utf-8');
105
106         if ( my $vi = $item->{volumeInfo} ) {
107
108                 my ($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) = localtime(time);
109
110                 $marc->add_fields('008',sprintf("%02d%02d%02ds%04d%25s%-3s",
111                                 $year % 100, $mon + 1, $mday, substr($vi->{publishedDate},0,4), ' ', $vi->{language}));
112
113                 if ( ref $vi->{industryIdentifiers} eq 'ARRAY' ) {
114                         foreach my $i ( @{ $vi->{industryIdentifiers} } ) {
115                                 if ( $i->{type} =~ m/ISBN/i ) {
116                                         $marc->add_fields('020',' ',' ','a' => $i->{identifier} )
117                                 } else {
118                                         $marc->add_fields('035',' ',' ','a' => $i->{identifier} )
119                                 }
120                         }
121                 }
122
123                 my $first_author;
124                 if ( ref $vi->{authors} eq 'ARRAY' ) {
125                         $first_author = shift @{ $vi->{authors} };
126                         $marc->add_fields(100,'0',' ','a' => $first_author );
127                         $marc->add_fields(700,'0',' ','a' => $_ ) foreach @{ $vi->{authors} };
128                 }
129
130                 $marc->add_fields(245, ($first_author ? '1':'0') ,' ',
131                         'a' => $vi->{title},
132                         $vi->{subtitle} ? ( 'b' => $vi->{subtitle} ) : (),
133                 );
134
135                 $marc->add_fields(260,' ',' ',
136                         $vi->{publisher} ? ( 'b' => $vi->{publisher} ) : (),
137                         $vi->{publishedDate} ? ( 'c' => $vi->{publishedDate} ) : ()
138                 );
139
140                 $marc->add_fields(300,' ',' ','a' => $vi->{pageCount} . 'p.' ) if $vi->{pageCount};
141                 
142                 $marc->add_fields(520,' ',' ','a' => $vi->{description} ) if $vi->{description};
143
144                 if ( ref $vi->{categories} eq 'ARRAY' ) {
145                         $marc->add_fields(650,' ','4','a' => $_ ) foreach @{ $vi->{categories} };
146                 }
147
148                 if ( exists $vi->{imageLinks} ) {
149
150                         $marc->add_fields(856,'4','2',
151                                 '3'=> 'Image link',
152                                 'u' => $vi->{imageLinks}->{smallThumbnail},
153                                 'x' => 'smallThumbnail',
154                         ) if exists $vi->{imageLinks}->{smallThumbnail};
155                         $marc->add_fields(856,'4','2',
156                                 '3'=> 'Image link',
157                                 'u' => $vi->{imageLinks}->{thumbnail},
158                                 'x' => 'thumbnail',
159                         ) if exists $vi->{imageLinks}->{thumbnail};
160
161                 } # if imageLinks
162
163                 $marc->add_fields(856,'4','2',
164                         '3'=> 'Info link',
165                         'u' => $vi->{infoLink},
166                 );
167                 $marc->add_fields(856,'4','2',
168                         '3'=> 'Show reviews link',
169                         'u' => $vi->{showReviewsLink},
170                 );
171
172                 my $leader = $marc->leader;
173                 warn "# leader [$leader]";
174                 $leader =~ s/^(....).../$1nam/;
175                 $marc->leader( $leader );
176
177         } else {
178                 warn "ERROR: no volumeInfo in ",dump($item);
179         }
180
181         $marc->add_fields( 856, ' ', ' ', 'u' => $item->{accessInfo}->{webReaderLink} );
182 #       $marc->add_fields( 520, ' ', ' ', 'a' => $item->{searchInfo}->{textSnippet} ); # duplicate of description
183
184 #       diag "# hash ",dump($hash);
185         diag "# marc ", $marc->as_formatted;
186
187         $self->save_marc( "$id.marc", $marc->as_usmarc );
188
189         return $id;
190
191 }
192
193 1;