correctly save citedref pages
authorDobrica Pavlinusic <dpavlin@rot13.org>
Sun, 12 Aug 2012 12:38:51 +0000 (12:38 +0000)
committerDobrica Pavlinusic <dpavlin@rot13.org>
Sun, 12 Aug 2012 12:38:51 +0000 (12:38 +0000)
git-svn-id: svn+ssh://mjesec/home/dpavlin/svn/webpac2/trunk@1370 07558da8-63fa-0310-ba24-9fe276d99e06

bin/isi-download-results.pl

index 6bb37d4..54fc39d 100755 (executable)
@@ -12,16 +12,17 @@ use Text::Unaccent;
 # http://images.isiknowledge.com/WOK46/help/WOS/h_advanced_examples.html
 
 our $q = 'AD=Croatia';
-$q = 'AU=BRATKO, D';
+#$q = 'AU=BRATKO, D';
+$q = 'CA=BRATKO, D';
 #$q = 'AD=(croat* OR hrvat*)';
 
 my $range_size = 100;
 my $overlap    = 3; # between previous and this range
 
-my $results = 1;
+my $results = 0;
 my $citations = 0;
-my $cited_reference = 0; # html tables
-my $citing_articles = 0; # as many files as cited articles
+my $cited_reference = 1; # html tables
+my $citing_articles = 1; # as many files as cited articles
 
 my $cites_by_year = 0;
 
@@ -296,6 +297,7 @@ if ( $q =~ m{CA=(.+)} && $cited_reference ) {
                save_mech "/tmp/isi.$q.citedref.$page";
 
                last unless next_page();
+               $page++;
 
                if ( $mech->content =~ m/(\d+\s*-\s*(\d+))/ ) {
                        warn "span: $1\n";