ffzg/recall_notices.pl: added --interval and --dedup
[koha.git] / misc / migration_tools / checkNonIndexedBiblios.pl
1 #!/usr/bin/perl
2
3 # Copyright 2012 BibLibre
4 #
5 # This file is part of Koha.
6 #
7 # Koha is free software; you can redistribute it and/or modify it
8 # under the terms of the GNU General Public License as published by
9 # the Free Software Foundation; either version 3 of the License, or
10 # (at your option) any later version.
11 #
12 # Koha is distributed in the hope that it will be useful, but
13 # WITHOUT ANY WARRANTY; without even the implied warranty of
14 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
15 # GNU General Public License for more details.
16 #
17 # You should have received a copy of the GNU General Public License
18 # along with Koha; if not, see <http://www.gnu.org/licenses>.
19
20 # Small script that checks if each biblio in the DB is properly indexed
21 # if it is not and if you use -z the not-indexed biblios are inserted in zebraqueue
22 # To test just ommit the -z option you will have the biblionumber of non-indexed biblios and the total
23
24 use strict;
25
26 BEGIN {
27
28     # find Koha's Perl modules
29     # test carefully before changing this
30     use FindBin;
31     eval { require "$FindBin::Bin/kohalib.pl" };
32 }
33
34 # Koha modules used
35 use MARC::Record;
36 use C4::Context;
37 use Getopt::Long;
38
39 use Koha::SearchEngine::Search;
40
41 my ( $help, $confirm, $zebraqueue, $silent,$stealth );
42
43 GetOptions(
44     'c' => \$confirm,
45     'h' => \$help,
46     'z' => \$zebraqueue,
47     's' => \$silent,
48     'st' => \$stealth
49 );
50
51 if ( $help || ( !$confirm ) ) {
52     print_usage();
53     exit 0;
54 }
55
56 my $dbh = C4::Context->dbh;
57 my $i = 0;
58 my $count = 0;
59
60 # flushes output
61 $| = 1;
62
63 my $sth = $dbh->prepare("SELECT biblionumber FROM biblio");
64 my $sth_insert = $dbh->prepare("INSERT INTO zebraqueue (biblio_auth_number,operation,server,done) VALUES (?,'specialUpdate','biblioserver',0)");
65
66 my $searcher = Koha::SearchEngine::Search->new({index => 'biblios'});
67
68 # We get all biblios
69 $sth->execute;
70 my ($nbhits);
71 # We check for each biblio
72 while ( my ($biblionumber) = $sth->fetchrow ) {
73     (undef,undef,$nbhits) = $searcher->simple_search_compat("Local-number=$biblionumber");
74     print "biblionumber $biblionumber not indexed\n" unless $nbhits || $stealth;
75 # If -z option we put the biblio in zebraqueue
76     if ($zebraqueue && !$nbhits){
77         $sth_insert->execute($biblionumber);
78         print "$biblionumber inserted in zebraqueue\n" unless $stealth;
79     }
80     $i++;
81     print "$i done\n" unless $i % 1000 || $silent || $stealth;
82     $count++ unless $nbhits;
83 }
84
85 if ($count > 0 && $zebraqueue){
86     print "\t$count bibliorecords not indexed and inserted in zebraqueue\n";
87 }
88 else{
89     print "\t$count bibliorecords not indexed\n";
90 }
91
92 sub print_usage {
93     print <<_USAGE_;
94 $0: This script takes all biblios and checks if they are indexed in zebra using biblionumber search.
95
96 parameters:
97 \th this help screen
98 \tc confirm (without this parameter, you get the help screen)
99 \tz inserts a signal in zebraqueue to force indexing of non indexed biblios otherwise you have only the check
100 \ts silent throws no warnings except for non indexed records. Otherwise throws a warn every 1000 biblios to show progress
101 \tst stealth do not print warnings for non indexed records and do not warn every 1000
102
103 Syntax:
104 \t./batchCheckNonIndexedBiblios.pl -h (or without arguments => shows this screen)
105 \t./batchCheckNonIndexedBiblios.pl -c (c like confirm => checks all records (may be long)
106 \t./batchCheckNonIndexedBiblios.pl -z (z like zebraqueue => inserts in zebraqueue. Without => test only, changes nothing in DB just warns)
107 \t./batchCheckNonIndexedBiblios.pl -s (s like silent => don't throws a warn every 1000 biblios to show progress)
108 \t./batchCheckNonIndexedBiblios.pl -st (s like stealth => don't throws a warn every 1000 biblios to show progress and no warn for the non indexed biblionumbers, just the total)
109 _USAGE_
110 }