remove all accents from pager links

merge fix from trunk to all branches

switch back to GDBM_File which is included in recent
Debian, and TDB_File won't compile against tdb-dev

use join_subfields_with from Biblio::Isis 0.23 to handle repeatable subfields

added check for broken CDATA at beginning, fix also broken delimiters

fix mem_lookup with values which include characters which can be interpreted as regexes

strip script name from self URL

support distinct flag for field to show just unique values if field is

fix start_row when using excel import

fix transfer of multiple v42= fields when generating url_params (this
occured when you tried to use checkboxes to select multiple items and then
click on title of result)

Implemented persistent filter which can be used in index or search to
specify database name to limit search to. Filter searches are presistant.

WebPAC cgi will now set it's own locale (using configuration directive in

bugfix for phrases (again): never assume entity name...

phrase search fix: escape quotes in hidden variables

transfer filter variable in index to template (it can be useful)

added import_xml_file and import_xml_tag into configuration file,
documentation for .dbf import

Experimental support for dBase .dbf files. Usege like this in all2xml.conf:

ID_BROJ                001
ISBN_BROJ      010
SKUPINA1       200
SKUPINA2       205
SKUPINA4       210
SKUPINA5       215
SKUPINA6       225
SKUPINA7       300
ANOTACIJA      330
PREDMET1       610
PREDMET2       610
PREDMET3       510
UDK            675
REDALICA       700
SIGNATURA      990

dbf type will use <isis> tag in import_xml and dbf_codepage will
override codepage specified in import_xml file.

Small code refactoring.

fix phrase search ("something else")

added support for submit button "reset" which will reset form (you can't
really use type="reset" with persitant search variables enabled).

bugfix: re-enable HTML::FillInForm to create persistent search using
<TMPL_VAR NAME="SEARCH_HIDDEN"> in form which has just "back to search"
button. You can use this variable to dump persistant search variables
without rm (runmode of CGI::Application)

bugfix: check Isis database error in correct place

bugfix: now database names are always transfered to filtering function
(previously it work with Isis databases)

be more forgiving to changes in results templates

filter to checked documents

added sort by any combination of swish-e fields which are defined by
PropertyNames in swish_isis.conf. This allowed adition of links which show
search results sorted by time, author and title then author or autor than
titme combination.

Any combination of fields for sorting can be specified (separated by spaces),
with optional asc(ending) or desc(ending) order.

report error and don't die

don't show 0 in pager if no results are found

SQLite fixes: rename index table to data (index is reserved word),
SQLite doesn't allow placeholders in limit and offset, see:

bugfixes and improvements: skip MARC databases that can't be opened,
fix progress bar on MARC databases (so that it finish on 100%),
minor pod update

use SQLite again

don't die if ISIS database is not found, just go to next one

updated development from production

add filtering to index (using parameter filter, for now single)

renamed tag to finger to avoid confusion (I tried to exmplain why I use term
tag and failed -- it too similar to tags used in import_xml)

New implementation of indexes: now it uses only two tables (index for all
data and tags for all tags). Currently, it doesn't enforce relation between
them on RDBMS level (I have to test this code against SQLite and MySQL
before enforcing that).
Removed swish-e output while indexing, database is used as default tag to
enable filtering by database (there isn't possiblity to set tag to something
else yet!). Output usage count in index.

All-wrong-and-ugly solution to using exact match variables which are
persistent: it's not supported any more. However, until we have real
separation of variables comming from user, via format and/or from links
(right now, they are all using f/v) this problem can't be fixed right.
Much nicer error mesages ("Software error") instead of "Internal Server Error".

don't add unneeded delimiter

Implemented persist_search hidden variable in forms which can specify
(multiple) number of variables which should be persistent after user
specified them in form (useful for language for example). Values are
separated by comma (,). Some cleanup and warning removal.

use Bibio::Isis istead of IsisDB (same module, but name is changed for CPAN

correct support for accented letters entered as html entities in input data.

yet another progress bar fix

fix for progress bar (don't fake slowdown)

cleanup and documentation updates

use IsisDB module instead of OpenIsis -- this will fix various problems in
index generation becasue IsisDB doesn't have problems as OpenIsis perl
bindings does.

small tool to compare to files which are produced for swish-e -S prog

use newer MARC::File::USMARC instead of MARC

upgrade from MARC to MARC::File::USMARC, take MFN from data
M    dump_marc.pl

new nicer progress bar (back-ported from v2)

design changes (and translation to Croatian)

improvement: path limit in URL works without full result display

fix repeatable field names which have non 7-bit ascii characters

changes to support UTF-8 encoding from

You will have to modify line 69 from
return pack('C*', unpack('n*', $sTxt));
to following which returns utf-8:
return pack('U*', unpack('n*', $sTxt));

bug fix when transfering fields with multiple values (e.g. checkboxes) to
pager (hidden fields that is)

better check if table exists (so that DBD::SQLite upgrade won't break)

don't be greedy when trying to find end of eval{...}
This enables inserting { } into field after eval

fixed direct memory lookup, workaround for strange
bug when requested output is scalar; it will ignore
first element which works but is not totally correct

if field in eval isn't repeatable use first value,
return eval errors

create missing lookup files

back-ported unlimited recursive mem_lookup from webpac v2.
Now you can say something like [[[900]]] and it will produce
tripple lookup (as opposed to double which was maximum in old

removed template

set enviroment variables LC_COLLATE and LC_CTYPE (needed by SQLite to
convert charset to upper characters correctly)

fixed parsing for science direct html with more than one <a href=> per one <tr>
support to force input file (if you uncomment filename in script)

save MFN as field 001

print warning if type is not handled (probably a typo)

various fixes

don't die on field which can't be parsed (just print warning), corrected
subfield order for field 210

command line parametars are now working (xml files are at end, so that shell
glob will work), misc improvements

first really working version: support single and repeating fields correctly,
output encodings implemented, support for indicators

fixes, cleanups, you know: on the way to usable version

first try at converting MODS XML records back to MARC

fix of a fix (case)

implement my_unac_string function, and my_unac_filter option in global.conf
which you *REALLY* want to use if you don't have only clean 7-bit characters
in your data

fix CROASCII (B1.002:1982) filter

make distribution from SubVersion repository

Major change:

I no longer user HTML::Pager, SWISH and SWISH::Fork modules,
but SWISH::API (new interface to swish 2.4.x, which is required) and own
implementation of pager.

That saves round-trips of all results from swish-e to memory and to
HTML::Pager so this produces also significant speedup when result set is
large (tipically if you entered just a letter or two with huge number of

bug fix: support for working from root of virtual host

even more detail explanation

explanation of bit-masks with examples

You can now specify configuration file as command-line option, and
if you don't do that, it will use default one called all2xml.conf

removed unneeded warning

bug fix: eval now honours codepage settings

delimiter and append now works as expected

merge changes from trunk to branches, converted all import_xml

preserve other attributes

converted delimiters to new format

script to convert delimiters

Implemented new form of delimiters like this:

<delimiter>, </delimiter>

which is equivavelnt to following old mark-up:

<tag delimiter=", ">200a</tag>

but, it won't loose spaces in attribute values (which
are invalid by XML specification and XML::Simple removes
them so WebPac never get them)

moved tests in own directory, added test to demonstrate XML::Simple feature
to remove spaces from begin and end attribute value (which is wrong for
delimiters as WebPAC uses them)

ported 269:272 from hidra

<config> tags (which use values from all2xml.conf) are now properly handled
if there is more than one in same swish tag. However, to use <config
type="index"> is useless IMHO, and <config type="index_lookup"> is not

"show details" now work corretly when not on first page

ported r260 from hidra branch: moved eval to parse_format.pm where it
belongs. Also changed eval format to: eval{v901^a eq "Mikrotezaurus"}
(please note same format as in ISIS formating language)

ported 257:258 from hidra branch
all2xml.pl - fix for swish without filter
openisis/perl/OpenIsis.pm - removed warning

ported r254 from hidra branch

ported r248:252 from hidra branch:

r248: much improved installation instructions, especially for Debian
      GNU/Linux distributions
r249: changed use of Spreadsheet::ParseExcel and MARC to require/import so
      that dependency on those modules can be resolved in runtime.
r250: finished installation documentation
r251: removing dependency on HTML::Parser would ease installation
r252: smaller eval{} fiexes. eval{} logic should really move to

implement close for perl OpenIsis bindings

including openisis 0.9.0 into webpac tree

preparation for first file dump at sourceforge.net

eval{...} now works for type="swish" also...

