work on journals database conversion
[webpac2] / conf / ffcasopisi / modify.pl
1 # this is pseudo hash/yaml format for regex mappings
2
3 11
4   '*'
5     'regex:^\s+' => ''
6
7 102
8   '*'
9     'regex:^AL$' => 'aa'
10     'regex:^AM$' => 'ai'
11     'regex:^AR$' => 'ag'
12     'regex:^AT$' => 'au'
13     'regex:^AU$' => 'at'
14     'regex:^AUT$' => ''
15     'regex:^B$' => ''
16     'regex:^BA$' => 'bn'
17     'regex:^BA; HR$' => ''
18     'regex:^BE$' => 'be'
19     'regex:^BG$' => 'bu'
20     'regex:^BH$' => 'ba'
21     'regex:^ BH$' => 'ba'
22     'regex:^BiH$' => 'ba'
23     'regex:^BIH$' => 'ba'
24     'regex:^BL$' => 'bu'
25     'regex:^BO$' => 'bo'
26     'regex:^BOS$' => 'bn'
27     'regex:^CA$' => 'cn'
28     'regex:^CAN$' => 'cn'
29     'regex:^CG$' => 'cg'
30     'regex:^CH$' => 'sz'
31     'regex:^CRO$' => 'ci'
32     'regex:^CS$' => 'yu'
33     'regex:^CU$' => 'cu'
34     'regex:^CZ$' => 'xr'
35     'regex:^D$' => 'gw'
36     'regex:^De$' => 'gw'
37     'regex:^DE$' => 'gw'
38     'regex:^DE/AT$' => ''
39     'regex:^DEU$' => 'gw'
40     'regex:^DK$' => 'dk'
41     'regex:^DU$' => ''
42     'regex:^EG$' => 'ua'
43     'regex:^EN$' => 'uk'
44     'regex:^Eng$' => 'uk'
45     'regex:^ENG$' => 'uk'
46     'regex:^ES$' => 'sp'
47     'regex:^ET$' => ''
48     'regex:^EU$' => ''
49     'regex:^F$' => ''
50     'regex:^FI$' => 'fi'
51     'regex:^FIN$' => 'fi'
52     'regex:^FR$' => 'fr'
53     'regex:^FRA$' => 'fr'
54     'regex:^GB$' => 'uk'
55     'regex:^GBR$' => 'uk'
56     'regex:^GE$' => 'gw'
57     'regex:^GER$' => 'gw'
58     'regex:^hr$' => 'ci'
59     'regex:^Hr$' => 'ci'
60     'regex:^HR$' => 'ci'
61     'regex:^HR-IT$' => ''
62     'regex:^HR; IT$' => ''
63     'regex:^HRV$' => 'ci'
64     'regex:^HR, YU$' => ''
65     'regex:^HU$' => 'hu'
66     'regex:^I$' => ''
67     'regex:^IN$' => 'ii'
68     'regex:^IR$' => 'ir'
69     'regex:^IT$' => 'it'
70     'regex:^ITA$' => 'it'
71     'regex:^IZ$' => ''
72     'regex:^JA$' => 'jp'
73     'regex:^JAP$' => 'jp'
74     'regex:^JU$' => 'yu'
75     'regex:^Jugoslavija$' => ''
76     'regex:^KR$' => 'ko'
77     'regex:^LV$' => 'lv'
78     'regex:^MA$' => 'mr'
79     'regex:^MK$' => 'xn'
80     'regex:^MT$' => 'mm'
81     'regex:^MX$' => 'mx'
82     'regex:^NL$' => 'ne'
83     'regex:^NO$' => 'no'
84     'regex:^Šanjolska$' => 'sp'
85     'regex:^Pl$' => 'pl'
86     'regex:^PL$' => 'pl'
87     'regex:^PT$' => 'po'
88     'regex:^RF$' => 'ru'
89     'regex:^RM$' => 'rm'
90     'regex:^RO$' => 'rm'
91     'regex:^ROM$' => 'rm'
92     'regex:^RU$' => 'ru'
93     'regex:^RUM$' => 'ru'
94     'regex:^SAD$' => 'us'
95     'regex:^SC$' => 'se'
96     'regex:^SCC$' => ''
97     'regex:^SCG$' => ''
98     'regex:^SE$' => 'sw'
99     'regex:^SI$' => 'xv'
100     'regex:^SiCG$' => ''
101     'regex:^SICG$' => ''
102     'regex:^SK$' => 'xo'
103     'regex:^SL$' => 'sl'
104     'regex:^SLO$' => 'sl'
105     'regex:^SLV$' => ''
106     'regex:^SP$' => ''
107     'regex:^SR$' => 'sr'
108     'regex:^Srbija$' => 'sr'
109     'regex:^SRBIJA$' => 'sr'
110     'regex:^SS$' => ''
111     'regex:^SU$' => ''
112     'regex:^SW$' => 'sw'
113     'regex:^SZ$' => ''
114     'regex:^TN$' => 'ti'
115     'regex:^TR$' => 'tu'
116     'regex:^UA$' => 'un'
117     'regex:^UK$' => 'uk'
118     'regex:^us$' => 'us'
119     'regex:^US$' => 'us'
120     'regex:^USA$' => 'us'
121     'regex:^Vojvodina$' => 'sr'
122     'regex:^YU$' => 'yu'
123     'regex:^YU;CS$' => ''
124     'regex:^YUG$' => 'yu'
125     'regex:^YU, HR$' => ''
126     'regex:^YU,  HR$' => ''
127     'regex:^YU/HR$' => ''
128     'regex:^YU, SI$' => ''
129     'regex:^YU, Srbija$' => ''
130     'regex:^YU (SRBIJA)$' => ''
131     'regex:^YU, SRBIJA$' => ''
132
133
134 200
135   '*'
136     '^e' => ' : '
137     '^d' => ' = '
138     '^k' => ' : '
139
140 210
141   '*'
142     ' : ' => ' :^b'
143     ' ; ' => ' ;^a'
144     '^c'  => ' :^b'
145     '^d'  => ',^c'
146   '^c'
147     'regex:^\s+' => ''
148     ' - ' => '-'
149     ' -'  => '-'
150     '- '  => '-'
151     ', '  => '-'
152     '.'   => ''
153     '_ _' => '--'
154
155
156 326
157    'regex:^1$' => '|'
158    'regex:^1.$' => '|'
159    'regex:^10$' => '10'
160    'regex:^10.$' => '10'
161    'regex:^10g$' => '10'
162    'regex:^12$' => 'm1'
163    'regex:^1-2 broja godišnje$' => 'g2'
164    'regex:^12g ;(uvez:1953-1957);(uvez:1958-1961)$' => '|'
165    'regex:^19g$' => '19'
166    'regex:^1g$' => '|'
167    'regex:^1m$' => '|'
168    'regex:^26.godišnje$' => '|'
169    'regex:^2g$' => '|'
170    'regex:^2. godišnje 2 broja$' => 'g2'
171    'regex:^3.$' => '|'
172    'regex:^35(1996)$' => '|'
173    'regex:^3g$' => '|'
174    'regex:^4.$' => '|'
175    'regex:^4g$' => '|'
176    'regex:^52$' => '|'
177    'regex:^64$' => '|'
178    'regex:^6g$' => '|'
179    'regex:^Četvrtgodišnje$' => 'g4'
180    'regex:^dg$' => '|'
181    'regex:^Dva puta tjedno utorkom i subotom$' => 't2us'
182    'regex:^Dvogodišnjak$' => '2g'
183    'regex:^g$' => '|'
184    'regex:^g1$' => 'g1'
185    'regex:^g1.$' => 'g1'
186    'regex:^g10$' => '10'
187    'regex:^g 10$' => '10'
188    'regex:^g11$' => '11'
189    'regex:^g12$' => 'm1'
190    'regex:^g1godišnjak$' => 'g1'
191    'regex:^g1 godišnjak$' => 'g1'
192    'regex:^g1.godišnjak.$' => 'g1'
193    'regex:^g1     nr$' => 'nr'
194    'regex:^g1- nr$' => 'nr'
195    'regex:^g1;  nr$' => 'nr'
196    'regex:^g1(nr)$' => 'nr'
197    'regex:^g2$' => 'g2'
198    'regex:^g2.$' => 'g2'
199    'regex:^g2 $' => 'g2'
200    'regex:^g2.$' => 'g2'
201    'regex:^g20$' => '20'
202    'regex:^g24$' => '24'
203    'regex:^g26$' => '26'
204    'regex:^g2.godišnje 2 broja.$' => 'g2'
205    'regex:^g2 polugodišnjak$' => 'g2'
206    'regex:^g2.polugodišnjak.$' => 'g2'
207    'regex:^g3$' => 'g3'
208    'regex:^g3.$' => 'g3'
209    'regex:^g3.$' => 'g3'
210    'regex:^g3 četveromjesečnik$' => 'g3'
211    'regex:^g3.godišnje 3 broja.$' => 'g3'
212    'regex:^g3.tromjesečnik.$' => 'g3'
213    'regex:^g4$' => 'g4'
214    'regex:^g4.$' => 'g4'
215    'regex:^g4.$' => 'g4'
216    'regex:^g4-5$' => 'g4'
217    'regex:^g4 tromjesečnik$' => 'g4'
218    'regex:^g4.tromjese.+$' => 'g4'
219    'regex:^g5$' => 'g5'
220    'regex:^g5.$' => 'g5'
221    'regex:^g50$' => '|'
222    'regex:^g5.godišnje 5 brojeva.$' => 'g5'
223    'regex:^g6$' => 'g6'
224    'regex:^  g6$' => 'g6'
225    'regex:^g6.$' => 'g6'
226    'regex:^g6 dvomjesečnik$' => 'g6'
227    'regex:^g6.dvomjesečnik.$' => 'g6'
228    'regex:^g6 polugodišnjak$' => 'g6'
229    'regex:^g8$' => 'g8'
230    'regex:^g9$' => 'g9'
231    'regex:^g9.$' => 'g9'
232    'regex:^gm1$' => '|'
233    'regex:^gm4$' => '|'
234    'regex:^gnepoznato$' => '|'
235    'regex:^gnr$' => 'nr'
236    'regex:^Godišnje$' => 'g1'
237    'regex:^godišnje 4 broja$' => 'g4'
238    'regex:^Izlazi neredovito$' => 'nr'
239    'regex:^m1$' => 'm1'
240    'regex:^m1.$' => 'm1'
241    'regex:^m12$' => 'm1'
242    'regex:^m1.mjesečnik.$' => 'm1'
243    'regex:^m2$' => 'm2'
244    'regex:^m2.dvotjednik.$' => 'm2'
245    'regex:^m3$' => 'm3'
246    'regex:^m4$' => 't1'
247    'regex:^Neredovito$' => 'nr'
248    'regex:^nr$' => 'nr'
249    'regex:^nr $' => 'nr'
250    'regex:^nr.$' => 'nr'
251    'regex:^Nr$' => 'nr'
252    'regex:^NR$' => 'nr'
253    'regex:^nr (kvartalno)$' => 'nr'
254    'regex:^nr neredovito$' => 'nr'
255    'regex:^nr.neredovito.$' => 'nr'
256    'regex:^od 1993 g4, do 1993 g2$' => '|'
257    'regex:^Polutjedno$' => 't2'
258    'regex:^t1$' => 't1'
259    'regex:^tjednik$' => 't1'
260    'regex:^Tjednik$' => 't1'
261    'regex:^Tri puta mjesečno$' => 'm3'
262    'regex:^tromjesečnik$' => '|'
263    'regex:^Tromjesečnik$' => '|'
264    'regex:^Tromjesečno$' => '|'