6db5aa26e2b55d065a90750610fa26cc6ba7535d
[MojoFacets.git] / lib / MojoFacets / Data.pm
1 package MojoFacets::Data;
2
3 use strict;
4 use warnings;
5
6 use base 'Mojolicious::Controller';
7
8 use Data::Dump qw(dump);
9 use File::Slurp;
10 use JSON;
11 use Encode;
12
13 sub index {
14         my $self = shift;
15
16         my $path = $self->app->home->rel_dir('data');
17         die "no data dir $path" unless -d $path;
18
19         opendir(my $dir, $path) || die $!;
20         my @files = 
21                 grep { -f "$path/$_" && $_ =~ m/\.js(on)?$/ }
22                 readdir $dir;
23         close($dir);
24
25         $self->render( files => [ @files ] );
26 }
27
28 our $data;
29 our $stats;
30
31 sub load {
32         my $self = shift;
33
34         my $path = $self->app->home->rel_file( 'data/' . $self->param('path') );
35         die "$path $!" unless -r $path;
36
37         $self->session('path' => $self->param('path'));
38
39         # we could use Mojo::JSON here, but it's too slow
40 #       $data = from_json read_file $path;
41         $data = read_file $path;
42         Encode::_utf8_on($data);
43         warn "# json snippet: ", substr($data,0,200);
44         $data = from_json $data;
45
46         $stats = {};
47
48         foreach my $e ( @{ $data->{items} } ) {
49                 foreach my $n ( keys %$e ) {
50                         $stats->{$n}->{count}++;
51                         if ( ref $e->{$n} eq 'ARRAY' ) {
52
53                                 $stats->{$n}->{array} += $#{ $e->{$n} } + 1;
54
55                                 foreach my $x ( @{$e->{$n}} ) {
56                                         $stats->{$n}->{numeric}++
57                                                 if $x =~ m/^[-+]?([0-9]*\.[0-9]+|[0-9]+)$/;
58                                 }
59
60                         } else {
61                                 $stats->{$n}->{numeric}++
62                                         if $e->{$n} =~ m/^[-+]?([0-9]*\.[0-9]+|[0-9]+)$/;
63                         }
64                 }
65         }
66
67         foreach my $n ( keys %$stats ) {
68                 next unless defined $stats->{$n}->{array};
69                 delete $stats->{$n}->{array}
70                         if $stats->{$n}->{array} == $stats->{$n}->{count};
71         }
72
73         warn dump($stats);
74
75         $self->redirect_to( '/data/columns' );
76 }
77
78
79 sub columns {
80     my $self = shift;
81
82
83         my @columns;
84         @columns = @{ $self->session('columns') } if $self->session('columns');
85
86         foreach my $c ( sort { $stats->{$b}->{count} <=> $stats->{$a}->{count} } keys %$stats ) {
87                 push @columns, $c unless grep { /^\Q$c\E$/ } @columns;
88         }
89
90         $self->redirect_to( '/data/index' ) unless @columns;
91
92     $self->render(
93                 message => 'Select columns to display',
94                 stats => $stats,
95                 columns => \@columns,
96                 checked => $self->_checked( $self->_perm_array('columns') ),
97         );
98 }
99
100 sub _perm_array {
101     my ($self,$name) = @_;
102
103         my @array = $self->param($name);
104
105         if ( @array ) {
106                 $self->session($name => [ @array ]);
107         } elsif ( my $session = $self->session($name) ) {
108                 if ( ref $session eq 'ARRAY' ) {
109                         @array = @$session;
110                 } else {
111                         die "$name not array ",dump($session);
112                 }
113         }
114         warn "# $name ",dump @array;
115         return @array;
116 }
117
118 sub _perm_scalar {
119     my ($self,$name,$default) = @_;
120
121         my $scalar = $self->param($name);
122
123         if ( defined $scalar ) {
124                 $self->session($name => $scalar);
125         } else {
126                 $scalar = $self->session($name);
127         }
128
129         if ( ! defined $scalar ) {
130                 $scalar = $default;
131                 die "no default for $name" unless defined $scalar;
132                 $self->session($name => $scalar);
133         }
134
135         warn "# $name ",dump $scalar;
136         return $scalar;
137 }
138
139 sub filter {
140         my $self = shift;
141
142         my $name = $self->param('filter_name') || die "name?";
143         my @vals = $self->param('filter_vals');
144
145         warn "# filter $name vals ",dump(@vals);
146
147         my $filters = $self->session('filters');
148         if ( @vals ) {
149                 $filters->{$name} = [ @vals ];
150         } else {
151                 delete $filters->{$name};
152         }
153         $self->session( 'filters' => $filters );
154
155         warn "# filters ",dump($self->session('filters'));
156
157         $self->session( 'offset' => 0 );
158
159         $self->redirect_to('/data/table');
160 }
161
162 sub _filter_item {
163         my ( $self, $filters, $i ) = @_;
164         my $pass = 1;
165         foreach my $n ( keys %$filters ) {
166                 # filter must exists in element
167                 if ( ! defined $i->{$n} ) {
168                         $pass = 0;
169                         last;
170                 }
171                 # and match any of values in element
172                 my $have_values = 0;
173                 foreach my $v ( @{ $i->{$n} } ) { # FIXME not array?
174                         $have_values ||= 1 if grep { m/^\Q$v\E$/ } @{ $filters->{$n} };
175                 }
176                 if ( ! $have_values ) {
177                         $pass = 0;
178                         last;
179                 }
180         }
181         return $pass;
182 }
183
184 sub _data_items {
185         my $self = shift;
186         my $filters = $self->session('filters');
187         grep {
188                 $filters ? $self->_filter_item( $filters, $_ ) : 1;
189         } @{ $data->{items} };
190 }
191
192 sub table {
193     my $self = shift;
194
195         $self->redirect_to('/data/index') unless $data->{items};
196
197         my @columns = $self->_perm_array('columns');
198         $self->redirect_to('/data/columns') unless @columns;
199         my $order   = $self->_perm_scalar('order', $columns[0]);
200         my $offset  = $self->_perm_scalar('offset', 0);
201         my $limit   = $self->_perm_scalar('limit', 20);
202
203         my @sorted = sort {
204                 ( $a->{$order} || '' ) cmp ( $b->{$order} || '' ) # FIXME - multi-level sort
205         } $self->_data_items;
206
207 #       warn "# sorted ", dump @sorted;
208
209         my $rows = $#sorted + 1;
210
211         warn "$rows $offset $limit";
212
213         $self->render(
214                 order => $order,
215                 offset => $offset,
216                 limit => $limit,
217                 sorted => [ splice @sorted, $offset, $limit ],
218                 columns => [ @columns ],
219                 rows => $rows,
220         );
221
222 }
223
224
225 sub facet {
226         my $self = shift;
227
228         if ( my $remove = $self->param('remove') ) {
229                 my $f = $self->session('filters');
230                 delete $f->{$remove};
231                 $self->session( 'filters' => $f );
232                 $self->redirect_to( '/data/table' );
233         }
234
235         my $facet;
236         my $name = $self->param('name') || die "no name";
237
238         foreach my $i ( $self->_data_items ) {
239                 next unless exists $i->{$name};
240                 if ( ref $i->{$name} eq 'ARRAY' ) {
241                         $facet->{$_}++ foreach @{ $i->{$name} };
242                 } else {
243                         $facet->{ $i->{$name} }++;
244                 }
245         }
246
247 #       warn "# facet $name ",dump $facet;
248
249         my $checked;
250         if ( my $f = $self->session('filters') ) {
251                 if ( defined $f->{$name} ) {
252                         $checked = $self->_checked( @{ $f->{$name} } );
253                 }
254         }
255
256         my $sort = $self->param('sort') || 'c';
257
258         # sort facet numerically if more >50% elements are numeric
259         my $numeric = defined $stats->{$name}->{numeric} &&
260                 $stats->{$name}->{numeric} > $stats->{$name}->{count} / 2;
261
262         my @facet_names = sort {
263                 if ( $sort =~ m/a/i ) {
264                         $numeric ? $a <=> $b : lc $a cmp lc $b;
265                 } elsif ( $sort =~ m/d/i ) {
266                         $numeric ? $b <=> $a : lc $b cmp lc $a;
267                 } elsif ( $sort =~ m/c/i ) {
268                         $facet->{$b} <=> $facet->{$a};
269                 } else {
270                         warn "unknown sort: $sort";
271                         $a cmp $b;
272                 }
273         } keys %$facet;
274
275         $self->render( name => $name, facet => $facet, checked => $checked,
276                 facet_names => \@facet_names, sort => $sort, numeric => $numeric,
277         );
278 }
279
280 sub _checked {
281         my $self = shift;
282         my $checked;
283         $checked->{$_}++ foreach @_;
284         warn "# _checked ",dump($checked);
285         return $checked;
286 }
287
288 1;