sort data files by mtime
[MojoFacets.git] / lib / MojoFacets / Data.pm
index 83fce08..e1dc8ac 100644 (file)
@@ -5,7 +5,11 @@ use warnings;
 
 use base 'Mojolicious::Controller';
 
-use Data::Dump qw(dump);
+#use Data::Dump qw(dump); # broken with Mojo::JSON, see https://rt.cpan.org/Public/Bug/Display.html?id=86592
+use Data::Dumper;
+use subs 'dump';
+sub dump { Dumper(@_) };
+
 use File::Slurp;
 use Encode;
 use locale;
@@ -15,12 +19,41 @@ use Time::HiRes qw(time);
 use File::Path qw(mkpath);
 use Text::Unaccent::PurePerl;
 use Digest::MD5;
+use Statistics::Descriptive;
+
+our $imports;
+foreach my $module ( glob('lib/MojoFacets/Import/*.pm') ) {
+       $module =~ s{lib/(\w+)/(\w+)/(.*)\.pm}{$1::$2::$3};
+       eval "use $module";
+       die "$module: $!" if $!;
+       my ( $ext, $priority ) = $module->ext;
+       $imports->{$priority || 'file'}->{$ext} = $module;
+       warn "# import $ext $module\n";
+}
+
+warn "# import loaded ",dump( $imports );
+
+sub import_module {
+       my $full_path = shift;
+
+#      warn "# import_module $full_path\n";
 
-use MojoFacets::Import::File;
-use MojoFacets::Import::HTMLTable;
-use MojoFacets::Import::CSV;
-use MojoFacets::Import::CouchDB;
-use MojoFacets::Import::SQL;
+       return if $full_path =~ m/\.columns$/;
+
+       foreach my $ext ( keys %{ $imports->{file} } ) {
+               if ( -f $full_path && $full_path =~ m/$ext/i ) {
+                       return $imports->{file}->{$ext};
+                       last;
+               }
+       }
+
+       foreach my $ext ( keys %{ $imports->{directory} } ) {
+               if ( -f $full_path && $full_path =~ m/$ext/i ) {
+                       return $imports->{directory}->{$ext};
+                       last;
+               }
+       }
+}
 
 our $loaded;
 our $filters;
@@ -28,32 +61,30 @@ our $filters;
 sub index {
        my $self = shift;
 
-       my $data_dir = $self->app->home->rel_dir('data');
+       my $data_dir = $self->app->home->rel_file('data');
        die "no data dir $data_dir" unless -d $data_dir;
 
        my @files;
        my $changes;
+
        find( sub {
                my $file = $File::Find::name;
-               if ( -f $file && $file =~ m/\.(js(on)?|txt)$/ ) {
-                       $file =~ s/$data_dir\/*//;
-                       push @files, $file;
-               } elsif ( -f $file && $file =~ m/([^\/]+)\.changes\/(\d+\.\d+.+)/ ) {
+               if ( -f $file && $file =~ m/([^\/]+)\.changes\/(\d+[\.,]\d+.+)/ ) {
                        push @{ $changes->{$1} }, $2
-               } elsif ( -d $file && $file =~ m/\.html$/ ) {
-                       $file =~ s/$data_dir\/*//;
-                       push @files, $file;
-               } elsif ( -f $file && $file =~ m/\.(csv|storable|couchdb|sql)$/i ) {
+               } elsif ( import_module( $file ) ) {
+                       my $mtime = (stat($file))[9]; # mtime
                        $file =~ s/$data_dir\/*//;
                        push @files, $file;
+                       $loaded->{$file}->{mtime} ||= $mtime;
                } else {
-                       warn "IGNORE: $file\n";
+                       #warn "IGNORE: $file\n";
                }
        }, $data_dir);
 
        no warnings qw(uninitialized); # mtime
        @files = sort { $loaded->{$b}->{mtime} <=> $loaded->{$a}->{mtime} || lc $a cmp lc $b } @files,
-                       grep { defined $loaded->{$_}->{generated} } keys %$loaded;
+                       grep { defined $loaded->{$_}->{generated} } keys %$loaded;
+
        my $size;
        $size->{$_} = -s "$data_dir/$_" foreach @files;
 
@@ -69,7 +100,7 @@ sub index {
 
 sub _dump_path {
        my ( $self, $name ) = @_;
-       my $dir = $self->app->home->rel_dir('data');
+       my $dir = $self->app->home->rel_file('data');
        $name =~ s/^$dir//;
        $name =~ s/\/+/_/g;
        return '/tmp/mojo_facets.' . $name . '.storable';
@@ -194,37 +225,8 @@ sub _load_path {
        }
 
        my $data;
-       if ( -f $full_path ) {
-               if ( $full_path =~ m/.storable$/ ) { # check storable first to catch files copied from /tmp/
-                       warn "open $full_path ", -s $full_path, " bytes";
-                       open(my $pipe, "<", $full_path) || die $!;
-                       while ( my $o = eval { Storable::fd_retrieve $pipe } ) {
-                               if ( exists $o->{item} ) {
-                                       # stream of storable objects
-                                       push @{ $data->{items} }, $o->{item};
-                               } elsif ( exists $o->{data}->{items} ) {
-                                       # /tmp/mojofacets.*.storable
-                                       $data = $o->{data};
-                                       $data->{header} = $o->{header};
-                                       last;
-                               } else {
-                                       warn "SKIP ",dump($o);
-                               }
-                       }
-                       close($pipe);
-                       warn "loaded ", $#{ $data->{items} } + 1, " items from $full_path\n";
-                       $data->{generated}++;
-               } elsif ( $full_path =~ m/.csv/i ) {
-                       $data = MojoFacets::Import::CSV->new( full_path => $full_path )->data;
-               } elsif ( $full_path =~ m/.sql/i ) {
-                       $data = MojoFacets::Import::SQL->new( full_path => $full_path )->data;
-               } elsif ( $full_path =~ m/.couchdb/i ) {
-                       $data = MojoFacets::Import::CouchDB->new( full_path => $full_path )->data;
-               } else {
-                       $data = MojoFacets::Import::File->new( full_path => $full_path, path => $path )->data;
-               }
-       } elsif ( -d $full_path && $full_path =~ m/.html/ ) {
-               $data = MojoFacets::Import::HTMLTable->new( dir => $full_path )->data;
+       if ( my $module = import_module( $full_path ) ) {
+               $data = $module->new( full_path => $full_path )->data;
        } else {
                die "can't load $full_path";
        }
@@ -265,9 +267,7 @@ sub _load_path {
 sub load {
        my $self = shift;
 
-       my $path = $self->param('path') || return $self->redirect_to( '/data/index' );
-
-       my @paths = $self->param('paths');
+       my @paths = @{ $self->every_param('paths') };
        warn "# paths ", dump @paths;
 
        foreach my $p ( keys %$loaded ) {
@@ -278,6 +278,8 @@ sub load {
 
        $self->_load_path( $_ ) foreach @paths;
 
+       my $path = $self->param('path') || $self->session('path') || $paths[0] || $self->redirect_to('/data/index');
+
        warn "# path $path\n";
        $self->_load_path( $path );
 
@@ -357,12 +359,12 @@ sub _checked {
 sub _permanent_path {
        my $self = shift;
        my $path = $self->_param_or_session('path');
-       $self->app->home->rel_dir('data') . '/' . join('.', $path, @_);
+       $self->app->home->rel_file('data') . '/' . join('.', $path, @_);
 }
 
 sub __unac {
        my $n = shift;
-       $n = unac_string($n);
+       $n = unac_string('utf-8',$n);
        $n =~ s/\W+/_/g;
        return $n;
 }
@@ -383,7 +385,7 @@ sub _export_path {
                warn "no path in param or session";
                return;
        }
-       my $dir = $self->app->home->rel_dir('public') . "/export/$path";
+       my $dir = $self->app->home->rel_file('public') . "/export/$path";
        mkpath $dir unless -e $dir;
        my $name = __export_path_name( $path, @_ );
        my $full = $dir . '/' . $name;
@@ -459,7 +461,7 @@ sub columns {
 sub _param_array {
     my ($self,$name) = @_;
 
-       my @array = $self->param($name);
+       my @array = @{ $self->every_param($name) };
        my $path  = $self->session('path');
 
        if ( @array ) {
@@ -489,8 +491,11 @@ sub _param_scalar {
 
        if ( ! defined $scalar ) {
                $scalar = $default;
-               die "no default for $name" unless defined $scalar;
-               $self->session($name => $scalar);
+               if ( defined $scalar ) {
+                       $self->session($name => $scalar);
+               } else {
+                       warn "no default for $name";
+               }
        }
 
        warn "# _param_scalar $name ",dump $scalar;
@@ -501,7 +506,7 @@ sub filter {
        my $self = shift;
 
        my $name = $self->param('filter_name') || die "name?";
-       my @vals = $self->param('filter_vals');
+       my @vals = @{ $self->every_param('filter_vals') };
 
        $self->_remove_filter( $name );
        if ( @vals ) {
@@ -649,8 +654,16 @@ sub __commit_end {
 
 sub lookup {
        warn "# lookup ",dump @_;
-       my ( $vals, $on_path, $on_col, $code ) = @_;
+       my ( $vals, $on_path, $on_col, $code, $stat_code ) = @_;
        die "code is not sub{ ... } but ", dump $code unless ref $code eq 'CODE';
+
+       if ( ! exists $loaded->{$on_path} ) {
+               my @possible_paths = grep { /\Q$on_path\E/ } keys %$loaded;
+               die "more than one dataset available for '$on_path' ",dump @possible_paths if $#possible_paths > 0;
+               $on_path = shift @possible_paths;
+               warn "## fuzzy selected path $on_path";
+       }
+
        my $items = $loaded->{$on_path}->{data}->{items} || die "no items for $on_path";
 
        if ( ! exists $lookup_path_col->{$on_path}->{$on_col} ) {
@@ -670,15 +683,19 @@ sub lookup {
                                }
                        }
                }
-               warn dump $lookup_path_col->{$on_path}->{$on_col};
+               warn "XXX ",dump $lookup_path_col->{$on_path}->{$on_col} if $ENV{DEBUG};
        }
 
-       foreach my $v ( @$vals ) {
+       my $stat;
+       $stat = Statistics::Descriptive::Full->new() if $stat_code;
+
+       foreach my $v ( ref $vals eq 'ARRAY' ? @$vals : ( $vals ) ) {
                foreach my $i ( @{ $lookup_path_col->{$on_path}->{$on_col}->{$v} } ) {
                        $on = $items->[$i];
-                       warn "# lookup code $v $i ",dump $on;
-                       $code->();
+                       warn "XXX lookup code $v $i ",dump $on if $ENV{DEBUG};
+                       $code->($stat);
                }
+               $stat_code->( $stat ) if $stat_code;
        }
 }
 
@@ -799,6 +816,9 @@ sub items {
        $code =~ s{\r}{}gs;
        $code =~ s{\n+$}{\n}s;
 
+       # XXX convert @row->{foo} into @{$row->{foo}}
+       $code =~ s|\@(row->\{[^}]+\})|\@{\$$1}|gs;
+
        my $commit = $self->param('commit');
        my $test = $self->param('test');
 
@@ -808,7 +828,7 @@ sub items {
        if ( $code && ( $test || $commit ) ) {
                # XXX find columns used in code snippet and show them to user
                my $order = 0;
-               foreach my $column ( $code =~ m/\$row->{([^}]+)}/g ) {
+               foreach my $column ( $code =~ m/\$row->\{([^}]+)\}/g ) {
                        if ( $column =~ s/^(['"])// ) {
                                $column =~ s/$1$//;
                        }
@@ -817,9 +837,11 @@ sub items {
                }
        }
 
-       my $code_path = $self->app->home->rel_dir('public') . "/code";
+       my $code_path = $self->app->home->rel_file('public') . "/code";
        if ( $commit ) {
 
+               __path_modified( $path, 'commit' );
+
                warn "# commit on ", $#$filtered + 1, " items:\n$code\n";
                ( $key, $value, $out ) = ( 'key', 'value' );
                foreach ( 0 .. $#$filtered ) {
@@ -972,7 +994,7 @@ sub items {
                warn "# sorted_items ", $#$sorted_items + 1, " offset $offset limit $limit order $sort";
 
                my $depends_on;
-               my $tmp = $code; $tmp =~ s/\$row->{(['"]?)([\w\s]+)\1/$depends_on->{$2}++/gse;
+               my $tmp = $code; $tmp =~ s/\$row->\{(['"]?)([\w\s]+)\1/$depends_on->{$2}++/gse;
                warn "# depends_on ",dump $depends_on;
 
                my $test_added = Storable::dclone $test_changed;
@@ -1275,7 +1297,7 @@ sub save {
 sub export {
        my $self = shift;
 
-       my $dir = $self->app->home->rel_dir('public');
+       my $dir = $self->app->home->rel_file('public');
 
        if ( my $import = $self->param('import') ) {
 
@@ -1315,6 +1337,14 @@ sub __loaded_paths {
                keys %$loaded;
 }
 
+sub reload {
+       my $self = shift;
+       $self->stash( reload => 1 );
+       $self->remove;
+#      $self->_load_path( $self->param('path') );
+       $self->redirect_to('/data/load?path=' . $self->param('path') );
+}
+
 sub remove {
        my $self = shift;
        my $path = $self->param('path');
@@ -1328,6 +1358,7 @@ sub remove {
        } else {
                warn "WARNING: $path unlink ignored";
        }
+       return if $self->stash('reload');
        return $self->redirect_to( '/data/load' );
 }