always restart gnt-monitor
[gnt-info] / gnt-monitor
1 #!/usr/bin/perl
2 use warnings;
3 use strict;
4 use autodie;
5 use POSIX;
6
7 my $DEBUG = $ENV{DEBUG} || 0;
8 my $INFLUX = 'http://10.60.0.89:8186/write';
9 my $INTERVAL = $ENV{INTERVAL} || 1;
10
11 my $node = `hostname -s`;
12 chomp $node;
13
14 use Data::Dump;
15 sub XXX { $DEBUG ? warn "XXX ",Data::Dump::dump( @_ ) : {} };
16
17 my $stat;
18 my $last;
19
20 while(1) {
21
22 my $skip;
23
24 foreach my $instance ( glob '/var/run/ganeti/kvm-hypervisor/pid/*' ) {
25
26         open(my $fh, '<', $instance);
27         my $pid = <$fh>; chomp $pid;
28
29         $instance =~ s{^.*/}{};
30
31         if ( ! -d "/proc/$pid" ) {
32                 $skip->{$instance}++;
33                 XXX $skip;
34                 next;
35         }
36
37         my $vcpu = $last->{$instance}->{vcpu};
38
39         if ( ! $vcpu ) {
40                 foreach my $fd ( glob "/proc/$pid/fd/*" ) {
41                         $vcpu++ if -l $fd && readlink($fd) =~ m/kvm-vcpu/;
42                 }
43
44                 $last->{$instance}->{vcpu} = $vcpu;
45         }
46
47         # https://www.kernel.org/doc/Documentation/filesystems/proc.txt
48         open($fh, '<', "/proc/$pid/stat");
49         my $line = <$fh>; chomp $line;
50         my $gtime = (split(/\s+/,$line))[42]; # guest time of the task in jiffies
51
52         if ( my $last_gtime = $last->{$instance}->{gtime} ) {
53                 my $clock_ticks = POSIX::sysconf( &POSIX::_SC_CLK_TCK ); # clock ticks per second
54
55                 my $cpu = ( ( $gtime - $last_gtime ) * 100 ) / ( $clock_ticks * $vcpu );
56                 $stat->{$instance}->{cpu} = $cpu;
57         }
58
59         $last->{$instance}->{gtime} = $gtime;
60 }
61                 
62
63 foreach my $glob ( glob '/var/run/ganeti/instance-disks/*' ) {
64         my ( $instance, $disk ) = split(/:/,$glob,2);
65         $instance =~ s{^.*/}{};
66
67         next unless exists $stat->{$instance};
68
69         my $dev = readlink $glob;
70         $dev =~ s{^.*dev/}{};
71
72         if ( ! -e "/sys/class/block/$dev" ) {
73                 $skip->{$instance}++;
74                 XXX $skip;
75                 next;
76         }
77
78         open( my $fh, '<', "/sys/class/block/$dev/stat" );
79         my $v = <$fh>; chomp $v; $v =~ s/^\s+//;
80         my @s = split(/\s+/, $v );
81         # https://www.kernel.org/doc/Documentation/block/stat.txt
82         my $d = {
83                 read_io => $s[0],
84                 read_bytes => $s[2] * 512,
85                 read_wait => $s[3],
86                 write_io => $s[4],
87                 write_bytes => $s[6] * 512,
88                 write_wait => $s[7],
89         };
90         if ( my $l = $last->{$instance}->{disk}->[$disk] ) {
91                 my $delta;
92                 $delta->{$_} = $d->{$_} - $l->{$_} foreach keys %$d;
93                 $stat->{$instance}->{disk}->[$disk] = $delta;
94                 $stat->{$instance}->{disk}->[$disk]->{dev} = $dev;
95                 $stat->{$instance}->{disk}->[$disk]->{disk} = $disk;
96         }
97         $last->{$instance}->{disk}->[$disk] = $d;
98
99 }
100
101 foreach my $full_instance ( glob '/var/run/ganeti/kvm-hypervisor/nic/*' ) {
102         my $instance = $full_instance;
103         $instance =~ s{^.*/}{};
104         next unless exists $stat->{$instance};
105
106         foreach my $nic ( glob "$full_instance/*" ) {
107                 open(my $fh, '<', $nic);
108                 my $dev = <$fh>;
109
110                 next unless -e "/sys/class/net/$dev";
111
112                 $nic =~ s{^.*/}{};
113
114                 my $d;
115
116                 foreach my $f (qw( rx_bytes tx_bytes rx_packets tx_packets )) {
117                         open( my $fh, '<', "/sys/class/net/$dev/statistics/$f" );
118                         my $v = <$fh>; chomp $v;
119                         $d->{$f} = $v;
120                 }
121                 if ( my $l = $last->{$instance}->{nic}->[$nic] ) {
122                         $stat->{$instance}->{nic}->[$nic]->{$_} = $d->{$_} - $l->{$_} foreach keys %$d;
123                         $stat->{$instance}->{nic}->[$nic]->{dev} = $dev;
124                         if ( -e "/sys/class/net/$dev/master" ) {
125                                 my $vlan = readlink "/sys/class/net/$dev/master";
126                                 $vlan =~ s/^.*br/br/;
127                                 $stat->{$instance}->{nic}->[$nic]->{vlan} = $vlan;
128                         }
129                 }
130                 $last->{$instance}->{nic}->[$nic] = $d;
131
132         }
133 }
134
135 XXX $stat;
136 #XXX $last;
137
138 open(my $fh, '>', '/dev/shm/ganeti-monitor.influx');
139
140 sub dump4influx {
141         my $hash = shift;
142         my $d = Data::Dump::dump( $hash );
143         $d =~ s/[\s\r\n]+//g;
144         $d =~ s/[\Q[]{}>\E]//g;
145         $d =~ s/=(\d+),/=$1i,/g;
146         $d =~ s/,+$//;
147         return $d;
148 }
149
150 foreach my $instance ( keys %$stat ) {
151
152         next if $skip->{$instance};
153
154         print $fh qq{cpu,node="$node",instance="$instance" cpu=}, $stat->{$instance}->{cpu}, "\n";
155
156         foreach my $disk ( @{ $stat->{$instance}->{disk} } ) {
157                 print $fh qq{disk,node="$node",instance="$instance" },dump4influx( $disk ), "\n";
158         }
159
160         foreach my $nic ( @{ $stat->{$instance}->{nic} } ) {
161                 print $fh qq{nic,node="$node",instance="$instance" },dump4influx( $nic ), "\n";
162         }
163
164 }
165
166 close($fh);
167
168 system q{curl -i -XPOST 'http://10.80.3.89:8086/write?db=ganeti' --data-binary '@/dev/shm/ganeti-monitor.influx'};
169
170
171 sleep $INTERVAL;
172 } #/while
173