亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來到蟲蟲下載站! | ?? 資源下載 ?? 資源專輯 ?? 關于我們
? 蟲蟲下載站

?? make_reports.pl

?? 網絡爬蟲開源代碼
?? PL
字號:
#!/usr/bin/env perl# make_reports.pl## Generates very close approximations of the standard Heritrix# crawl reports directly from the crawl log.## Useful if Heritrix ends uncleanly and is unable to create them itself## requires:#   Date::Calc module#   (or just comment out the two lines with "Delta_DHMS" if time calculation isn't needed in crawl-report.txt)## usage:#   make_reports.pl <crawl.log>## files created:#   ./crawl-report.txt.new#   ./hosts-report.txt.new#   ./mimetype-report.txt.new#   ./responsecode-report.txt.new#   ./seeds-report.txt.new#   ./badloglines.log (where unparseable lines go)use strict;use Date::Calc qw( Delta_DHMS );open( CRAWL, $ARGV[0] ) or die "Can\'t open specified crawl.log.\n$!";my $starttime;my $currenttime;my $doccount = 0;my $hosts;my $mimes;my $responses;my $seedresponses;my $totalsize = 0;open( BADLINES, ">badloglines.log" ) or die "Can't create badloglines.log in current directory\n$!";while ( my $line = <CRAWL> ) {  my (    $time, $result, $size,   $url,  $hoppath,   $refer,    $mime, $thread, $dltime, $sha1, $sourcetag, $annot,    $overflow    )    = split /\s+/, $line;# if there are more or less than 11 fields, one of the fields has a space in it, so skip parsing it  if ( ( $overflow ne "" ) || ( $annot eq "" ) ) {    print BADLINES $line;    next;  }  # get first line's time  if ( $. == 1 ) {    $starttime = $time;  }  # else get the time of the current line, in case this is the last line  else {    $currenttime = $time;  }  my ($host) = ( $url =~ m|://(.+?)[:/]| );  next unless ($host);  $seedresponses->{$url} = $result if ( $hoppath eq "-" );  # if not a fetching error  if ( $result > 0 ) {    $hosts->{$host}{count}++;    $hosts->{$host}{size} += $size;    $mimes->{$mime}{count}++;    $mimes->{$mime}{size} += $size;    $responses->{$result}{count}++;    $totalsize += $size;  }  if ( $result >= 200 && $result <= 399 ) {    $doccount++;  }}my $htotalsize = sprintf("%.2f", $totalsize/1024/1024/1024); #determine time taken for crawlmy ( $syear, $smonth, $sday, $shour, $smin, $ssec, $sms );( $syear, $smonth, $sday, $shour, $smin, $ssec, $sms ) =  ( $starttime =~ /(....)-(..)-(..)T(..):(..):(..).(...)Z/ );if (!defined $syear) {  ( $syear, $smonth, $sday, $shour, $smin, $ssec, $sms ) =  ( $starttime =~ /(....)(..)(..)(..)(..)(..)(...)/ );}  my ( $eyear, $emonth, $eday, $ehour, $emin, $esec, $ems ); ( $eyear, $emonth, $eday, $ehour, $emin, $esec, $ems ) =  ( $currenttime =~ /(....)-(..)-(..)T(..):(..):(..).(...)Z/ );if (!defined $eyear) {  ( $eyear, $emonth, $eday, $ehour, $emin, $esec, $ems ) =  ( $currenttime =~ /(....)(..)(..)(..)(..)(..)(...)/ );}my ( $days, $hours, $minutes, $seconds ) = Delta_DHMS(  $syear, $smonth, $sday, $shour, $smin, $ssec,  $eyear, $emonth, $eday, $ehour, $emin, $esec);print_crawl_report();print_hosts_report();print_mimetype_report();print_response_report();print_seeds_report();sub print_crawl_report {  open( NEWCRAWL, "> crawl-report.txt.new" ) or die $!;  print NEWCRAWL "Duration Time: ", ( $days * 24 ) + $hours,    "h${minutes}m${seconds}s\n";  print NEWCRAWL "Total Hosts Crawled: ", scalar keys %$hosts, "\n";  print NEWCRAWL "Total Documents Crawled: ",      $doccount,  "\n";  print NEWCRAWL "Total Raw Data Size in Bytes: $totalsize ($htotalsize GB)\n";  close NEWCRAWL;}sub print_hosts_report {  open( NEWHOSTS, "> hosts-report.txt.new" ) or die $!;  print NEWHOSTS "[#urls] [#bytes] [host]\n";  # sort from most frequent to least frequent host  my @sortedhosts =    sort { $hosts->{$b}{count} <=> $hosts->{$a}{count} } keys %$hosts;  foreach my $host (@sortedhosts) {    printf NEWHOSTS ("%s %s %s\n",      $hosts->{$host}{count},      $hosts->{$host}{size},      $host    );  }}sub print_mimetype_report {  open( NEWMIMES, "> mimetype-report.txt.new" ) or die $!;  print NEWMIMES "[#urls] [#bytes] [mime-types]\n";  # sort from most frequent to least frequent mime-type  my @sortedmimes =    sort { $mimes->{$b}{count} <=> $mimes->{$a}{count} } keys %$mimes;  foreach my $mime (@sortedmimes) {    printf NEWMIMES ("%s %s %s\n",      $mimes->{$mime}{count},      $mimes->{$mime}{size},      $mime    );  }}sub print_response_report {  open( NEWRESPONSES, "> responsecode-report.txt.new" ) or die $!;  print NEWRESPONSES "[rescode] [#urls]\n";  # sort from most frequent to least frequent response code  my @sortedresps =    sort { $responses->{$b}{count} <=> $responses->{$a}{count} }    keys %$responses;  foreach my $res (@sortedresps) {    printf NEWRESPONSES ( "%s %s\n", $res, $responses->{$res}{count} );  }}sub print_seeds_report {  open( NEWSEEDS, "> seeds-report.txt.new" ) or die $!;  # sort urls by response code, then by url  my @sortedurls =    sort { $seedresponses->{$a} cmp $seedresponses->{$b} || $a cmp $b }    keys %$seedresponses;  print NEWSEEDS "[res-code] [status] [seeds]\n";  foreach my $url (@sortedurls) {    # if anything but a heritrix error    if ( $seedresponses->{$url} > 0 ) {      print NEWSEEDS "$seedresponses->{$url} CRAWLED $url\n";    }    else {      print NEWSEEDS "$seedresponses->{$url} NOTCRAWLED $url\n";    }  }}

?? 快捷鍵說明

復制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號 Ctrl + =
減小字號 Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
综合电影一区二区三区| 香蕉成人啪国产精品视频综合网| 懂色av中文字幕一区二区三区 | 九色综合国产一区二区三区| 国产成人亚洲综合a∨婷婷图片 | 久久欧美中文字幕| 亚洲婷婷在线视频| 久久99精品久久久久久国产越南| eeuss鲁片一区二区三区 | 精品影院一区二区久久久| 91丨九色porny丨蝌蚪| 久久久影院官网| 日韩av一级电影| 在线视频欧美区| 国产精品免费aⅴ片在线观看| 午夜日韩在线观看| 99久久国产综合精品麻豆| 亚洲精品在线电影| 日本女优在线视频一区二区| 欧美又粗又大又爽| 国产精品美女久久久久久久| 韩国欧美国产一区| 欧美高清精品3d| 亚洲精品免费看| av亚洲精华国产精华| 亚洲国产精品二十页| 国产不卡视频在线播放| 久久综合成人精品亚洲另类欧美 | 欧美乱熟臀69xxxxxx| 国产欧美日韩精品一区| 久久99在线观看| 欧美三级午夜理伦三级中视频| 中国av一区二区三区| 久久国产生活片100| 欧洲精品中文字幕| 一区二区免费看| 欧美制服丝袜第一页| 亚洲精品欧美专区| 欧美日韩一区二区在线观看视频 | 亚洲一区电影777| 91国产福利在线| 亚洲成av人片在线观看| 777奇米四色成人影色区| 日韩在线卡一卡二| 日韩精品自拍偷拍| 韩国av一区二区三区| 久久嫩草精品久久久精品一| 国产一区二区在线看| 亚洲国产精品传媒在线观看| 91老师片黄在线观看| 国产精品麻豆欧美日韩ww| 91丨porny丨首页| 亚洲图片欧美视频| 日韩亚洲欧美中文三级| 国产乱码精品1区2区3区| 国产精品久久久一本精品 | 在线免费一区三区| 亚洲国产日韩av| 日韩欧美激情在线| 国产成人精品在线看| 亚洲人成小说网站色在线 | 欧美二区三区的天堂| 精品午夜久久福利影院| 国产精品―色哟哟| 欧美日韩卡一卡二| 狠狠色丁香婷综合久久| 中文av一区特黄| 欧美日韩精品欧美日韩精品 | 五月激情丁香一区二区三区| 日韩视频免费观看高清完整版 | 在线播放中文一区| 狠狠久久亚洲欧美| 亚洲日本丝袜连裤袜办公室| 欧美乱妇23p| 国产suv精品一区二区三区| 亚洲精品一二三区| 久久久国产一区二区三区四区小说 | 日韩中文字幕亚洲一区二区va在线 | 久久国内精品自在自线400部| 国产欧美一区二区精品忘忧草| 91福利精品视频| 理论片日本一区| 亚洲日本欧美天堂| 精品久久久久久久久久久院品网 | 有坂深雪av一区二区精品| 在线播放中文一区| 91麻豆精品在线观看| 久久精品国产免费看久久精品| 亚洲精品成人少妇| 国产亚洲自拍一区| 欧美精品成人一区二区三区四区| 99久久国产免费看| 极品瑜伽女神91| 亚洲不卡一区二区三区| 久久精品视频一区| 日韩天堂在线观看| 欧美伊人久久大香线蕉综合69| 国产精品一区二区男女羞羞无遮挡 | 久久久久国产精品麻豆ai换脸| 欧美日韩国产另类不卡| 91亚洲精华国产精华精华液| 精品夜夜嗨av一区二区三区| 五月天激情综合| 亚洲最新视频在线播放| 国产精品美女www爽爽爽| 精品国产伦一区二区三区观看方式| 欧美日韩一区二区三区高清| av电影在线观看完整版一区二区| 国产精品亚洲人在线观看| 青青草成人在线观看| 亚洲成人动漫在线免费观看| 亚洲午夜一区二区三区| 亚洲最新在线观看| 亚洲综合在线五月| 亚洲美女偷拍久久| 一区二区视频免费在线观看| 国产精品成人网| 国产精品女同互慰在线看| 国产精品污污网站在线观看| 国产日产欧美一区| 欧美精品一区二区三区一线天视频 | 在线不卡a资源高清| 欧美日韩一级大片网址| 在线亚洲人成电影网站色www| 99re这里只有精品6| 99久久久精品| 欧美亚洲愉拍一区二区| 色就色 综合激情| 欧美日韩中文字幕一区| 欧美日韩国产高清一区二区三区| 欧美日本在线播放| 337p亚洲精品色噜噜噜| 日韩欧美国产一区在线观看| 欧美mv和日韩mv的网站| 精品国产麻豆免费人成网站| 国产欧美综合在线观看第十页| 中文字幕免费观看一区| 亚洲欧美色一区| 午夜激情一区二区三区| 青青国产91久久久久久| 国内精品写真在线观看| 丁香激情综合国产| 色一情一乱一乱一91av| 精品视频1区2区3区| 日韩欧美一二区| 国产日韩欧美精品综合| 一区二区日韩av| 五月激情综合色| 韩国一区二区三区| 色悠悠久久综合| 欧美精品久久久久久久多人混战 | 亚洲精品国产一区二区三区四区在线| 亚洲欧美一区二区久久| 日韩高清在线观看| 九九**精品视频免费播放| 国产成人精品综合在线观看| 91九色最新地址| 91精品国产色综合久久不卡蜜臀| 久久久久久久久伊人| 一区二区三区日本| 精品一区二区在线观看| youjizz久久| 精品国产污网站| 最近日韩中文字幕| 美女在线视频一区| 在线视频你懂得一区| 久久婷婷国产综合国色天香| 一区二区三区波多野结衣在线观看| 免费成人小视频| 91在线播放网址| 精品欧美一区二区三区精品久久| 一区二区在线观看免费视频播放 | 欧美一区二区黄色| 国产女人aaa级久久久级| 日韩av在线发布| 一本大道av一区二区在线播放 | 欧美精品在线一区二区三区| 国产日产欧产精品推荐色| 日韩高清在线电影| 欧美无乱码久久久免费午夜一区| 国产偷国产偷亚洲高清人白洁 | 欧美视频一区二区三区| 欧美激情自拍偷拍| 狠狠色伊人亚洲综合成人| 欧美三级中文字幕| 亚洲免费av高清| 成人精品gif动图一区| 欧美va在线播放| 日本成人在线看| 91精品国产麻豆| 亚洲香肠在线观看| 色综合天天天天做夜夜夜夜做| 国产性色一区二区| 国产一区二区福利| 日韩精品在线网站| 五月天一区二区三区| 欧美色图片你懂的| 亚洲一区二区三区四区在线免费观看 | 欧美精品v国产精品v日韩精品 | 天天av天天翘天天综合网|