php IIS日志分析搜索引擎爬虫记录程序
作者:bea
使用注意: 修改iis.php文件中iis日志的绝对路径 例如:$folder=”c:/windows/system32/logfiles/站点日志目录/”;//后面记得一定要带斜杠(/)。 (用虚拟空间的不懂查看你的站点绝对路径?上传个探针查看! 直接查看法:http://站点域名/iis.php 本地查看法:把日志下载到本地http://127.0.0.1/iis.php) 注意: //站点日志目录,注意该目录必须要有站点用户读取权限! /
使用注意:
修改iis.php文件中iis日志的绝对路径
例如:$folder=”c:/windows/system32/logfiles/站点日志目录/”; //后面记得一定要带斜杠(/)。
( 用虚拟空间的不懂查看你的站点绝对路径?上传个探针查看!
直接查看法:http://站点域名/iis.php
本地查看法:把日志下载到本地 http://127.0.0.1/iis.php )
注意:
//站点日志目录,注意该目录必须要有站点用户读取权限!
//如果把日志下载到本地请修改143行的网址为您网站的网址,此操作不是必要操作,不影响分析结果。
//修改文件名称iis.php 需要同时修改对应代码 ctrl+h 把 iis.php全部替换成您要修改的文件名 否则程序运行出错。
//如果iis日志文件过大,可能会导致程序超时!同时也不建议大家使用!
以下是PHP源代码:
[code]
<?php
/*
牛仔IIS日志蜘蛛爬行记录分析器 V1.1(PHP GB2312 版)
作者:牛仔
QQ:172379201
Email:17gd@163.com
*/
//===================================================
header("content-type:text/html; charset=gb2312");
//站点日志目录,注意该目录必须要有站点用户读取权限!
$folder="C:/WINDOWS/system32/LogFiles/W3SVC1155699908/";//后面记得一定要带斜杠!
$pagesize = 25;//设置分页显示条数!
//=========================
$type = addslashes($_GET['type']);
if ($type)$type = base64_decode($type);
$showfile = addslashes($_GET['showfile']);
$page = addslashes($_GET['page']);
if (!$page)$page=1;
//============================
//打开目录
if (!$type){
if (file_exists($folder))
{
$fp=opendir($folder);
while(false!=$file=readdir($fp))
{
if($file!='.' &&$file!='..')
{
$file="$file";
$arr_file[]=$file;
}
}
if(is_array($arr_file))
{
for ($i=count($arr_file)-1;$i>=0;$i--)
{
$indexstr.="<tr><td height="25" width="25%">".date("Y-m-d",filectime($folder.$arr_file[$i]))."</td>
<td height="25" width="25%" align="center"><a href="iisfile.php?type=".base64_encode(Baiduspider)."&showfile=".$arr_file[$i]."">百度(Baidu)</a></td>
<td height="25" width="25%" align="center"><a href="iisfile.php?type=".base64_encode(Googlebot)."&showfile=".$arr_file[$i]."">谷歌(Google)</a></td>
<td height="25" width="25%" align="center"><a href="iisfile.php?type=".base64_encode(yahoo)."&showfile=".$arr_file[$i]."">雅虎(yahoo)</a></td></tr>";
}
}
closedir($fp);
$html = indexhtml();
$copy = mycopy();
$html = str_replace("[showlog]",$indexstr,$html);
$html = str_replace("[copy]",$copy,$html);
echo $html;
}else{
echo "该日志目录不存在或权限不足,请检查设置!";
exit();
}
}elseif ($type=='Baiduspider'){
echo show($type,$folder,$showfile,$page,$pagesize);
}elseif ($type=='Googlebot'){
echo show($type,$folder,$showfile,$page,$pagesize);
}elseif ($type=='yahoo'){
echo show($type,$folder,$showfile,$page,$pagesize);
}
function show($type,$folder,$showfile,$page,$pagesize)
{
if ($type=='Baiduspider')
{
$title='百度';
}elseif ($type=='Googlebot'){
$title='谷歌';
}elseif ($type=='yahoo'){
$title='雅虎';
}
if ($type&&$folder&&$showfile)
{
if(file_exists($folder.$showfile))
{
$fp= fopen($folder.$showfile,"r");
}else{
echo "该日志文件不存在,请检查设置!";
exit;
}
$j=0;
$y=0;
$t=0;
$h=0;
while (!feof($fp))
{
$str = fgets($fp);
$str =iconv("UTF-8","GB2312//IGNORE",$str);
if(strpos($str,$type))
{
$j++;
$temp[].=$str;
$tmpcount = explode(" ",$str);
if ($tmpcount[11]==200)$t++;
if ($tmpcount[11]==304)$h++;
if ($tmpcount[11]==404)$y++;
}
}
fclose($fp);
$count = count($temp);
if ($page==1)
{
$countshow=$count;
$mynum = $count-$pagesize;
}else{
$countshow =$count-($page*$pagesize-$pagesize);
$mynum = $count-$page*$pagesize;
}
$pagecount =ceil(count($temp) / $pagesize);
if ($page>=$pagecount)
{
$mynum = $pagecount;
}
$m=0;
for ($i=$countshow-1;$i>=$mynum;$i--)
{
$num = explode(" ",$temp[$i]);
$show.="
<tr>
<td heigth"20">".$num[0]." ".$num[1]."</td>
<td>".$num[9]."</td>
<td><a href="".rawurlencode($num[5])."" target="_blank">".$num[5]."</a></td>
<td>".$num[11]."</td>
</tr>";
}
unset($temp);
$showpage = "<td colspan="4" height="30" align="center">每页 ".$pagesize." 条 当前".$page."/$pagecount";
$showpage.=" <a href="?type=".base64_encode($type)."&showfile=".$showfile."">首页</a>";
if ($page!=1)
{
$showpage.=" <a href="?type=".base64_encode($type)."&showfile=".$showfile."&page=".($page-1)."">上一页</a>";
}
if ($page!=$pagecount)
{
$showpage.=" <a href="?type=".base64_encode($type)."&showfile=".$showfile."&page=".($page+1)."">下一页</a>";
$weei = " <a href="?type=".base64_encode($type)."&showfile=".$showfile."&page=".($pagecount)."">尾页</a>";
}
$showpage.=$weei."</td>";
if ($show)
{
$html = pagehtml();
$copy = mycopy();
$htmltitle = "牛仔IIS日志蜘蛛爬行记录分析器-";//请保留,谢谢!
$html = str_replace("[title]",$title,$html);
$html = str_replace("[htmltitle]",$htmltitle,$html);
$html = str_replace("[show]",$show,$html);
$html = str_replace("[count]",$j,$html);
$html = str_replace("
1
2
下一页
阅读全文
有用 | 无用
修改iis.php文件中iis日志的绝对路径
例如:$folder=”c:/windows/system32/logfiles/站点日志目录/”; //后面记得一定要带斜杠(/)。
( 用虚拟空间的不懂查看你的站点绝对路径?上传个探针查看!
直接查看法:http://站点域名/iis.php
本地查看法:把日志下载到本地 http://127.0.0.1/iis.php )
注意:
//站点日志目录,注意该目录必须要有站点用户读取权限!
//如果把日志下载到本地请修改143行的网址为您网站的网址,此操作不是必要操作,不影响分析结果。
//修改文件名称iis.php 需要同时修改对应代码 ctrl+h 把 iis.php全部替换成您要修改的文件名 否则程序运行出错。
//如果iis日志文件过大,可能会导致程序超时!同时也不建议大家使用!
以下是PHP源代码:
[code]
<?php
/*
牛仔IIS日志蜘蛛爬行记录分析器 V1.1(PHP GB2312 版)
作者:牛仔
QQ:172379201
Email:17gd@163.com
*/
//===================================================
header("content-type:text/html; charset=gb2312");
//站点日志目录,注意该目录必须要有站点用户读取权限!
$folder="C:/WINDOWS/system32/LogFiles/W3SVC1155699908/";//后面记得一定要带斜杠!
$pagesize = 25;//设置分页显示条数!
//=========================
$type = addslashes($_GET['type']);
if ($type)$type = base64_decode($type);
$showfile = addslashes($_GET['showfile']);
$page = addslashes($_GET['page']);
if (!$page)$page=1;
//============================
//打开目录
if (!$type){
if (file_exists($folder))
{
$fp=opendir($folder);
while(false!=$file=readdir($fp))
{
if($file!='.' &&$file!='..')
{
$file="$file";
$arr_file[]=$file;
}
}
if(is_array($arr_file))
{
for ($i=count($arr_file)-1;$i>=0;$i--)
{
$indexstr.="<tr><td height="25" width="25%">".date("Y-m-d",filectime($folder.$arr_file[$i]))."</td>
<td height="25" width="25%" align="center"><a href="iisfile.php?type=".base64_encode(Baiduspider)."&showfile=".$arr_file[$i]."">百度(Baidu)</a></td>
<td height="25" width="25%" align="center"><a href="iisfile.php?type=".base64_encode(Googlebot)."&showfile=".$arr_file[$i]."">谷歌(Google)</a></td>
<td height="25" width="25%" align="center"><a href="iisfile.php?type=".base64_encode(yahoo)."&showfile=".$arr_file[$i]."">雅虎(yahoo)</a></td></tr>";
}
}
closedir($fp);
$html = indexhtml();
$copy = mycopy();
$html = str_replace("[showlog]",$indexstr,$html);
$html = str_replace("[copy]",$copy,$html);
echo $html;
}else{
echo "该日志目录不存在或权限不足,请检查设置!";
exit();
}
}elseif ($type=='Baiduspider'){
echo show($type,$folder,$showfile,$page,$pagesize);
}elseif ($type=='Googlebot'){
echo show($type,$folder,$showfile,$page,$pagesize);
}elseif ($type=='yahoo'){
echo show($type,$folder,$showfile,$page,$pagesize);
}
function show($type,$folder,$showfile,$page,$pagesize)
{
if ($type=='Baiduspider')
{
$title='百度';
}elseif ($type=='Googlebot'){
$title='谷歌';
}elseif ($type=='yahoo'){
$title='雅虎';
}
if ($type&&$folder&&$showfile)
{
if(file_exists($folder.$showfile))
{
$fp= fopen($folder.$showfile,"r");
}else{
echo "该日志文件不存在,请检查设置!";
exit;
}
$j=0;
$y=0;
$t=0;
$h=0;
while (!feof($fp))
{
$str = fgets($fp);
$str =iconv("UTF-8","GB2312//IGNORE",$str);
if(strpos($str,$type))
{
$j++;
$temp[].=$str;
$tmpcount = explode(" ",$str);
if ($tmpcount[11]==200)$t++;
if ($tmpcount[11]==304)$h++;
if ($tmpcount[11]==404)$y++;
}
}
fclose($fp);
$count = count($temp);
if ($page==1)
{
$countshow=$count;
$mynum = $count-$pagesize;
}else{
$countshow =$count-($page*$pagesize-$pagesize);
$mynum = $count-$page*$pagesize;
}
$pagecount =ceil(count($temp) / $pagesize);
if ($page>=$pagecount)
{
$mynum = $pagecount;
}
$m=0;
for ($i=$countshow-1;$i>=$mynum;$i--)
{
$num = explode(" ",$temp[$i]);
$show.="
<tr>
<td heigth"20">".$num[0]." ".$num[1]."</td>
<td>".$num[9]."</td>
<td><a href="".rawurlencode($num[5])."" target="_blank">".$num[5]."</a></td>
<td>".$num[11]."</td>
</tr>";
}
unset($temp);
$showpage = "<td colspan="4" height="30" align="center">每页 ".$pagesize." 条 当前".$page."/$pagecount";
$showpage.=" <a href="?type=".base64_encode($type)."&showfile=".$showfile."">首页</a>";
if ($page!=1)
{
$showpage.=" <a href="?type=".base64_encode($type)."&showfile=".$showfile."&page=".($page-1)."">上一页</a>";
}
if ($page!=$pagecount)
{
$showpage.=" <a href="?type=".base64_encode($type)."&showfile=".$showfile."&page=".($page+1)."">下一页</a>";
$weei = " <a href="?type=".base64_encode($type)."&showfile=".$showfile."&page=".($pagecount)."">尾页</a>";
}
$showpage.=$weei."</td>";
if ($show)
{
$html = pagehtml();
$copy = mycopy();
$htmltitle = "牛仔IIS日志蜘蛛爬行记录分析器-";//请保留,谢谢!
$html = str_replace("[title]",$title,$html);
$html = str_replace("[htmltitle]",$htmltitle,$html);
$html = str_replace("[show]",$show,$html);
$html = str_replace("[count]",$j,$html);
$html = str_replace("
1
2
下一页
阅读全文
有用 | 无用
猜你喜欢
您可能感兴趣的文章:
- php查看session内容的函数
- php 缓存函数代码
- php 中文处理函数集合
- 常用的php对象类型判断
- phpMyAdmin2.11.6安装配置方法
- PHP6 先修班 JSON实例代码
- php的curl实现get和post的代码
- PHP Smarty生成EXCEL文档的代码
- php过滤危险html代码
- php htmlentities和htmlspecialchars 的区别
- php magic_quotes_gpc的一点认识与分析
- php数组应用之比较两个时间的相减排序
- php中的数组操作函数整理
- PHP去除数组中重复的元素并按键名排序函数
- 删除数组元素实用的PHP数组函数
- PHP 数组实例说明
- PHP获取网站域名和地址的代码
- php-5.2下php.ini 中文版配置说明
- 继续收藏一些PHP常用函数