PHP 抓取新浪读书频道的小说并生成txt电子书的代码
作者:bea
代码如下: /* Author: Yang Yu <yangyu@sina.cn> */ //想看什么电子书,先去新浪读书搜索,然后填入对应的参数即可 //http://vip.book.sina.com.cn/ //电子书参数 $array_book[0] = 38884; //小说id $array_book[1] = 22172; //章节起始id $array_book[2] = 32533; //章节结束id $array_book[3
代码如下:
/* Author: Yang Yu <yangyu@sina.cn> */
//想看什么电子书,先去新浪读书搜索,然后填入对应的参数即可
//http://vip.book.sina.com.cn/
//电子书参数
$array_book[0] = 38884; //小说id
$array_book[1] = 22172; //章节起始id
$array_book[2] = 32533; //章节结束id
$array_book[3] = '中国特种部队生存实录:狼牙'; //小说名字
//匹配参数
$title_pre = "/<h1>(.*?)</h1>/"; //标题部分
$contents_pre = "/<div id="contTxt" class="contTxt1">(.*?)</div>/"; //内容部分
//生成电子书
for( $i = $array_book[1]; $i <= $array_book[2]; $i++){
$url = "http://vip.book.sina.com.cn/book/chapter_{$array_book[0]}_{$i}.html";
$html = file_get_contents($url);
preg_match_all($title_pre,$html,$title);
preg_match_all($contents_pre,$html,$contents);
$fh = fopen($array_book[3].'.txt','a+');
$write_contents = $title[1][0]."
".str_replace('</p>',"
",str_replace('<p>',' ',$contents[1][0]))."
";
if( fwrite($fh,$write_contents) ){
echo '第'.$i.'节抓取完毕< /br>';
}
fclose($fh);
}
有用 | 无用
猜你喜欢
您可能感兴趣的文章:
- php 操作excel文件的方法小结
- PHP编程过程中需要了解的this,self,parent的区别
- php 学习笔记
- 用php实现让页面只能被百度gogole蜘蛛访问的方法
- PHP类的使用 实例代码讲解
- php 多线程上下文中安全写文件实现代码
- PHP 获取目录下的图片并随机显示的代码
- phpMyAdmin链接MySql错误 个人解决方案
- php 需要掌握的东西 不做浮躁的人
- php 文章采集正则代码
- PHP array_push 数组函数
- PHP simple_html_dom.php+正则 采集文章代码
- 在PHP中检查PHP文件是否有语法错误的方法
- php 常用类整理
- PHP 源代码压缩小工具
- php 8小时时间差的解决方法小结
- PHP 分页原理分析,大家可以看看
- c#中的实现php中的preg_replace
- php 空格,换行,跳格使用说明