全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 1433|回复: 13
打印 上一主题 下一主题

curl获取到内容后,怎么处理。。

[复制链接]
跳转到指定楼层
1#
发表于 2014-8-17 20:53:52 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
如题,按网上的例子,用curl获取到了内容后,不知道怎么进一步来处理

比如 $neirong 是用curl获取到的网页内容,但这个内容量太多了

我只想截取 $neirong 中以下部分


<div class="zhengwen"> 只想要这里的内容。。 </div>


这个截取代码用php该怎么写。。

只会些html,麻烦知道的大大给出具体的php代码
2#
发表于 2014-8-17 20:57:28 来自手机 | 只看该作者
preg_match('!.*\<div class="zhengwen"\>(.*)\<\/div\>.*!u',$neirong,$match);
echo $match['1'];
不知道对了没,本人菜鸟,
3#
发表于 2014-8-17 21:02:26 | 只看该作者
preg_match('|<div class="zhengwen">(.*)</div>|isU' , $neirong,$match);
echo $match['1'];

当然,个体情况还要具体分析
4#
 楼主| 发表于 2014-8-17 21:05:12 | 只看该作者
本帖最后由 muyang 于 2014-8-17 21:07 编辑

Notice: Undefined offset: 1 in G:\xamp\htdocs\123.php on line 20

楼上两位兄弟,这是啥错误,第20行,是那个echo $match['1'];



另:我直接echo $neirong; 到是不出错,是获取对像的整个网页。。
5#
发表于 2014-8-17 21:07:32 | 只看该作者
muyang 发表于 2014-8-17 21:05
Notice: Undefined offset: 1 in G:\xamp\htdocs\123.php on line 20

楼上两位兄弟,这是啥错误,第20行, ...

正则匹配不到吧。输出看看就知道了
6#
发表于 2014-8-17 21:09:40 来自手机 | 只看该作者
本帖最后由 h947136 于 2014-8-17 21:12 编辑
muyang 发表于 2014-8-17 21:05
Notice: Undefined offset: 1 in G:\xamp\htdocs\123.php on line 20

楼上两位兄弟,这是啥错误,第20行, ...


这是没有匹配到,试试var_dump($match);看看有没有匹配到

试试加上这个,curl_setopt($句柄, CURLOPT_RETURNTRANSFER,1 )
7#
发表于 2014-8-17 21:19:40 | 只看该作者
https://github.com/samacs/simple_html_dom
http://**blogs.com/eczhou/archive/2013/03/15/2961354.html

用这个class吧 咱以前用过还不错
8#
 楼主| 发表于 2014-8-17 21:20:35 | 只看该作者
获取到了,刚才是我少写了反斜杠好像,不过获取到的内容编码好像有错,是乱码

我直接输出$neirong到是没编码错误
9#
发表于 2014-8-17 21:37:50 来自手机 | 只看该作者
muyang 发表于 2014-8-17 21:20
获取到了,刚才是我少写了反斜杠好像,不过获取到的内容编码好像有错,是乱码

我直接输出$neirong到是没编 ...

header('Content-type:text/html;charset=utf-8');
//一般是utf-8,具体查看你的网页
10#
 楼主| 发表于 2014-8-17 21:44:44 | 只看该作者
能不能不改变本地网页编码,直接改$match的数据为gbk之类的

(获取对像网页编码是utf8,我本地测试是gbk)
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2026-1-15 05:12 , Processed in 0.065034 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表