博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
PHP - 如何解析HTML文件
阅读量:5856 次
发布时间:2019-06-19

本文共 383 字,大约阅读时间需要 1 分钟。

有一个开源的PHP库“PHP Simple HTML DOM Parser”,其官方网址为http://simplehtmldom.sourceforge.net/,它可以将HTML文件解析为DOM模型,并且其查找DOM对象的语法类似jQuery,使用很方便,具体用法到官网看帮助。

对于中文网页,如果编码不是UTF-8的,则需要采用如下代码转换:

$info = file_get_contents("http://www.siluke.com/0/78/78773/");

$info = iconv("gbk", "utf-8//IGNORE", $info);

$dom = str_get_html($info);

就是先用
file_get_contents()得到页面内容,再用iconv()转换编码,最后用str_get_html()生成DOM
树。

转载地址:http://ahajx.baihongyu.com/

你可能感兴趣的文章
敲黑板,划重点:Docker 1.13更新有哪些看点?
查看>>
阅读者(29):《精益企业》——高绩效组织如何规模化创新
查看>>
红帽峰会2018第一天:数字转型扛把子OpenShift
查看>>
2017年InfoQ最受欢迎30项内容清单
查看>>
当我们输入一条SQL查询语句时,发生了什么?
查看>>
5G一周热闻:中国5G芯片关键材料获突破,华为首款折叠屏手机亮相
查看>>
C2x将成为C语言的下一个ISO标准
查看>>
Linus Torvalds:Linux背后的智者
查看>>
IPv6新形势下的安全解决方案
查看>>
白话中台战略:中台是个什么鬼?
查看>>
对《Clojure in Action》第二版的书评与作者问答
查看>>
QCon北京2015:移动开发最佳实践专题前瞻
查看>>
AWS推出OpenJDK长期支持版本Amazon Corretto
查看>>
将团队迁移到可视化项目管理软件
查看>>
Mozilla开发全新的公开网络API WebXR 来实现增强现实
查看>>
Eclipse基金会发布MicroProfile 2.2,适用于Java微服务
查看>>
从图形到像素:前端图形编程技术概览
查看>>
AI+社交,快手商业化落地之道
查看>>
Java 9正式版有可能被推迟到9月21号发布
查看>>
Netflix实时流处理平台Keystone介绍
查看>>