XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。 XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。 起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。
在网络爬虫中使用XPath来解析网页数据是一个不错的选择.
在Python中使用XPath需要安装lxml库.(windows下Python安装lxml模块)
Python使用XPath简单的例子,遍历网页链接:
结果:
http://www.apizl.com/category/list-89.html
http://www.apizl.com/category/list-72.html
http://www.apizl.com/category/list-185.html
http://www.apizl.com/category/list-186.html
http://www.apizl.com/category/list-78.html
http://www.apizl.com/category/list-79.html
http://www.apizl.com/category/list-223.html
http://www.apizl.com/category/list-337.html
http://www.apizl.com/category/list-301.html
http://www.apizl.com/category/list-206.html
http://www.apizl.com/category/list-321.html
http://www.apizl.com/category/list-317.html
http://www.apizl.com/category/list-336.html
http://www.apizl.com/category/list-334.html
http://www.apizl.com/category/list-335.html
http://www.apizl.com/category/list-343.html
http://www.apizl.com/category/list-43.html
......
相关文章
- python 经常报错'module' object has no attribute 'X509_up_ref'
- python安装cv2 无法安装
- Python来识别字符串所属语言类型(langid 、langdetect)
- Python3 字典的复制与修改
- Python3 print 不换行打印教程
- Python3 bytes to string 字节码转字符串
- Scrapy Proxy Python下爬虫使用代理
- Scrapy 爬虫入门 内建设置参考 Python爬虫教程实战
- Scrapy 爬虫入门 Items 与 Item Pipeline Python爬虫教程实战
- Scrapy 爬虫入门 Spider 与 Selectors (选择器) Python爬虫教程实战