首页 存档 技术 查看内容

Python爬虫利器之Xpath语法与lxml库的用法

2018-3-30 13:00 |来自: 互联网 438 0

摘要: 参考来源 lxml用法源自 lxml python 官方文档,更多内容请直接参阅官方文档,本文对其进行翻译与整理。 lxml http://lxml.de/index.html XPath语法参考 w3school w3school http://www.w3school.com.cn/xpath/index.a ...

参考来源

lxml用法源自 lxml python 官方文档,更多内容请直接参阅官方文档,本文对其进行翻译与整理。

lxml

http://lxml.de/index.html

XPath语法参考 w3school

w3school

http://www.w3school.com.cn/xpath/index.asp

安装

pip install lxml

利用 pip 安装即可


XPath语法

XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 都构建于 XPath 表达之上。


节点关系

(1)父(Parent)

每个元素以及属性都有一个父。

在下面的例子中,book 元素是 title、author、year 以及 price 元素的父:

声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部