极速下载站 —— 提供优质软件下载服务,感受全新的极速下载体验!

最近更新 | 软件专题 | 软件分类 | 软件排行

您的位置:极速下载站资讯首页软件教程电脑软件教程 → 火车采集器XPath提取教程

火车采集器XPath提取教程

时间:2017-05-10 10:55:43  作者:不思议游戏  浏览量:100

火车采集器XPath提取教程预览图

XPath提取

XPath 是一门在 HTML/XML 文档中查找信息的语言。
XPath 使用路径表达式在 XML 文档中进行导航,可以通过FireFox firebug 或者Chrome 开发者工具快速获取。
XPath节点属性

innerHTML 获取位于对象起始和结束标签内的 HTML (HTML代码,不包含开始/结束代码)
innerText 获取位于对象起始和结束标签内的文本 (文本字段,不包含开始/结束代码)
outerHTML 获取对象及其内容的 HTML 形式 (HTML代码,包含开始/结束代码)
Href 获取超链接
以网址 http://faq.locoy.com/q-681.html 为例,我们来设置标题和内容的XPath表达式,节点属性 我们默认innerHTML就可以。

方法/步骤

1、首先,用谷歌浏览器打开 网页, 然后打开Chrome开发者工具,快捷键为 “ F12 ”,反复按下F12可以切换状态(打开或关闭)。 当然,你也可以在原网页,直接右击“审查元素”。

2、获取标题的XPath,操作如下图:

获取标题

得出代码为 //*[@id="mainContent"]/div[2]/h2

得出代码

3、获取内容的XPath,操作如下图:

获取内容

得出代码为 //*[@id="cmsContent"]

然后放入即可。

火车采集器 9.8.0 官方版

火车采集器图片
  • 软件性质:国产软件
  • 授权方式:免费版
  • 软件语言:简体中文
  • 软件大小:23789 KB
  • 下载次数:2977 次
  • 更新时间:2019/4/8 17:01:06
  • 运行平台:WinAll...
  • 软件描述:火车采集器是使用人数比较多的互联网数据挖掘软件。能采集99%的网页,就算网页需要... [立即下载]

相关资讯

相关软件