品自行最近发现,城通网盘的分享链接是经过加密了的,通过查看网页源代码查看不了真实源代码,只能通过浏览器的审查元素功能查看其真实的源代码。
http://yun.pinzixing.com/f/29610147-532260579-71e40a
比如上述分享链接,我要得到下图框选的文件名称:
品自行博客尝试用火车头采集器采集链接里面的相关信息,但却发现火车头采集器不能采集城通网盘的分享链接里面的任何,最后发现可以用火车浏览器设置采集脚本进行采集,创建如下脚本即可:
首先我们要添加一个循环操作,然后我们要建四个变量,
11和mingcheng,两个文本变量;
chengtonglianjie和dizhimingcheng,两个list变量;
我们需要将所有城通分享链接放在chengtonglianjie这个list变量里面(一行一个),在循环操作里面循环这个变量,并保存每个循环变量至11变量,接着添加以下四个操作:
1、打开网页
这里面设置打开11变量的链接
2、单次取值
设置为“从源代码中提取”
正则匹配内容为:<title>[参数] - 免费下载</title>
组合结果:[参数1]
属性名称:value
保存至变量mingcheng
3、变量处理
处理mingcheng变量,并设置内容添加前缀,前缀设置11变量
4、变量转化
设置“文本变量添加到List变量”,原变量名mingcheng,新变量名为dizhimingcheng
运行脚本,最后得到的dizhimingcheng这个变量里面就是我们所要采集的内容。
得到的结果格式如下(这里只列出一行,理论上chengtonglianjie变量里面有多少个链接最后得到的结果就有多少行):
http://yun.pinzixing.com/f/29610147-532260579-71e40a火车头采集器.zip
评论