▲第二部分,软件脚本技巧步骤说明,人学多点知识总没有错的不是吗?▲:
如上图所示,这个就是秘密发现的地址,只要有了这个地址,后面其实就容易的多了。但要注意的是,这个地图的网址必须打开二次,这个原因我也不知为什么,只要打开二次,那后面地图采集才能顺利的进行的。
首先,我们先定位到这个城市去,所以我们选输入城市列表的值,然后点一下搜索,也就是第二步搜一下,这个百度的系统,他就会自动定位到这个城市的地图。
上面定位到城市后,如上图所示,就是输入关键字,这个第五步,输入后点击一下。
运行了点击后,这个就会出现很多的电话号码,和这个电话号码对应的名称。显示出来了,我们后面的任务就是采集了,而采集这里我不得不说的一个技巧
如上图所示,为了让我们每一个城市采出来的都知道是哪一个城市的,我们就需要插入列表,这样子做,那每一个采集出来的名称,和电话,就会对应知道哪一个城市的了,是每一行都会加上的,这个技术是比较少人会用。
然后判断他有没有下一页,如上图所示,这里做了一个逻辑判断,判断到了最后一页,那就会跳转到下一个城市去采集。
逻辑判断这个跳转,是跳到切换城市的,所以这里只有一个动作在逻辑判断里面,意思是到了最后一页,就跳到下一个城市去采集。
下面这段就是这个脚本的源码步骤:
<% keyID=打开网址47140
{打开网址}
<URL>http://api.map.baidu.com/lbsapi/getpoint/index.html</URL>
<备注>百度地图首页</备注>
{/打开网址}
%>
<% keyID=输入43206
{输入}
<框架定位类型>序号</框架定位类型>
<框架定位值></框架定位值>
<定位类型>ID</定位类型>
<定位值>localvalue</定位值>
<元素序号>-1</元素序号>
<输入值>{获取列表值}城市列表|a|自动{/获取列表值}</输入值>
<输入类型>value</输入类型>
<限制字数>0</限制字数>
<备注>城市</备注>
{/输入}
%>
<% keyID=点击68894
{点击}
<框架定位类型>序号</框架定位类型>
<框架定位值></框架定位值>
<定位类型>ID</定位类型>
<定位值>localsearch</定位值>
<点击方式>元素点击</点击方式>
<等待新窗体>True</等待新窗体>
<允许新窗口>False</允许新窗口>
<备注>百度一下</备注>
{/点击}
%>
<% keyID=倒计时-47432
{倒计时}<秒>3</秒>{/倒计时}
%>
<% keyID=输入84578
{输入}
<框架定位类型>序号</框架定位类型>
<框架定位值></框架定位值>
<定位类型>ID</定位类型>
<定位值>localvalue</定位值>
<元素序号>-1</元素序号>
<输入值>[文本框:查找关键字]</输入值>
<输入类型>value</输入类型>
<限制字数>0</限制字数>
<备注>百度查找的关键字</备注>
{/输入}
%>
<% keyID=点击6889479
{点击}
<框架定位类型>序号</框架定位类型>
<框架定位值></框架定位值>
<定位类型>ID</定位类型>
<定位值>localsearch</定位值>
<点击方式>元素点击</点击方式>
<等待新窗体>True</等待新窗体>
<允许新窗口>False</允许新窗口>
<备注>百度一下</备注>
{/点击}
%>
<% keyID=倒计时-4743223
{倒计时}<秒>3</秒>{/倒计时}
%>
<% keyID=采集-4367
{万能采集}
<规则>
<要采集的数据>[网页源码]</要采集的数据>
<分割代码><a href="javascript:void(0)" title="</分割代码>
<结果中含有>电话</结果中含有>
<结果中不含有></结果中不含有>
<开始部分></开始部分>
<结束部分>"></结束部分>
<查找></查找>
<替换为></替换为>
<采集补全><采集结果></采集补全>
<结果存入>列表</结果存入>
<存入>采集数据|名称</存入>
</规则><规则>
<要采集的数据>[网页源码]</要采集的数据>
<分割代码><br>电话:</分割代码>
<结果中含有></结果中含有>
<结果中不含有></结果中不含有>
<开始部分></开始部分>
<结束部分><br></结束部分>
<查找>,</查找>
<替换为>;</替换为>
<采集补全><采集结果></采集补全>
<结果存入>列表</结果存入>
<存入>采集数据|电话</存入>
</规则><规则>
<要采集的数据>[网页源码]</要采集的数据>
<分割代码><p>地址:</分割代码>
<结果中含有>电话</结果中含有>
<结果中不含有></结果中不含有>
<开始部分></开始部分>
<结束部分><br></结束部分>
<查找></查找>
<替换为></替换为>
<采集补全>{获取列表值}城市列表|a|自动{/获取列表值}<采集结果></采集补全>
<结果存入>列表</结果存入>
<存入>采集数据|地址</存入>
</规则><规则>
<要采集的数据>{获取列表值}城市列表|a|自动{/获取列表值}</要采集的数据>
<分割代码></分割代码>
<结果中含有></结果中含有>
<结果中不含有></结果中不含有>
<开始部分></开始部分>
<结束部分></结束部分>
<查找></查找>
<替换为></替换为>
<采集补全><采集结果></采集补全>
<结果存入>列表</结果存入>
<存入>采集数据|采集的城市</存入>
</规则><备注>采集-4367</备注>
{/万能采集}
%>
<% keyID=点击87823
{点击}
<框架定位类型>序号</框架定位类型>
<框架定位值></框架定位值>
<定位类型>部分源码</定位类型>
<定位值>>下一页</定位值>
<元素序号>-1</元素序号>
<点击方式>元素点击</点击方式>
<等待新窗体>True</等待新窗体>
<允许新窗口>False</允许新窗口>
<备注>下一页</备注>
{/点击}
%>
<% keyID=倒计时-84256
{倒计时}<秒>2</秒>{/倒计时}
%>
<% keyID=逻辑判断-9711
{如果}<逻辑>[网页源码]<不包含>>下一页</逻辑><否则跳转到结束>keyid=56910</否则跳转到结束><备注>>下一页没有</备注>
{/如果}
%>
<% keyID=动作跳转38938
{动作跳转}
<当>直接跳转</当>
<条件>包含</条件>
<值></值>
<跳转到>keyid=城市53942</跳转到>
<跳转频率>0</跳转频率>
{/动作跳转}
%>
<% keyID=56910
{否则}{/否则}
%>
<% keyID=56910else
{逻辑结束}{/逻辑结束}
%>
<% keyID=动作跳转51482
{动作跳转}
<当>直接跳转</当>
<条件>包含</条件>
<值></值>
<跳转到>keyid=采集-4367</跳转到>
<跳转频率>0</跳转频率>
<备注>动作跳转51482</备注>
{/动作跳转}
%>
<% keyID=城市53942
{切换列表}
<列表集合>
城市列表|否|下一行|0|
</列表集合>
<备注>城市53942</备注>
{/切换列表}
%>
<% keyID=动作跳转83082
{动作跳转}
<当>直接跳转</当>
<条件>包含</条件>
<值></值>
<跳转到>keyid=打开网址47140</跳转到>
<跳转频率>0</跳转频率>
{/动作跳转}
%>
这个采集系统,也是很少人会知道这个网址,正所谓,知道的多,走的路就捷近,常常很多事都是这样,就像有的人知道发帖怎么样收录快,有的人只能发一几十帖,收录的只有几帖这样子,同一样的是去努力做事,但得到的结果却是不相同的不是吗?