- 軟件大?。?span>27.09M
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件
- 軟件類別:免費軟件 / 下載工具
- 更新時間:2023-03-13 00:09
- 運行環(huán)境:WinAll, WinXP
- 軟件等級:
- 軟件廠商:
- 官方網(wǎng)站:http://www.51pashanhu.com
3.18M/中文/5.0
0KB/中文/5.0
2.98M/中文/10.0
3.41M/中文/5.0
700KB/中文/10.0
爬山虎采集器是一款專為用戶提供信息采集功能的軟件,用戶可以使用軟件將自己需要的信息數(shù)據(jù)從瀏覽器或者是其他的地方收集,并生成你想要的文本格式,非常的簡單又方便,需要的用戶快來綠色資源網(wǎng)下載吧!
爬山虎采集器是一款支持99%的網(wǎng)站數(shù)據(jù)采集的高效網(wǎng)頁信息采集軟件,軟件能生成excel表格,api數(shù)據(jù)庫文件等內(nèi)容,幫助你管理網(wǎng)站數(shù)據(jù)信息,如果您需要對某個指定網(wǎng)頁數(shù)據(jù)進(jìn)行采集,使用這款軟件即可!
腳本定時運行
可按照計劃定時運行,無需人工
獨創(chuàng)高速內(nèi)核
自研的瀏覽器內(nèi)核,速度飛快,遠(yuǎn)超對手
向?qū)J?/strong>
簡單易用,輕松通過鼠標(biāo)點擊自動生成
智能識別
對于網(wǎng)頁中的列表、表單結(jié)構(gòu)(多選框下拉列表等)能夠智能識別
廣告屏蔽
定制的廣告屏蔽模塊,兼容adblockPlus語法,可添加自定義規(guī)則
多種數(shù)據(jù)導(dǎo)出
支持Txt 、Excel、mysql、SQLServer、sqlite、access、網(wǎng)站等
適用各種網(wǎng)站
能夠采集互聯(lián)網(wǎng)99%的網(wǎng)站,包括單頁應(yīng)用Ajax加載等等動態(tài)類型網(wǎng)站
一鍵提取數(shù)據(jù)
簡單易學(xué),通過可視化界面,鼠標(biāo)點擊即可抓取數(shù)據(jù)
快速高效
內(nèi)置一套高速瀏覽器內(nèi)核,加上HTTP引擎模式,實現(xiàn)快速采集數(shù)據(jù)
問:如何抓包獲取Cookie,并且手動設(shè)置?
1.首先,使用谷歌瀏覽器打開要采集的網(wǎng)站,并且登陸。
2.然后按下 F12,會出現(xiàn)開發(fā)者工具,選擇 Network
3.然后按下F5,刷新下頁面, 選擇其中一個請求。
4.復(fù)制完成后,在爬山虎采集器中,編輯任務(wù),進(jìn)入第三步,指定HTTP Header。
問:如何過濾列表中的前N個數(shù)據(jù)?
1.有時我們需要對采集到的列表進(jìn)行過濾,比如過濾掉第一組數(shù)據(jù)(在采集表格時,過濾掉表格列名)
2.點擊列表模式菜單中的,設(shè)置列表xpath
第一步:輸入采集網(wǎng)址
打開軟件,新建任務(wù),輸入需要采集的網(wǎng)站地址。
第二步:智能分析,全程自動化提取數(shù)據(jù)
進(jìn)入到第二步后,爬山虎采集器全自動智能分析網(wǎng)頁,并且從中提取出列表數(shù)據(jù)。
第三步:導(dǎo)出數(shù)據(jù)到表格、數(shù)據(jù)庫、網(wǎng)站等
運行任務(wù),將采集到的數(shù)據(jù)導(dǎo)出為Csv、Excel以及各種數(shù)據(jù)庫,支持api導(dǎo)出。
1.修復(fù)登陸時的DNS問題
2.修復(fù)圖片下載問題
3.修復(fù) json 一些問題
4.增加插件功能
5.增加導(dǎo)出 txt (一條保存為一個文件)
6.多值連接符支持換行符
7.修改數(shù)據(jù)處理的文本映射(支持查找替換)
請描述您所遇到的錯誤,我們將盡快予以修正,謝謝!
*必填項,請輸入內(nèi)容