網友評分: 9.7分
飛騰反黃軟件 V2.3.0.1010 官方版
全能模擬王自動點擊軟件 V17.1.1 綠色最新版
Sangfor WebShellKiller(網站暗鏈檢測工具) V3.3.0.2 綠色免費版
Easy Web Editor(可視化網頁制作軟件) V2016.40.1 官方版
Google Web Designer(網頁編輯器) V8.0.3.0603 官方版
Advanced PDF Page Extractor(PDF頁面提取軟件) V1.5 官方版
Fiddler4網頁抓包軟件 V5.0.2 官方版
我要看vip視頻Chrome插件 V1.4.1 綠色版
爬山虎采集器是一款新一代智能化的網頁采集工具,智能分析、可視化界面,一鍵采集無需編程,支持自動生成采集腳本,可以采集互聯網99%的網站。軟件簡單易學,通過智能算法+可視化界面,隨心所欲,抓取自己想到的數據。只要輕松點擊鼠標,就能采集網頁上的數據。
一鍵提取數據
簡單易學,通過可視化界面,鼠標點擊即可抓取數據
快速高效
內置一套高速瀏覽器內核,加上HTTP引擎模式,實現快速采集數據
適用各種網站
能夠采集互聯網99%的網站,包括單頁應用Ajax加載等等動態類型網站
向導模式
簡單易用,輕松通過鼠標點擊自動生成
腳本定時運行
可按照計劃定時運行,無需人工
獨創高速內核
自研的瀏覽器內核,速度飛快,遠超對手
智能識別
對于網頁中的列表、表單結構(多選框下拉列表等)能夠智能識別
廣告屏蔽
定制的廣告屏蔽模塊,兼容AdblockPlus語法,可添加自定義規則
多種數據導出
支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、網站等
輸入采集網址
打開軟件,新建任務,輸入需要采集的網站地址。
智能分析,全程自動化提取數據
進入到第二步后,爬山虎采集器全自動智能分析網頁,并且從中提取出列表數據。
導出數據到表格、數據庫、網站等
運行任務,將采集到的數據導出為Csv、Excel以及各種數據庫,支持api導出。
問:如何過濾列表中的前N個數據?
1、有時我們需要對采集到的列表進行過濾,比如過濾掉第一組數據(在采集表格時,過濾掉表格列名)
2、點擊列表模式菜單中的,設置列表xpath
問:如何抓包獲取Cookie,并且手動設置?
1、首先,使用谷歌瀏覽器打開要采集的網站,并且登陸。
2、然后按下 F12,會出現開發者工具,選擇 Network
3、然后按下F5,刷新下頁面, 選擇其中一個請求。
4、復制完成后,在爬山虎采集器中,編輯任務,進入第三步,指定HTTP Header。
優化網頁表格數據的識別,可按照表格列名自動命名字段
優化時間提取
修復當有自定義字段,沒有匹配到不保存數據的問題
添加時間戳變量
計劃任務,每間隔分鐘增加開始秒
標簽: 網頁采集