雷火电竞官网-中国知名电竞赛事平台

當下軟件園 / 匯聚當下最新最酷的軟件下載站!
當下軟件園

您的位置: 首頁 > 網絡軟件 > 網頁輔助 > 爬山虎采集器 V2.4.9.0 官方版

  爬山虎采集器是一款新一代智能化的網頁采集工具,智能分析、可視化界面,一鍵采集無需編程,支持自動生成采集腳本,可以采集互聯網99%的網站。軟件簡單易學,通過智能算法+可視化界面,隨心所欲,抓取自己想到的數據。只要輕松點擊鼠標,就能采集網頁上的數據。

爬山虎采集器

【軟件特色】

  一鍵提取數據

  簡單易學,通過可視化界面,鼠標點擊即可抓取數據

  快速高效

  內置一套高速瀏覽器內核,加上HTTP引擎模式,實現快速采集數據

  適用各種網站

  能夠采集互聯網99%的網站,包括單頁應用Ajax加載等等動態類型網站

【功能介紹】

  向導模式

  簡單易用,輕松通過鼠標點擊自動生成

  腳本定時運行

  可按照計劃定時運行,無需人工

  獨創高速內核

  自研的瀏覽器內核,速度飛快,遠超對手

  智能識別

  對于網頁中的列表、表單結構(多選框下拉列表等)能夠智能識別

  廣告屏蔽

  定制的廣告屏蔽模塊,兼容AdblockPlus語法,可添加自定義規則

  多種數據導出

  支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、網站等

爬山虎采集器

【使用流程】

  輸入采集網址

  打開軟件,新建任務,輸入需要采集的網站地址。

  智能分析,全程自動化提取數據

  進入到第二步后,爬山虎采集器全自動智能分析網頁,并且從中提取出列表數據。

  導出數據到表格、數據庫、網站等

  運行任務,將采集到的數據導出為Csv、Excel以及各種數據庫,支持api導出。

爬山虎采集器

【常見問題】

  問:如何過濾列表中的前N個數據?

  1、有時我們需要對采集到的列表進行過濾,比如過濾掉第一組數據(在采集表格時,過濾掉表格列名)

  2、點擊列表模式菜單中的,設置列表xpath

  問:如何抓包獲取Cookie,并且手動設置?

  1、首先,使用谷歌瀏覽器打開要采集的網站,并且登陸。

  2、然后按下 F12,會出現開發者工具,選擇 Network

  3、然后按下F5,刷新下頁面, 選擇其中一個請求。

  4、復制完成后,在爬山虎采集器中,編輯任務,進入第三步,指定HTTP Header。

【更新日志】

  優化網頁表格數據的識別,可按照表格列名自動命名字段

  優化時間提取

  修復當有自定義字段,沒有匹配到不保存數據的問題

  添加時間戳變量

  計劃任務,每間隔分鐘增加開始秒

軟件特別說明

標簽: 網頁采集

其他版本下載
網友評論
回頂部 去下載

關于本站|下載幫助|下載聲明|軟件發布|聯系我們

Copyright ? 2005-2024 m.obymc.com.All rights reserved.

浙ICP備2024132706號-1 浙公網安備33038102330474號