網(wǎng)友評分: 5分
SysNucleus WebHarvy 是一款非常好用的網(wǎng)頁數(shù)據(jù)采集軟件,它可以幫助用戶輕松的從網(wǎng)頁上提取數(shù)據(jù)并保存為不同的格式,還支持提取視頻、圖片等各種類型的文件。
1、SysNucleus WebHarvy可以讓您分析網(wǎng)頁上的數(shù)據(jù)
2、可以顯示從一個(gè)HTML地址上分析連接數(shù)據(jù)
3、可以延伸到下一個(gè)網(wǎng)頁頁面
4、可以指定搜索數(shù)據(jù)的范圍以及內(nèi)容
5、可以將掃描的圖片下載保存
6、支持在瀏覽器上復(fù)制鏈接搜索
7、支持配置對應(yīng)資源項(xiàng)目搜索
8、可以使用項(xiàng)目名稱以及資源名稱查找
9、SysNucleus WebHarvy可以輕松提取數(shù)據(jù)
10、提供更高級的多詞語搜索以及多頁搜索
簡易網(wǎng)頁搜刮:WebHarvy的指向和點(diǎn)擊界面使Web Scraping很容易。絕對不需要編寫任何代碼或腳本來刮取數(shù)據(jù)。您將使用WebHarvy的內(nèi)置瀏覽器加載網(wǎng)站,并且可以通過單擊鼠標(biāo)來選擇要提取的數(shù)據(jù)。就這么簡單?。ㄒ曨l)
智能模式檢測:自動(dòng)識別網(wǎng)頁中出現(xiàn)的數(shù)據(jù)模式。因此,如果您需要從網(wǎng)頁上抓取項(xiàng)目列表(名稱,地址,電子郵件,價(jià)格等),則無需進(jìn)行任何其他配置。如果數(shù)據(jù)重復(fù),WebHarvy將自動(dòng)對其進(jìn)行刮擦。 保存到文件或數(shù)據(jù)庫
您可以用多種格式保存從網(wǎng)站提取的數(shù)據(jù)。當(dāng)前版本的WebHarvy Web搜尋軟件允許您將提取的數(shù)據(jù)另存為Excel,XML,CSV,JSON或TSV文件。您也可以將抓取的數(shù)據(jù)導(dǎo)出到SQL數(shù)據(jù)庫。(了解更多)
抓取多頁:網(wǎng)站通常會(huì)在多個(gè)頁面中顯示諸如產(chǎn)品列表或搜索結(jié)果之類的數(shù)據(jù)。WebHarvy可以自動(dòng)爬網(wǎng)并從多個(gè)頁面提取數(shù)據(jù)。只需指出“加載下一頁的鏈接”,WebHarvy Web Scraper就會(huì)自動(dòng)從所有頁面抓取數(shù)據(jù)。(了解更多)
提交關(guān)鍵字:通過自動(dòng)提交輸入關(guān)鍵字列表以搜索表單來擦除數(shù)據(jù)。可以將任意數(shù)量的輸入關(guān)鍵字提交到多個(gè)輸入文本字段以執(zhí)行搜索??梢詮妮斎腙P(guān)鍵字所有組合的搜索結(jié)果中提取數(shù)據(jù)。(了解更多)(視頻)
保護(hù)隱私:為了匿名抓取并防止Web抓取軟件被Web服務(wù)器阻止,您可以選擇通過代理服務(wù)器或VPN訪問目標(biāo)網(wǎng)站??梢允褂脝蝹€(gè)代理服務(wù)器地址或代理服務(wù)器地址列表。(了解更多)
類別抓?。鹤ト」ぞ呤鼓梢詮逆溄恿斜碇凶ト?shù)據(jù),這些鏈接會(huì)導(dǎo)致網(wǎng)站中出現(xiàn)類似的頁面/列表。這使您可以使用單一配置在網(wǎng)站內(nèi)抓取類別和子類別。(了解更多)(視頻)
常用表達(dá):允許您在網(wǎng)頁的文本或HTML源上應(yīng)用正則表達(dá)式(RegEx)并抓取匹配的部分。這項(xiàng)功能強(qiáng)大的技術(shù)可在您抓取數(shù)據(jù)時(shí)提供更大的靈活性。(了解更多) (RegEx教程)
JavaScript支持:提取數(shù)據(jù)之前,請?jiān)跒g覽器中運(yùn)行您自己的JavaScript代碼。它可用于與頁面元素進(jìn)行交互,修改DOM或調(diào)用已在目標(biāo)頁面中實(shí)現(xiàn)的JavaScript函數(shù)。(了解更多)
圖像提?。嚎梢韵螺d圖像或提取圖像URL。WebHarvy可以自動(dòng)提取顯示在電子商務(wù)網(wǎng)站產(chǎn)品詳細(xì)信息頁面中的多個(gè)圖像。(了解更多)
自動(dòng)化瀏覽器任務(wù):WebHarvy可以輕松配置為執(zhí)行諸如單擊鏈接,選擇列表/下拉選項(xiàng),向字段輸入文本,滾動(dòng)頁面,打開彈出窗口等任務(wù)。
技術(shù)援助:購買WebHarvy后,您將在購買之日起的1年內(nèi)獲得我們的免費(fèi)更新和免費(fèi)支持。
標(biāo)簽: WebHarvy 數(shù)據(jù)采集 網(wǎng)頁采集
關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2024 m.obymc.com.All rights reserved.
浙ICP備06019006號-1 浙公網(wǎng)安備33038102330474號