網友評分: 9.7分
XPath Helper插件是一款可以安裝到谷歌瀏覽器上使用支持所有chrome內核瀏覽器的爬蟲網頁解析工具,使用XPath Helper可以讓你輕松獲取HTML元素的xPath,不用再手動獲取捕捉。
xPath helper是一款Chrome瀏覽器的開發者插件,安裝了xPath helper后就能輕松獲取HTML元素的xPath,程序員就再也不需要通過搜索html源代碼,定位一些id去找到對應的位置去解析網頁了。
google插件XPath Helper可以支持在網頁點擊元素生成xpath,整個抓取使用了xpath、正則表達式、消息中間件、多線程調度框架(參考)。xpath 是一種結構化網頁元素選擇器,支持列表和單節點數據獲取,他的好處可以支持規整網頁數據抓取。
如果我們要查找某一個、或者某一塊元素的xpath路徑,可以按住shift,并移動到這一塊中,上面的框就會顯示這個元素的xpath路徑,右邊則會顯示解析出的文本內容,并且我們可以自己改動xpath路徑,程序也會自動的顯示對應的位置,可以很方便的幫助我們判斷我們的xpath語句是否書寫正確。
1.打開一個新的標簽,并導航到你最喜歡的網頁。
2.按Ctrl-Shift鍵-X以打開XPath輔助控制臺。
3.按住Shift鍵鼠標在頁面上的元素。查詢框會不斷更新,以顯示鼠標指針下面的元素充分XPath查詢。結果框其右側將顯示評價結果的查詢。
4.如果需要的話,可以直接在控制臺編輯XPath查詢。在結果框中將立即反映任何變化。
5.再次按Ctrl-Shift鍵-X關閉控制臺
雖然XPath Helper插件使用非常方便,但它也不是萬能的,有兩個問題:
1.XPath Helper 自動提取的 XPath 都是從根路徑開始的,這幾乎必然導致 XPath 過長,不利于維護;
2.當提取循環的列表數據時,XPath Helper 是使用的下標來分別提取的列表中的每一條數據,這樣并不適合程序批量處理,還是需要人為修改一些類似于*標記等。
不過,合理的使用Xpath,還是能幫我們省下很多時間的!
標簽: 谷歌瀏覽器插件