XPath Helper Chrome插件開發背景
每一個寫爬蟲、或者是做網頁分析的人,相信都會因為在定位、獲取xpath路徑上花費大量的時間,甚至有時候當爬蟲框架成熟之后,基本上主要的時間都花費在了頁面的解析上。在沒有這些輔助工具的日子里,我們只能通過搜索html源代碼,定位一些id去找到對應的位置,非常的麻煩,而且經常出錯。而我們今天要介紹的這款XPath Helper可以很好的幫助大家解決這個難題。XPath Helper Chrome插件簡介
xpath helper插件是一款免費的chrome爬蟲網頁解析工具。可以幫助用戶解決在獲取xpath路徑時無法正常定位等問題。該插件主要能幫助你在各類網站上通過按shift鍵選擇想要查看的頁面元素來提取查詢其代碼,同時你還能對查詢出來的代碼進行編輯,而編輯出的結果將立即顯示在旁邊的結果框中。
XPath Helper Chrome插件logo
XPath Helper Chrome插件使用方法
1.XPath Helper插件的離線安裝方法參照:chrome插件的離線安裝方法。最新chrome瀏覽器下載地址:http://www.djfsmith.com/chrome/2017-09/813.html。
2.在chrome瀏覽器安裝好xpath helper插件后,該插件在安裝后,只會在之后打開的標簽頁上啟用效果,安裝之前打開的標簽頁則無法使用,在新的頁面中你可以通過點擊界面右上角的插件圖標來打開插件窗口。打開某個網頁(以搜狐為例)拷貝目標頁面元素的XPATH,如下圖所示:
2.點擊瀏覽器右上角xpath-helper圖標 打開xpath-helper工具,并將拷貝的XPATH 復制到 小怕xpath-helper 左邊的輸入框中,右側輸入框將顯示XPATH定位的元素的文本內容.或者點擊 Ctrl + Shift + X 激活 XPath Helper的控制臺,然后您可以在 Query 文本框中輸入相應 XPath 進行調試了,提取的結果將被顯示在旁邊的 Result 文本框中,如下圖所示:
3.這樣你就可以優化你的xpath了。
4、xpath helper官方文檔上介紹的使用方法如下:
打開窗口后,按shift鍵并移動鼠標至你需要查看的區域即可立即在插件窗口中顯示其代碼查詢結果。
1)打開一個新的標簽,并導航到你最喜歡的網頁。
2)按Ctrl-Shift鍵-X以打開XPath輔助控制臺。
3)按住Shift鍵鼠標在頁面上的元素。查詢框會不斷更新,以顯示鼠標指針下面的元素充分XPath查詢。結果框其右側將顯示評價結果的查詢。
4)如果需要的話,可以直接在控制臺編輯XPath查詢。在結果框中將立即反映任何變化。
5)再次按Ctrl-Shift鍵-X關閉控制臺
XPath Helper Chrome插件注意事項
雖然XPath Helper插件使用非常方便,但它也不是萬能的,有兩個問題:
1.XPath Helper 自動提取的 XPath 都是從根路徑開始的,這幾乎必然導致 XPath 過長,不利于維護;
2.當提取循環的列表數據時,XPath Helper 是使用的下標來分別提取的列表中的每一條數據,這樣并不適合程序批量處理,還是需要人為修改一些類似于*標記等。不過,合理的使用Xpath,還是能幫我們省下很多時間的!
XPath Helper下載地址
轉載必須注明來自: Chrome插件 ? XPath Helper