SelectorGadget 插件背景簡介
相信爬蟲的愛好者們都經歷過這樣一個爬蟲前期的準備過程,那就是用瀏覽器的審查元素進行爬取目標的定位。每次我們都要浪費部分時間去尋找定位點和xpath,這樣既不很方便,也不高效,那么如何提高爬蟲中這部分工作的效率呢?今天小編給大家分享一個爬蟲的利器,它就是:SelectorGadget 插件。
SelectorGadget 插件簡介
Selector Gadget是一個開源的Chrome擴展程序,可以輕松地在復雜的網站上生成和選擇CSS選擇器。安裝擴展程序后,轉到任意頁面并啟動它。網站右下方會打開一個方框。單擊您希望選擇器匹配的頁面元素(它將變為綠色)。然后SelectorGadget將為該元素生成一個最小的CSS選擇器,并突出顯示(黃色)選擇器匹配的所有內容。現在單擊突出顯示的元素將其從選擇器中刪除(紅色),或單擊未突出顯示的元素將其添加到選擇器。通過這個選擇和拒絕過程,SelectorGadget可以幫助您找到滿足您需求的完美CSS選擇器。
SelectorGadget 插件使用方法
1.SelectorGadget插件離線安裝的方法參照一下方法:老版本chrome瀏覽器,首先在標簽頁輸入【chrome://extensions/】進入chrome擴展程序,解壓你在本站下載的插件,并拖入擴展程序頁即可。
2.最新版本的chrome瀏覽器直接拖放安裝時會出現“程序包無效CRX-HEADER-INVALID”的報錯信息,參照:Chrome插件安裝時出現"CRX-HEADER-INVALID"解決方法,安裝好后即可使用。
3.下載完會在右上角多出一個放大鏡的小標志。提示你已經安裝好該插件。
4.接下來就可以使用該插件了,打開某個網站,例如當當網的圖書排行榜,比如我們想獲得書名的html節點信息,此時我們只需要先點擊谷歌瀏覽器上圖標,然后再在書名的點擊,如下圖所示
5.在上圖中,我們發現很多地方都變成高亮(即黃色部分),但是我們只想獲得書名信息,所以我們需要去除多余的信息,此刻只需在不需要的部分再次點擊,即可去掉選中部分。例如點擊下圖上的“2013”年
6.擊后就會發現現在網頁中高亮部分(即黃色部分)就只有“書名”信息,如下圖所示:
7.這時候我們再查看谷歌瀏覽器右下角就可以看到節點標簽,即 .name a,點擊圖片上面的“clear(20)”即可清除自己現在選取的信息,重新進行選擇~
SelectorGadget 插件官網:
http://selectorgadget.com
SelectorGadget下載地址
轉載必須注明來自: Chrome插件 ? SelectorGadget