一般網站經營者會使用「 Google 自訂搜尋」(註1)來架設站內、企業內的搜尋引擎,但這個免費工具對任何人「進行資料研究」都很有幫助。有時候進行一個新的專案,接觸自己沒有觸碰過的領域,會需要學習很多新的知識、新的名詞、查詢新的資料,這時候除了閱讀專書、請教專家外,相信很多工作者也會開始在 Google 上進行資料搜尋。
雖然 Google 的資料搜尋可以幫我們找到最熱門、最重要的資料,卻不一定可以挖掘出對專業研究來說「更需要深入探索的專門但冷門的資料」,例如在 Google 搜尋裡同一個網站如果對應搜尋關鍵字有多筆資料時, Google 通常只會顯示出這個網站最熱門的那一筆。
於是在專案或論文的資料研究中,要如何做,才能深入挖掘出更具體的資料內容呢?
或許一個值得試試看的辦法,就是幫每一個專案建立「 Google 自訂搜尋引擎」,用自建搜尋引擎來搜尋這個領域中幾個專門網站的所有內容,等於建立一個自動化的專案知識庫,花最少的時間收集,但是就能更深入的挖出更多需要的資訊。
(註1:回顧留存我在 2008 年就推薦這個服務時的舊文章:Google自訂搜尋引擎 – 打造個人資訊檢索系統,這樣做才叫強大)
這時候,我們要做的步驟就是先在一般的 Google 搜尋中,找到幾個跟研究主題有關的專門網站,例如我想研究「數位工作方法」,我先用一些基本的關鍵字在一般 Google 搜尋中找出談相關方法的部落格與網站,然後把他們加入我的自訂搜尋引擎中,這個階段只是先收集網站的名單。
把這些網站名單建立到 Google 自訂搜尋引擎的索引清單中,這樣一個便利的知識庫就完成了(註2)。
當沒有這樣做的時候,我們可能每一次找資料就只能在 Google 找到熱門的淺層資料,若要深入每個專業網站去找深層的資料,就要一個一個網站分別搜尋。
但是如果建立了這些專業網站的聯合搜尋引擎,那麼我們只要進入這個統一的搜尋引擎找,就能一次聯合挖掘這些網站裡所有相關的深層資料。這個自訂搜尋引擎索引了這些專業網站的所有內容,實質上也就好像是一個自動剪貼完成的知識庫一樣了。
(註2:歡迎參考我自建的數位工作方法研究搜尋引擎)
- 1. 加入想要搜尋的特定網站
下面,就讓我用目前版本的 Google 自訂搜尋介面,加上我自己長期使用下覺得最重要、最精簡的流程,來分享如何快速幫你的論文研究、專案研究建立 Google 自訂搜尋引擎的方法。
首先,進入「 Google 自訂搜尋」,然後按下〔 Add 〕就可以進入增加 Google 自訂搜尋的設定畫面,而第一步就是把目前需要研究的相關網站網址,一個一個的加入。
進入「 Google 自訂搜尋」網頁
- 2. 建立搜尋引擎名稱,完成!
我的經驗是一開始不用想說等到找齊網站才開始建立自訂搜尋引擎,通常我找到幾個值得研究的專業網站,我就先加入自訂搜尋引擎中,以後一邊搜尋研究時,一邊自然就會發現更多相關網站,到時候再陸續加入也不遲。
當把目前掌握的研究對象都加入後,只要輸入自訂搜尋引擎的名稱,按下建立,就完成啦!
- 3. 進階設定:搜尋整個網路,但特別強調收錄網站的搜尋引擎
那第三步驟之後是要做什麼呢?接下來我要分享的是我自己使用經驗裡,覺得對挖掘資料又更有幫助的幾個設定方式,提供進階使用者一些參考。
首先我想做的是,雖然我加入了 10 個網站在自訂搜尋引擎中,但我希望 Google 搜尋時還是可以同時去找其他我沒有加入的網站資料,只是幫我把加入的 10 個網站的資料權重提高,一方面深入找出專業網站內容,一方面也不錯失 Google 一般性搜尋裡的熱門資料。
這時候,進入這個自訂搜尋引擎的「設定」中。
拉到頁面下方,把網站清單右上角的選項改成「搜尋整個網路,但特別強調收錄的網站」。
這樣一來,這個自訂搜尋引擎的結果可能就長得像是下面這樣,我搜尋一個關鍵字,會找到其他我沒有加入的一般性熱門資料,但是我特別加入的網站結果也會浮現出來。
這種設定幫助我在一開始建立自訂搜尋引擎時,一邊可以同時找出其他還沒加入的專業網站與資料來源,一邊補充到我的搜尋引擎。
- 4. 進階設定:標籤分頁,只搜尋特定網站
但是上述的做法,就會伴隨有時候「我只想搜尋已經加入自訂搜尋清單的網站」的情況,這時候可以用分頁搜尋的方式來解決。
同樣進入自訂搜尋引擎的編輯畫面,這時候選擇「搜尋功能」,在「限制條件」頁面按下[新增],先輸入一個你自己決定名稱的標籤,例如我這裡設定為[收錄網站]。
然後回到[設定]頁面,把所有清單裡的網站都加上[收錄網站]這個標籤。
回到自訂搜尋引擎的搜尋畫面,可以看到搜尋結果中多了一個[收錄網站]的分頁,當我切換到這個分頁時,呈現的結果就是已經收錄在搜尋引擎清單裡並且加上[收錄網站]標籤的網站內容。
通常全部搜尋、收錄網站搜尋這兩個分頁,就可以很有效率的滿足我的研究需求。
- 5. 進階設定:搜尋中本地內容加權
如果你常常搜尋英文關鍵字,但是你希望在自訂搜尋引擎中更多的出現中文的資料怎麼辦?
我自己測試一個比較好的做法是,在編輯自訂搜尋引擎的[搜尋功能]中,切換到[進階]頁面,在[ Boost Results By Locale ]中選擇[台灣]。
這樣一來,在全部的混合搜尋中,不只會突顯我已經收錄的網站,還會特別突顯來自台灣的網站內容,增加我們搜尋到更多本地資料的機會。
- 6. 進階設定:版面完整寬度
最後,我還會進入[外觀與風格]設定中,把網頁搜尋的樣式改成「完整寬度」,因為這樣就會在同一頁完成搜尋並呈現搜尋結果,速度最快。
以上,就是我自己在進行一個新的企劃、新的專案時,會利用「 Google 自訂搜尋」來建立研究需要的知識庫(註2),幫助自己後續更容易深入挖掘相關資料的方法(註3),希望對大家有所幫助,好好利用這個免費的工具。
(註3:跟過去的自己取經:用第二大腦高效率思考的系統方法)
(註4:活用資料庫的資料收集法:試試加上這四個關鍵步驟!)
進入「 Google 自訂搜尋」網頁
轉貼本文時禁止修改,禁止商業使用,並且必須註明來自電腦玩物原創作者 esor huang(異塵行者),及附上原文連結:如何為每個研究專案建立一個 Google 自訂搜尋引擎?