2006-02-13 09:00:55阿輝

GOOGLE搜索從入門到精通v3.0 - 2

10,圖片搜索

我不得不承認,GOOGLE的圖片搜索功能真是個偉大的發明!!GOOGLE自稱可以檢索320,000,000張圖片,並稱自己為「互聯網上最好用的圖像搜索工具」。儘管目前該功能尚在B測試階段,但的確已經非常好用!

GOOGLE首頁點擊「圖像」鏈接就進入了GOOGLE的圖像搜索界面「images.google.com」。你可以在關鍵字欄位內輸入描述圖像內容的關鍵字,如「britney spears」,就會搜索到大量的小甜甜布蘭妮的圖片。我目前尚不是很清楚圖片的排列標準,不過以觀察來看,似乎圖片文件名完全符合關鍵字的結果排列比較考前,然後才按照普通的頁面搜索時的標準排列。

GOOGLE給出的搜索結果具有一個直觀的縮略圖(THUMBNAIL),以及對該縮略圖的簡單描述,如圖像文件名稱,以及大小等。點擊縮略圖,頁面分成兩禎,上禎是圖像之縮略圖,以及頁面鏈接,而下禎,則是該圖像所處的頁面。屏幕右上角有一個「Remove Frame」的按鈕,可以把框架頁面迅速切換到單禎的結果頁面,非常方便。

GOOGLE圖像搜索目前支持的語法包括「+」,「-」,「OR」,「site」和「filetype」。

示例:查找美國教育網上的宇宙大爆炸jpg圖片
搜索:「BIG BANG filetype:jpg site:edu」
結果:搜索有關 BIG BANG filetype:jpg site:edu 的圖片()。(試驗版) 共約有337項查詢結果,這是第1-20項 。 搜索用時1.99秒。
11,目錄內搜索

如果不想搜索廣泛的網頁,而是想尋找某些專題網站,可以訪問GOOGLE的分類目錄「http://directory.google.com/」,中文目錄是「http://directory.google.com/Top/World/Chinese_Simplified/」。

目前GOOGLE使用的分類目錄採用了ODP的內容。「Open Directory Project」是網景公司所主持的一項大型公共網頁目錄。由全世界各地的義務編輯人員來審核挑選網頁,並依照網頁的性質及內容來分門別類。因此,在某一目錄門類中進行搜索往往能有更高的命中率。另外,GOOGLE根據其專業的「網頁級別」(PageRank)技術對目錄中登錄的網站進行了排序,可以讓一般的檢索更具高效率。

示例:查找一下關於癌症治療以及護理方面的中文資料
搜索:先進入中文簡體分類目錄,再進入「健康」子目錄,確定選中「只在健康中搜索」單選項目。在搜索欄內填入「癌症」進行搜索。
結果:在分類健康項中搜索癌症。 共約有370項查詢結果,這是第1-10項 。 搜索用時0.05秒。

可以看到,上述查詢結果比普通的檢索更有效,因為在分類健康項中進行搜索剔除了很多不相關的諸如新聞之類的無效信息。不過,對於中文用戶而言,現在最大的問題是志願的中文目錄編輯太少,導致收錄站點太少,因此搜索結果範圍顯得過於狹隘。但願這個問題能隨著GOOGLE以及ODP項目在國內名聲的響亮而能得到改觀。
12,新聞組(USENET)搜索

新聞組有詳盡的分類主題,某些主題還有專人管理和編輯,具有大量的有價值信息。由於新聞組包含的信息實在是海量,因此不利用工具進行檢索是不大可能的。DEJA一直是新聞組搜索引擎中的佼佼者。2001年2月份,GOOGLE將DEJA收購併提供了所有DEJA的功能。現在,除了搜索之外,GOOGLE還支持新聞組的WEB方式瀏覽和張貼功能。

進入GOOGLE新聞組「http://groups.google.com/」,你有兩種信息查找方式。一種是一層層的點擊進入特定主題討論組,另一種則是直接搜索。現在,我們進行一個最簡單的搜索試驗,查找一下新聞組中關於山頂洞人的討論信息。

搜索:「山頂洞人」
結果:在各群組內搜索 山頂洞人 共約有18項查詢結果,這是第1-10項 。 搜索用時0.29秒。

搜索結果默認按照「留言內容」排列,但是你也可以點擊「依照日期」按鈕,讓帖子按照發佈日期排列。

因為新聞組中的帖子實在是多,而且又涉及一些普通搜索所沒有的語法,所以建議使用「高級群組搜尋」進入高級搜索界面。新聞組高級搜索提供留言內容、分類主題、標題、留言者、留言代碼、語言和發佈日期作為條件進行搜索。其中作者項指作者發帖所用的唯一識別號電子信箱。
13,GOOGLE的其他傑出功能

13.1,集成化的工具條

為了方便搜索者,GOOGLE提供了工具條,集成於瀏覽器中,用戶無需打開GOOGLE主頁就可以在工具條內輸入關鍵字進行搜索。此外,工具條還提供了其他許多功能,如顯示頁面PageRank等。最方便的一點在於用戶可以快捷的在GOOGLE主頁、目錄服務、新聞組搜索、高級搜索和搜索設定之間切換。欲安裝GOOGLE的工具條,可以訪問「http://toolbar.google.com/」,按頁面提示可以自動下載並安裝。不過,GOOGLE工具條目前只支持IE5.0以上版本。

對於經常進行網絡搜索者而言,GOOGLE工具條實在是必備的東西!!

13.2,單詞英文解釋

寫英文文章的時候,最頭疼的事情就是對某個英文單詞的用法不確定。現在有了GOOGLE,一切就迎刃而解了!無論你是想查找某個生詞的意思還是想瞭解某個單詞的用法,均可使用在線詞典。

進入英文GOOGLE,輸入你要查的單詞。舉個例子,我想查一下suggest的用法。結果如下:「Searched the web for suggest. Results 1 - 10 of about 8,000,000. Search took 0.08 seconds. 」注意看上面句子中,單詞suggest下出現了一個橫線,點擊這個鏈接,就跳轉到另外一個網站「http://www.dictionary.com/」,GOOGLE已經把單詞提交給該網站的查詢腳本。看看這個網站所提供的詳盡解釋吧。:)
13.3,網頁翻譯

你懂英文,但是你不見得就懂德文、法文、拉丁文。如果搜索出來的頁面是這些語言怎麼辦?呵呵,GOOGLE提供了網頁翻譯功能!!雖然目前只支持有限的拉丁語、法語、西班牙語、德語和葡萄牙文,但是我不得不承認,這是個傑出功能。

試著做以下搜索:「big bang site:fr」。這個表示查找關於宇宙大爆炸的法文網頁。看第一條結果:

The Big Bang Website - [ Translate this page ]
... A propos de Big Bang. Le dernier numero en date. Les anciens numeros. Autres
activites. Concerts progressifs en France. Emissions de radio. Liens.
perso.club-internet.fr/calyx/bigbang/ - 3k - Cached - Similar pages

有點暈。沒關係,點擊「Translate this page」按鈕。再看結果,嗯,大致能看明白,這原來是個叫「big bang」的樂隊的網站,與大爆炸無關...

機器翻譯是一個很前沿的人工智能課題,想指望翻譯出來的結果跟專門用英語撰寫的內容是不可能的。但西文間的互相轉譯比中英文機譯強得多得多了。至少能看明白。

13.4,搜索結果過濾

網絡上的成人內容浩如煙海,而且很多站點具有欺騙或者其他不良企圖,瀏覽者很容易掉入其中的陷阱。為此,GOOGLE新設立了成人內容過濾功能,見GOOGLE的設置頁面,http://www.google.com/preferences,最底下有一個選項SafeSearch Filtering。不過,中文狀態下的GOOGLE尚沒有這個功能。
14,搜索技巧之關鍵詞選擇初探

關鍵詞的選擇在搜索中起到決定性的作用,所有搜索技巧中,關鍵詞選擇是最基本也是最有效的。

例一:查找《鏡花緣》一書中淑士國酒保的酸話原文。

分析:如果按照一般的思路,找某部小說中的具體段落,就需要用搜索引擎先找到這本書,然後再翻到該段落。這樣做當然可以,但是效率很低。如果瞭解目標信息的構成,用一些目標信息所特有的字詞,可以非常迅速的查到所需要的資料。也就是說,高效率的搜索關鍵字不一定就是目標信息的主題。在上面的例子中,酒保談到酒的濃淡與貴賤的關係時,之乎者也橫飛。因此,可以用特定的詞語一下子找到目標資料。

搜索:「酒 貴 賤 之」,OK,找到的第一條信息就是鏡花緣的這一段落:「先生聽者:今以酒醋論之,酒價賤之,醋價貴之。因何賤之?為甚貴之?真所分之,在其味之。酒昧淡之,故而賤之;醋味厚之,所以貴之。...」

以上的關鍵字選擇技巧可以謂之「特定詞法」。

例二:「黃花閨女」一詞中「黃花」是什麼意思。

分析:「黃花閨女」是一個約定的俗語,如果只用「黃花閨女
黃花」做關鍵詞,搜索結果將浩如煙海,沒什麼價值,因此必須要加更多的關鍵詞,約束搜索結果。選擇什麼關鍵詞好呢?備選的有「意思」、「含義」、「來歷」、「由來」、「典故」、「出典」、「淵源」等,可以猜到的是,類似的資料,應該包含在一些民俗介紹性的文字裡,所以用諸如「來歷」、「由來」、「出典」等詞彙的概率更高一些。

搜索:「黃花閨女 黃花
由來」,查到「黃花」原來出典於《太平御覽》,與南朝的壽陽公主相關。如果想獲得第一手資料,那就可以用「太平御覽 壽陽公主」做搜索了。

以上的關鍵字選擇技巧可以謂之「近義詞法」。
例三:劉德華同志的胸圍是多少。

分析:首先聲明,這是某個MM要我做的搜索,我把它作為搜索案例而已,沒其他的意思。非常直接的搜索是,「劉德華 胸圍」,但事實上,這麼搜索出來的結果,儘是一些諸如「劉德華取笑莫文蔚胸圍太小」之類的八卦新聞,無法快速得到所需要的資料。可以想到的是,需要的資料應該包含在劉德華的全面介紹性文字中,除了胸圍,應該還包括他的身高,體重,生日等一系列相關信息。OK,這樣就可以進一步的增加其他約束性關鍵詞以縮小搜索範圍。

搜索:「劉德華 胸圍
身高」,沒有料到的情況發生了,網上炙手可熱的痞子蔡《第一次親密接觸》裡居然含有這樣關鍵字,阿泰「改編自劉德華《忘情水》的變態歪歌」、「用身高體重三圍和生日來加以編號」。好辦,把這部小說去掉,「劉德華 胸圍 身高 -阿泰」,OK,結果出來了,華仔胸圍84cm。說明一下,為什麼用「阿泰」而不用「第一次親密接觸」呢?這是因為小說的名字被轉載的時候可能有變動,但裡面角色的名字是不會變的。

以上的關鍵字選擇技巧可以謂之「相關詞法」。
15,常用搜索個案

15.1,找人

分析:一個人在網上揭示的資料通常有:姓名,網名,性別,年齡,畢業學校,工作單位,外號,住址,電話,信箱,BP,手機號碼,ICQ號,OICQ號等等。所以,如果你要瞭解一下你多年沒見過的同學,那不妨用上述信息做關鍵字進行查詢,也許會有大的收穫。

15.2,找軟件

分析一:最簡單的搜索當然就是直接以軟件名稱以及版本號為關鍵字查詢。但是,僅僅有軟件名稱和目標網站,顯然還不行,因為搜索到的可能是軟件的相關新聞。應該再增加一個關鍵字。考慮到下載頁面上常有「點擊此處下載」或者「download」的提示語,因此,可以增加「下載」或者「download」為關鍵字。
搜索:「winzip 8.0 下載」
結果:已搜索有關winzip 8.0
下載的中文(簡體)網頁。共約有6,670項查詢結果,這是第1-10項。搜索用時0.22秒。

分析二:很多網站設有專門的下載目錄,而且就命名為「download」,因此,可以用INURL語法直接搜索這些下載目錄。
搜索:「winzip 8.0 inurl:download」
結果:已搜索有關winzip 8.0
inurl:download的中文(簡體)網頁。共約有358項查詢結果,這是第1-10項。搜索用時0.44秒。

在互聯網上隨意的下載軟件是不安全的,因為供下載的軟件有可能帶有病毒或者捆綁了木馬,所以,對下載網站作一個限定,是一個穩妥的思路。可以用SITE語法達到這個目的。

共享軟件下載完之後,使用的時候,軟件總跳出警示框,或者軟件的功能受到一定限制。由於中國的網民多是窮棒子,所以應該再找一個註冊碼。找註冊碼,除了軟件的名稱和版本號外,還需要有諸如「serial
number」、「sn」、「序列號」等關鍵字。現在,來搜索一下winzip8.0的註冊碼。
搜索:「winzip 8.0 sn」
結果:已向英特網搜索winzip 8.0 sn. 共約有777項查詢結果,這是第1-10項。搜索用時0.30秒。
15.3,找圖片

除了GOOGLE提供的專門圖片搜索功能,還可以組合使用一些搜索語法,達到圖片搜索之目的。

分析一:專門的圖片集合,提供圖片的網站通常會把圖片放在某個專門目錄下,如「gallary」、「album」、「photo」、「image」等。這樣就可以使用INURL語法迅速找到這類目錄。現在,試著找找小甜甜布蘭妮的照片集。
搜索:「"britney spears" inurl:photo」
結果:已向英特網搜索"britney spears" inurl:photo. 共約有2,720項查詢結果,這是第1-10項。搜索用時0.23秒。

分析二:提供圖片集合的網頁,在標題欄內通常會註明,這是誰誰的圖片集合。於是就可以用INTITLE語法找到這類網頁。
搜索:「intitle:"britney spears" picture」
結果:已向英特網搜索intitle:"britney spears" picture. 共約有317項查詢結果,這是第1-10項。搜索用時0.40秒。

分析三:明星的FANS通常會申請免費個人主頁來存放他們偶像的靚照。於是用SITE語法指定某免費主頁提供站點,是個迅速找到圖片的好辦法。
搜索:「"britney spears" site:geocities.com」
結果:已在geocities.com內搜索有關"britney spears"的網頁。共約有5,020項查詢結果,這是第1-10項。搜索用時0.47秒。

15.4,找MP3

分析一:提供MP3的網站,通常會建立一個叫做MP3的目錄,目錄底下分門別類的存放各種MP3樂曲。所以,可以用INURL語法迅速找到這類目錄。現在用這個辦法找找老歌「say
you say me」。
搜索:「"say you say me" inurl:mp3」
結果:已向英特網搜索inurl:mp3 "say you say me". 共約有155項查詢結果,這是第1-10項。搜索用時0.17秒。

分析二:也可以通過網頁標題,找到這類提供MP3的網頁。
搜索:「"say you say me" intitle:mp3」
結果:已向英特網搜索"say you say me" intitle:mp3. 共約有178項查詢結果,這是第1-10項。搜索用時0.73秒。

當然,如果你知道某個網站的下載速度快,而且樂曲全,就可以用SITE語法先到該網站上看看有沒有目標樂曲。

15.5,找書

分析一:對我而言,常訪問的電子圖書館類網站就那麼幾個,比如文藝類的「www.shuku.net」。於是可以用SITE語法很簡單的找到某本書(如果該網站上有的話)。比如,「舊唐書 site:shuku.net」,就可以馬上找到該書。如果沒有,通常別的網站上也很難找到。因此,找書的關鍵,是你瞭解一大批著名的圖書館網站。
分析二:我上面介紹的第一項關鍵字選擇技巧特定詞法,對於迅速找到某書或者文章也是極其有用的,當然,這得建立在你已經讀過該書,對書的內容有印象的基礎上。比如如果瞭解堂吉訶德一書戰風車的大致內容,就可以用「吉訶德 風車 桑喬」迅速找到該書。

16,GOOGLE搜索FAQ

Q:如何全面的瞭解google.com?
A:查看網站相關頁面「http://www.google.com/about.html」。

Q:如何切換google.com的初始語言界面?
A:點擊搜索欄右邊的「使用偏好」(Preferences),選擇「界面語言」(Interface Language)中你期望的語言,點擊最下面的「設定使用偏好」(Save Preferences)按鈕。需要提醒的是,GOOGLE用cookie記錄這個偏好,所以如果你把瀏覽器的cookie功能關掉,就無法進行設定。

Q:如何設定每頁搜索結果顯示數量?
A:同上,進入使用偏好,在該頁的「查看結果」(Number of Results)選擇顯示結果數,數目越大,顯示結果需要的時間越長,默認是10項。

Q:搜索到的鏈接無法打開怎麼辦?
A:鏈接無法打開的原因很多,比如網站當機,或者頁面已經死掉等等,可以點擊GOOGLE的「網頁快照」查看在GOOGLE服務器上的網頁緩存。不過,如果該頁面是被當地ISP過濾的話,服務器緩存還是無法打開。唯一的辦法在於利用代理服務器,然後在URL欄內輸入鏈接的IP地址。

Q:打開搜索結果的鏈接,可是該頁面太大,很難找到一下子找到目的資料怎麼辦?
A:直接打開「網頁快照」,GOOGLE會把關鍵詞用不同顏色標記出來,很容易找到。

Q:點擊每個查詢結果的時候,我想單獨彈出窗口,這該怎麼辦?
A:進入「使用偏好」界面,注意底部有個「結果視窗」項目,選中「開啟新視窗以顯示查詢結果」復選框然後存儲設置就可以了。

17,後記

這個小文章的3.0版本終於更新完成,我終於可以吁口氣了。寫這個搜索普及文章的初衷和動力在於我以及我的朋友因為使用Internet搜索引擎而使得工作和學習變得更加輕鬆有趣,我想應該有更多的人來分享這種愉悅。需要提及的是,這個小文章的繼續和更新,多虧了新浪網友「搜索引擎9238」的大力幫助和鼓勵。如果沒有他的熱忱意見,我想此文會遜色的多了。其他提供過幫助和意見的網友就一併謝過了。希望你們能繼續給出意見。