原文地址:http://www.guokr.com/blog/480879/
只要上網(wǎng),我們的信息就會(huì)被收集,而如果沒(méi)有我們留下的蛛絲馬跡,幾乎什么事兒也干不了。使用其他系統(tǒng)時(shí)的情況也一樣,特別是使用手機(jī)的時(shí)候,手機(jī)網(wǎng)絡(luò)隨時(shí)都知道我們?cè)谀睦?。如果是在戶外,支持GPS的手機(jī)(現(xiàn)在的智能手機(jī)幾乎都支持)定位用戶的誤差不超過(guò)10米,而且隨時(shí)都會(huì)報(bào)告你的位置。(我的手機(jī)報(bào)告我的位置時(shí)誤差也只有20米,而我是在自己的辦公室里,辦公室所在的大樓屬于中等規(guī)模建筑。)有些數(shù)碼相機(jī)也帶GPS,可以在照片中編入地理位置信息,這種做法被稱為打地理標(biāo)簽。
把多個(gè)來(lái)源的跟蹤信息匯總起來(lái),就可以繪制一幅關(guān)于個(gè)人的活動(dòng)、喜好、財(cái)務(wù)狀況,以及其他很多方面的信息圖。這些信息最起碼可以讓廣告客戶更精準(zhǔn)地定位我們,讓我們看到樂(lè)意點(diǎn)擊的廣告。不過(guò),跟蹤數(shù)據(jù)的應(yīng)用可遠(yuǎn)不止于此。這些數(shù)據(jù)還可能被用在很多我們意想不到的地方。比如根據(jù)收入把人分成三六九等,在貸款時(shí)區(qū)別對(duì)待,或者更糟糕地,被人冒名頂替,被政府監(jiān)控,被人圖財(cái),甚至害命。
怎么收集我們的瀏覽信息呢?有些信息會(huì)隨著瀏覽器的每一次請(qǐng)求發(fā)送,包括你的IP地址、正在瀏覽的頁(yè)面(referrer,即來(lái)源頁(yè))、瀏覽器的類(lèi)型和版本、操作系統(tǒng),還有語(yǔ)言偏好。
此外,如果服務(wù)器的域中有cookie,那么這些“小甜餅”也會(huì)隨瀏覽器請(qǐng)求一塊發(fā)送。根據(jù)cookie的規(guī)范,只能把這些保存用戶信息的小文件發(fā)給最初生成它們的域。那還怎么利用cookie跟蹤我對(duì)其他網(wǎng)站的訪問(wèn)呢?
要知道答案,就得明白鏈接的工作原理。每個(gè)網(wǎng)頁(yè)都包含指向其他頁(yè)面的鏈接(這正是“超鏈接”的本義)。我們都知道鏈接必須由我們主動(dòng)點(diǎn)擊,然后瀏覽器才會(huì)打開(kāi)或轉(zhuǎn)向新頁(yè)面。但圖片不需要任何人點(diǎn)擊,它會(huì)隨著頁(yè)面加載而自動(dòng)下載。網(wǎng)頁(yè)中引用的圖片可以來(lái)自任何域。于是,在瀏覽器取得圖片時(shí),提供該圖片的域就知道我訪問(wèn)過(guò)哪個(gè)頁(yè)面了。而且這個(gè)域也可以在我的計(jì)算機(jī)上存放cookie,并且收到之前訪問(wèn)過(guò)的域所產(chǎn)生的cookie。
以上就是實(shí)現(xiàn)跟蹤的秘密所在,下面我們?cè)偻ㄟ^(guò)例子來(lái)解釋一下。假設(shè)我想買(mǎi)一輛新車(chē),因此訪問(wèn)了toyota.com。我的瀏覽器因此會(huì)下載60 KB的HTML文件,還有一些JavaScript,以及40張圖片。其中一張圖片的源代碼如下:

這個(gè)img標(biāo)簽會(huì)讓瀏覽器從ad.doubleclick.net下載一張圖片。這張圖片只有1像素寬、1像素高,沒(méi)有邊框,而且很可能是透明的,總之頁(yè)面上看不見(jiàn)它。當(dāng)然,這張圖片根本就沒(méi)想讓人看到。當(dāng)我的瀏覽器請(qǐng)求它時(shí),DoubleClick會(huì)知道我正在瀏覽豐田汽車(chē)公司網(wǎng)站的某個(gè)頁(yè)面,而且(如果我允許)還會(huì)在我的計(jì)算機(jī)中保存一個(gè)cookie文件。要是我隨后又訪問(wèn)了一個(gè)內(nèi)置DoubleClick圖片的網(wǎng)站,DoubleClick就可以繪制一張我的“足跡圖”。如果我的“足跡”大都留在汽車(chē)網(wǎng)站上,DoubleClick會(huì)把這個(gè)信息透露給自己的廣告客戶。于是乎,我就能看到汽車(chē)經(jīng)銷(xiāo)商、購(gòu)車(chē)貸款、修車(chē)服務(wù)、汽車(chē)配件等等各種廣告。如果我的“足跡”更多與交通事故或止疼有關(guān),那么就會(huì)看到律師和醫(yī)生投放的廣告。
DoubleClick(現(xiàn)為谷歌所有)在拿到用戶訪問(wèn)過(guò)的站點(diǎn)信息后,會(huì)根據(jù)這些信息向豐田等廣告客戶推銷(xiāo)廣告位。豐田公司繼而利用這些信息定向投放廣告,而且(可能)會(huì)參考包括我的IP地址在內(nèi)的其他信息。(DoubleClick不會(huì)把這些信息賣(mài)給任何人。)隨著我訪問(wèn)的頁(yè)面越來(lái)越多,DoubleClick就可以繪制一幅關(guān)于我的更詳細(xì)的圖畫(huà),借以推斷我的個(gè)性、愛(ài)好,甚至知道我已經(jīng)60多歲了,是個(gè)男的,收入中上,住在新澤西中部,在普林斯頓大學(xué)上班。知道我的信息越多,DoubleClick的廣告客戶投放的廣告就越精準(zhǔn)。到了某個(gè)時(shí)刻,DoubleClick甚至可以確定那個(gè)人就是我,盡管大多數(shù)公司都聲稱不會(huì)針對(duì)具體的某個(gè)人??墒羌偃缥业拇_在某些網(wǎng)頁(yè)中填過(guò)自己的名字和電子郵件地址,那誰(shuí)也不敢保證這些信息不會(huì)被傳播。
這套互聯(lián)網(wǎng)廣告系統(tǒng)設(shè)計(jì)得極其精密。打開(kāi)一個(gè)網(wǎng)頁(yè),這個(gè)網(wǎng)頁(yè)的發(fā)布者會(huì)立即通知雅虎的Right Media或谷歌的Ad Exchange,說(shuō)這個(gè)網(wǎng)頁(yè)上有一個(gè)空地兒正虛位以待,可以顯示廣告。同時(shí)發(fā)過(guò)去的還有瀏覽者的信息(例如,25到40歲之間、單身、住在舊金山,是個(gè)技術(shù)宅,喜歡泡館子)。于是,廣告客戶會(huì)為這個(gè)廣告位而競(jìng)價(jià),勝出者的廣告將被插入到這個(gè)網(wǎng)頁(yè)中。整個(gè)過(guò)程不過(guò)零點(diǎn)幾秒而已。

以上內(nèi)容選自《世界是數(shù)字的》