使用CDN之后APACHE日志記錄中IP地址不正確的解決方案

這篇文章主要介紹了使用CDN之后APACHE日志記錄中IP地址不正確的解決方案,需要的朋友可以參考下

最近在搞APACHE日志分析,裝好了awstats之后,這兩天進(jìn)行了觀察,

報(bào)表日期 月 1 月 2010

首次參觀日期 2010年01月12日 11:04

最近參觀日期 2010年01月13日 23:59

參觀者 參觀人次 網(wǎng)頁數(shù) 文件數(shù) 字節(jié)

瀏覽器流量 * 77 226 (2.93 參觀人次/參觀者) 508979 (2252.11 網(wǎng)頁數(shù)/參觀) 509492 (2254.38 文件數(shù)/參觀) 13.67 G字節(jié) (63430.28 K字節(jié)/參觀)

非瀏覽器流量 * 117312 122716 736.24 M字節(jié)

這邊的結(jié)果很讓人費(fèi)解,通過google統(tǒng)計(jì)網(wǎng)站的獨(dú)立IP訪問量有2W做,這里顯示的數(shù)字相差甚遠(yuǎn)。 后面的網(wǎng)頁數(shù)和文件數(shù)又都與實(shí)際相吻合。 經(jīng)過查找原因發(fā)現(xiàn) apache日志里記錄的IP地址不正確,大部分都是cdn的節(jié)點(diǎn)地址。 產(chǎn)生的原因很顯然是因?yàn)镃DN造成的,之前在網(wǎng)站后臺(tái)程序里讀取用戶IP地址也出現(xiàn)了類似問題。 可以使用print_r($_SERVER) (PHP語言),查找到真實(shí)的用戶IP地址,本站為 $_SERVER[‘HTTP_CDN-SRC-IP’]. 這個(gè)是CDN攜帶的真實(shí)的客戶IP地址(這里不計(jì)較用戶是否使用代理)。 但在APACHE的日志記錄里如何使用這個(gè)值呢? 本人在GOOGLE和百度里查找了許久都沒有找到相應(yīng)的資料或者說解決方案,只好自己思考尋求了。

仔細(xì)看了下APACHE里日志記錄的相關(guān)配置,針對(duì)LogFormat:

LogFormat “%h %l %u %t /”%r/" %>s %b /"%{Referer}i/" /"%{User-Agent}i/"" combined

我思索里面的%{Referer}和%{User-Agent} 是如何取得的, 這兩個(gè)是在程序里也是經(jīng)常會(huì)用到的東西,客戶端發(fā)送請(qǐng)求的時(shí)候 這兩個(gè)信息都是作為頭詳細(xì)發(fā)送到服務(wù)器的。后來查看了下訪問時(shí)的所有頭信息,如下:

復(fù)制代碼 代碼如下:

Array

(

[Cdn-Src-Ip] => 222.44.46.58

[Accept] => image/gif, image/jpeg, image/pjpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword,/

[Accept-Language] => zh-cn

[User-Agent] => Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727)

[Host] =>?www.875.cn

[Cookie] => __utma=217127135.1188793388.1263188369.1263364666.1263368206.5;嬰兒起名http://www.bbqmw.net/qm_yeqm

__utmz=217127135.1263368206.5.2.utmcsr=211.167.92.250|utmccn=(referral)|utmcmd=referral|utmcct=/cgi-bin/awstats/awstats.pl; viewedShopsID=621; viewedShopsPP=%u6B27%u5C1A%u574A

[Accept-Encoding] => gzip

[Via] => 1.1 hnay40:80 (Cdn Cache Server V2.0)

[Connection] => keep-alive

)

當(dāng)然rerfer的時(shí)候也會(huì)有rerfer信息出現(xiàn)在頭部信息里,上面也有Cookie、Host、User-Agent等信息,這些信息都是可以在apache配置文件里可以使用的變量,當(dāng)然這里Cdn-Src-Ip正是我想要的客戶的真實(shí)IP地址。 于是推測${Cdn-Src-Ip}在日志記錄格式里應(yīng)該也是可以使用的。 后面的i應(yīng)該是指忽略大小寫的意思。于是得出一個(gè)解決方案:

添加一個(gè)新的logformat信息

復(fù)制代碼 代碼如下:

LogFormat “%{Cdn-Src-Ip}i %l %u %t /”%r/" %>s %b /"%{Referer}i/" /"%{User-Agent}i/"" combinedcdn

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容