流量統(tǒng)計(jì)原理主要有兩種:傳統(tǒng)的基于日志文件統(tǒng)計(jì)和當(dāng)前較為流行的基于腳本(JavaScript等)統(tǒng)計(jì)。
基于日志文件的統(tǒng)計(jì)
通過分析網(wǎng)站后臺的日志文件來統(tǒng)計(jì)訪客的瀏覽和點(diǎn)擊行為。這種方法的優(yōu)點(diǎn)是簡單方便,無需修改網(wǎng)頁代碼,可以收集網(wǎng)絡(luò)爬蟲數(shù)據(jù)等。缺點(diǎn)是網(wǎng)站日志包含所有日志數(shù)據(jù),需預(yù)處理來提升數(shù)據(jù)質(zhì)量;而且無法統(tǒng)計(jì)到頁面緩存導(dǎo)致的緩存瀏覽數(shù)據(jù)。
基于腳本的統(tǒng)計(jì)
此方法需要在網(wǎng)站的html代碼中嵌入一段腳本(JavaScript等)用于統(tǒng)計(jì)訪客的瀏覽等行為。這種方法的優(yōu)點(diǎn)是技術(shù)難度低,只需嵌入腳本代碼,無需配置服務(wù)器;能夠快速獲取點(diǎn)擊、響應(yīng)等數(shù)據(jù)并方便展現(xiàn);不需要擔(dān)心緩存帶來的影響,數(shù)據(jù)的準(zhǔn)確度較高。缺點(diǎn)主要是無法統(tǒng)計(jì)網(wǎng)絡(luò)爬蟲的信息。當(dāng)前主流的流量分析系統(tǒng)絕大部分采用此種方法收集數(shù)據(jù),包括百度統(tǒng)計(jì)和谷歌分析等。以下為網(wǎng)站分析工具的JavaScript收集數(shù)據(jù)流程圖:
轉(zhuǎn)載請保留原文地址: http://dchs1688.cn/show-219.html