這個文章是直接介紹幾個實用的GA過濾設置,除了這個文章之外,如有更多時間,近期還想出另一篇文章會跟大家聊一聊GA的高級過濾功能(Custom Filter中的Advanced Filter),這個相對更加復雜一些。所以,這篇文章是初級篇,下一篇文章是高級篇。
Google Analytics的過濾功能簡介
Google Analytics的過濾設置其實包含兩大邏輯功能,第一種功能是我們通常意義上的過濾,即根據(jù)一定條件過濾掉一部分訪問者(本質上是過濾掉一部分流量),例如過濾掉所有來自北京的訪問者的流量,或是只保留網(wǎng)站某個子域(subdomain)的流量。 第二種功能則不是簡簡單單的過濾,而是類似于我們使用MS Office Word的“查找并替換”功能(實際上比這個功能更強大,因為實際上包括查找、替換和重組三種功能),即按照一定的條件把GA中的一部分屬性的表述替換或再組合為另外一種表述。例如,把campaign報告中campaign的英文名字替換為漢語名字。
這樣看來,我們可以發(fā)現(xiàn)Google Analytics的主要功能是:
1. 去除掉我們不想要的一部分流量;
2. 修改一種表述方法為另外一種,或者實現(xiàn)標準報告中無法實現(xiàn)的表述。
不過,其實還有第3、4種功能
3. 因為GA是可以不斷復制的profile的,GA的filter和profile的配合可以實現(xiàn)分析需要的細分功能。不過這個功能在GA的Advanced Segments出現(xiàn)之后就弱化了。
4. 我們還可以利用多個filter進行組合而實現(xiàn)類似“解釋編程”的高級功能。這種filter的組合再加上正則表達式的共同作用,能夠實現(xiàn)一些更復雜的過濾或者更精確的屬性表述。例如,我們知道SE(搜索引擎)都是提供Universal Search(就是除了文本搜索,還提供圖片、視頻等)的,但我們在GA中看到的流量可能都是來自Google / organic,我們如何區(qū)分流量是來自文本搜索還是圖片或是視頻搜索呢?這個實際上通過filter的組合能夠實現(xiàn)(不過這個很高深了,放在以后說)。
今天要談的這五個Google Analytics的過濾設置非常非常基礎,不熟練正則表達式也完全沒問題,只要照葫蘆畫瓢就行了。由于幾乎是我們每個使用GA的分析師都要用到的,建議把它們牢記在心。:)
安全通告:在開始下面的嘗試前,請注意!
請一定復制一個新的profile進行嘗試!
原因在于,filter和advanced segmentation不同,前者是在形成報告之前的過濾,因此過濾掉的數(shù)據(jù)肯定是不可能在該profile中出現(xiàn)了,而advanced segmentation是在形成報告之后再進行的操作,數(shù)據(jù)不會因為你的不恰當設置而丟失。所以,切記切記!否則Sidney就是害了大家。
如何復制profile,見下圖所示:
圖1
直接在同一個GA ID(例如我的GA ID是UA-4130899-1)后面點擊“+ Add new profile”,然后在下圖(圖2)中輸入你想要的profile的名字,然后點擊continue之后保存就行了。
圖2
是不是很簡單?搞定了之后,你就在剛才復制的profile下“胡作非為”吧!你以前的數(shù)據(jù)不會有任何問題了!現(xiàn)在,讓我們開始吧!
設置一:過濾掉自己對網(wǎng)站的訪問
你的網(wǎng)站最忠實的訪問者是你自己,毫無疑問。但是你自己的訪問數(shù)據(jù)也會混在其他用戶的訪問數(shù)據(jù)中,從而一定程度(程度大小取決于你網(wǎng)站的流量,如果你的網(wǎng)站流量跟新浪相差無幾,那么這個小節(jié)可以直接無視)上污染了網(wǎng)站真實用戶的訪問數(shù)據(jù)。
防止這種情況的最簡單的辦法是通過屏蔽某些IP地址來過濾掉自己的訪問,這種設置在GA中非常容易。方法如下:
1. 點擊你剛剛復制好的那個profile旁邊的edit按鈕。
圖3
2. 進入profile settings頁面后點擊“+ add filter”。
圖4
3. 在Create New Filter中用如下設置,然后輸入想取的filter的名字和自己的IP地址就好了。最后別忘了保存。
圖5
請注意,這里我們使用的是Predefined filter,也就是GA已經(jīng)預制好的幾類filter,主要就是解決這種類似的小問題。在這種filter中,不支持使用正則表達式。因此,GA自己的介紹:https://www.google.com/support/googleanalytics/bin/answer.py?answer=55496,其實是不正確的,因為其中應用了正則表達式。
你問我,如果是動態(tài)IP怎么辦?那么你可以用自定義filter(Custom filter)選取一個IP地址范圍進行過濾,這個時候要用到Custom Filter(自定義過濾)。例如,我想要過濾掉從121.33.33.33到121.33.38.254的IP段范圍,那么我的設置如下:
圖6
這里,我們在Filter Pattern中用到了正則表達式:^121\.33\.(33\.(3[3-9]|[4-9][0-9]|1([0-9][0-9])|2([0-4][0-9]|5[0-5]))|((3[4-7])\.([0-9]|[1-9][0-9]|1([0-9][0-9])|2([0-4][0-9]|5[0-5])))|38\.([0-9]|[1-9][0-9]|1([0-9][0-9])|2([0-4][0-9]|5[0-4])))$。哈哈,可怕吧!別擔心,其實你訪問這個地址,就能自動生成你IP段的正則表達式了:https://www.google.com/support/googleanalytics/bin/answer.py?answer=55572hl=en_USutm_id=ad。Google自己的這個工具很好用。
不過,這種方法可能會誤傷其他合理的訪問數(shù)據(jù),所以如果要精確地去除掉你每天毫無規(guī)律變動的IP地址,那么僅靠過濾功能本身就有點兒力不從心了。我們需要利用控制cookie和filter的結合來實現(xiàn),可以在這里找到一些線索:http://www.webmasterworld.com/forum39/4048.htm,這里不多說了。
設置二:改變Content報告中Top Content報告URI的大小寫
看看下面這個報告的情況是不是大家經(jīng)常遇到?
圖7
其實四個URL只代表著兩個頁面,但是由于GA是大小寫敏感(lowercase sensitive)的,因此它會認為這是不同的URL,代表著不同的頁面。
這可不太妙,對于page view這樣的度量,我們還可以直接加總,而要把該頁面的bounce rate或者avg. time on page合并起來,就有點兒麻煩了(當然其實也還是有辦法,這里按下不表,大家自己研究一下就能弄通)。所以,我們要想辦法讓GA識別這種情況。
利用Filter就能輕松解決,非常簡單。Filter的設置方法如下所示:
圖8
上一頁12 下一頁 閱讀全文