取樣(Sampling) 是 GA 資料收集與呈現在報表中重要一環,您必須要暸解資料取樣的定義與邏輯,才能更清楚知道GA報表中指標數據的意義,本篇內容會針對Google官方的取樣的定義進行介紹,並用最簡單文字說明取樣的定義與邏輯。
名詞:取樣 / Sampling / 抽样 (繁體 /英文 /簡體)
本文內容
▎報表資料取樣定義
https://support.google.com/analytics/answer/6086088?hl=zh-Hant&ref_topic=6083659
這是指從流量中選取一組資料做為取樣,並回報從其中偵測到的趨勢。取樣是統計分析中常用的功能,分析一小組資料就能得到與分析所有資料類似的結果,而且還能縮減運算負荷及處理時間。
翔說:依據上述 Google Analytics 取樣定義來說,最容易暸解的說明
當GA收集的資料量非常大、查看報表的區間很長,或是有做資料區隔時,GA報表為了系統運算負荷,就會進行取樣的方式統計,這方式也可以加快報表處理時間。
取樣是統計學一種推論統計方法。
▎報表取樣發生條件
指定日期範圍中的工作階段數量超出資源類型的門檻
- 使用非預設報表
- 採用篩選器、區隔、維度,進行報表查詢
- 工作階段數量
- Analytics (分析) 標準版,資源層級的工作階段量達 50 萬個
- Analytics (分析) 360,資料檢視層級的工作階段量達 1 億個
翔說:依據上述取樣條件來說,最容易暸解的說明
一般實務上都是使用標準版,當您進行報表查詢條件操作,例如:更換日期、篩選器、區隔、變更維度查詢報表時,只要工作階段數超過50萬個,則該報表就會進行取樣統計。
▎報表資料取樣邏輯
假設以25%取樣率、查詢報表日期為5天為條件,資料取樣的邏輯是,擷取每一天的工作階段總量25%,進行資料統計產生報表。
以下方表格週一這天舉例,週一這天有20000個工作階段數,以25%取樣率進行取樣,所以週一會以該25%取樣的5oooo個工作階段數,進行資料統計。
週一 | 週二 | 週三 | 週四 | 週五 | |
---|---|---|---|---|---|
工作階段總數 | 200,000 | 100,000 | 200,000 | 300,000 | 200,000 |
25% 取樣率 | 50,000 | 25,000 | 50,000 | 75,000 | 50,000 |
▎資料收集取樣
GA追蹤碼進行資料收集時,也有做取樣的設定,預設是取樣率100%。
♦ 翔說:資料收集取樣實務上經驗說明
實務上來說,是不會去更改GA追蹤碼收集的取樣率,也避免去使用它!假設25%的資料收集取樣率,表示100人中只有25人的數據資料才會記入Google Analytics,這樣在資料收集就比較容易會失真。
況且,在查詢報表時,也會有資料取樣的條件發生,所以在資料收集這一段,應避免更改取樣率。
▎延伸閱讀