取樣 Sampling – GA 詞彙定義說明

取樣(Sampling) 是 GA 資料收集與呈現在報表中重要一環,您必須要暸解資料取樣的定義與邏輯,才能更清楚知道GA報表中指標數據的意義,本篇內容會針對Google官方的取樣的定義進行介紹,並用最簡單文字說明取樣的定義與邏輯。

 

名詞:取樣 / Sampling / 抽样 (繁體 /英文 /簡體)

 

 

本文內容

 

 

▎報表資料取樣定義

https://support.google.com/analytics/answer/6086088?hl=zh-Hant&ref_topic=6083659

這是指從流量中選取一組資料做為取樣,並回報從其中偵測到的趨勢。取樣是統計分析中常用的功能,分析一小組資料就能得到與分析所有資料類似的結果,而且還能縮減運算負荷及處理時間。

翔說:依據上述 Google Analytics 取樣定義來說,最容易暸解的說明

當GA收集的資料量非常大、查看報表的區間很長,或是有做資料區隔時,GA報表為了系統運算負荷,就會進行取樣的方式統計,這方式也可以加快報表處理時間。

取樣是統計學一種推論統計方法。

 


 

▎報表取樣發生條件

指定日期範圍中的工作階段數量超出資源類型的門檻

  • 使用非預設報表
    • 採用篩選器、區隔、維度,進行報表查詢
  • 工作階段數量
    • Analytics (分析) 標準版,資源層級的工作階段量達 50 萬
    • Analytics (分析) 360,資料檢視層級的工作階段量達 1 億

 

翔說:依據上述取樣條件來說,最容易暸解的說明

一般實務上都是使用標準版,當您進行報表查詢條件操作,例如:更換日期、篩選器、區隔、變更維度查詢報表時,只要工作階段數超過50萬個,則該報表就會進行取樣統計。

 


 

▎報表資料取樣邏輯

假設以25%取樣率、查詢報表日期為5天為條件,資料取樣的邏輯是,擷取每一天的工作階段總量25%,進行資料統計產生報表。

以下方表格週一這天舉例,週一這天有20000個工作階段數,以25%取樣率進行取樣,所以週一會以該25%取樣的5oooo個工作階段數,進行資料統計。

週一 週二 週三 週四 週五
工作階段總數 200,000 100,000 200,000 300,000 200,000
25% 取樣率 50,000 25,000 50,000 75,000 50,000

 


 

▎資料收集取樣

GA追蹤碼進行資料收集時,也有做取樣的設定,預設是取樣率100%。

GA資料收集取樣
GA資料收集取樣

 

♦ 翔說:資料收集取樣實務上經驗說明

實務上來說,是不會去更改GA追蹤碼收集的取樣率,也避免去使用它!假設25%的資料收集取樣率,表示100人中只有25人的數據資料才會記入Google Analytics,這樣在資料收集就比較容易會失真。

況且,在查詢報表時,也會有資料取樣的條件發生,所以在資料收集這一段,應避免更改取樣率。

 


 

▎延伸閱讀

 

 

發佈留言