Google 使用一种称为“预

Buy Database Forum Highlights Big Data’s Global Impact
Post Reply
zihadhasan011
Posts: 254
Joined: Tue Dec 24, 2024 3:18 am

Google 使用一种称为“预

Post by zihadhasan011 »

估真实值”(ETV) 的方法。ETV 本质上是这样的:如果排序的计数列(在本例中为访问次数)非常低,则假设感兴趣的列(跳出率)大致是相关数据的平均值。换句话说,如果某一行有 1 次访问,平均跳出率为 75%,则将该行的跳出率 ETV 设置为 75%。由于从统计学上讲,1 次访问不足以得出任何真正的结论,因此我们基本上会忽略它。 另一方面,如果您的访问量非常高,则假设跳出率是准确的。很简单,对吧?那么中间的值呢?好吧,Google 将 ETV 设置在平均值和行跳出率之间的某个位置。


他们究竟使用多少是棘手的部分。 等式 这就是 Avinash 的帖 医生电话号码资源 子结束的地方,也是我真正开始的地方。我应该警告你——它不会像 Ben 那样复杂,但会涉及一些数学运算。在凌晨 4 点失眠之后,我拼凑了一个简化的加权排序方程。我将首先介绍它,解释它,然后提供一个包含一些实际示例的 Excel 电子表格。 假设我们有一个与上述完全相同的数据集 - 一组引荐网站的访问次数和跳出率。我们将需要 4 组变量: V = X 行的访问次数 B = X 行的跳出率 MV = 数据集的最大访问次数 AB = 数据集的平均跳出率 对于任何给定行,跳出率的 ETV – ETV(B) – 可以用以下公式表示: ETV(B) = ( V / MV * B ) + ((1 - ( V / MV )) * AB ) 非常清楚,对吧?其实并没有看上去那么糟糕。


我们举个例子——假设我们有以下数据(与上面相同的 4 个变量): V = 100 B = 80% MV = 500 AB = 60% ETV(B) 由两部分组成: 电压/MV*B=100/500*0.80=0.20*0.80=0.16​ 1 - (V / MV) * AB


因此,从本质上讲,我们对该行使用“实际”跳出率的程度取决于该行的访问值与顶级引荐来源的访问值的比例。 构建自己的 想亲自尝试一下吗?您可以下载我的Excel 电子表格,并在我自己网站的实际引荐访问的更大数据集上查看该公式的工作原理。虽然这复制了您在 Google Analytics 中已有的功能,但它可以用于 GA 中没有的各种应用程序,包括 PPC 指标(例如按质量得分计算的访问次数)。 Excel 工作簿中实际上有四张工作表: 基本 ETV 公式 Google 的 ETV 排序 加权 ETV 公式 基于对数的 ETV 公式 最后两个需要解释一下。
Post Reply