Algorithms for Adobe Analytics Anomaly Detection

Algorithms for Adobe Analytics Anomaly Detection 使用的算法是

  • Holt Winters Multiplicative (Triple Exponential Smoothing)
  • Holt Winters Additive (Triple Exponential Smoothing)
  • Holts Trend Corrected (Double Exponential Smoothing)

这三种算法组成了季节指数平滑模型。

upper_bound Upper level of the prediction interval. Values above this level are considered anomalous.

Represents a 95% confidence that values will be below this level.

lower_bound Lower level of the prediction interval. Values below this level are considered anomalous.

Represents a 95% confidence that values will be above this level.

forecast The predicted value based on the data analysis. This value is also the middle point between the upper and lower bounds.

 

学习T-Test

先上视频

这个介绍的更详细

Critical Value 在线计算
Student’s T Critical Values

Conf. Level 50% 80% 90% 95% 98% 99%
One Tail 0.250 0.100 0.050 0.025 0.010 0.005
Two Tail 0.500 0.200 0.100 0.050 0.020 0.010
df = 1 1.000 3.078 6.314 12.706 31.821 63.657
2 0.816 1.886 2.920 4.303 6.965 9.925
3 0.765 1.638 2.353 3.182 4.541 5.841
4 0.741 1.533 2.132 2.776 3.747 4.604
5 0.727 1.476 2.015 2.571 3.365 4.032
6 0.718 1.440 1.943 2.447 3.143 3.707
7 0.711 1.415 1.895 2.365 2.998 3.499
8 0.706 1.397 1.860 2.306 2.896 3.355
9 0.703 1.383 1.833 2.262 2.821 3.250
10 0.700 1.372 1.812 2.228 2.764 3.169
11 0.697 1.363 1.796 2.201 2.718 3.106
12 0.695 1.356 1.782 2.179 2.681 3.055
13 0.694 1.350 1.771 2.160 2.650 3.012
14 0.692 1.345 1.761 2.145 2.624 2.977
15 0.691 1.341 1.753 2.131 2.602 2.947
16 0.690 1.337 1.746 2.120 2.583 2.921
17 0.689 1.333 1.740 2.110 2.567 2.898
18 0.688 1.330 1.734 2.101 2.552 2.878
19 0.688 1.328 1.729 2.093 2.539 2.861
20 0.687 1.325 1.725 2.086 2.528 2.845
21 0.686 1.323 1.721 2.080 2.518 2.831
22 0.686 1.321 1.717 2.074 2.508 2.819
23 0.685 1.319 1.714 2.069 2.500 2.807
24 0.685 1.318 1.711 2.064 2.492 2.797
25 0.684 1.316 1.708 2.060 2.485 2.787
26 0.684 1.315 1.706 2.056 2.479 2.779
27 0.684 1.314 1.703 2.052 2.473 2.771
28 0.683 1.313 1.701 2.048 2.467 2.763
29 0.683 1.311 1.699 2.045 2.462 2.756
30 0.683 1.310 1.697 2.042 2.457 2.750
40 0.681 1.303 1.684 2.021 2.423 2.704
50 0.679 1.299 1.676 2.009 2.403 2.678
60 0.679 1.296 1.671 2.000 2.390 2.660
70 0.678 1.294 1.667 1.994 2.381 2.648
80 0.678 1.292 1.664 1.990 2.374 2.639
90 0.677 1.291 1.662 1.987 2.368 2.632
100 0.677 1.290 1.660 1.984 2.364 2.626
z 0.674 1.282 1.645 1.960 2.326 2.576

学习卡方检验

因为是数学是体育老师教的,找了半天针对小白的卡方检验文章。看到这篇http://www.cnblogs.com/emanlee/archive/2008/10/25/1319569.html
介绍的非常详细而且还有例子。
还有一篇短的 – 卡方校验的意义

还有一个用Excel做卡方的文章 – https://wenku.baidu.com/view/c4884479168884868762d697.html

两个已经做好的Excel:
Chi Squared Test
chi-square_test 网站分析实战
内部自己做的置信度计算:11 VT Confidence Calculate

非常好的课件 Doc 文件
检验或卡方检验和校正卡方检验的计算

还有R代码
x = matrix(c(413,37,425,58),nc = 2 , byrow = T)
chisq.test(x)

还有个p值计算http://zh.wikihow.com/%E8%AE%A1%E7%AE%97P%E5%80%BC
https://zh.wikipedia.org/wiki/%E5%8D%A1%E6%96%B9%E5%88%86%E4%BD%88

x2分布临界值表(卡方分布)http://www.cnblogs.com/emanlee/archive/2008/10/25/1319557.html

一个解释详细的视频,狠推荐一下

Update 2017-08-16: 视频里介绍的期望值是给定的。上面文章里的期望值是通过计算得出的。

学习好差差差差

看了好多关于差的概念,从上次学习正态分布的准备开始,已经被差弄得头昏脑胀了。今天有遇到了个极差

例如 :12 12 13 14 16 21
这组数的极差就是 :21-12=9
其实内容很简单。但是简单的内容被名词化以后,我就懵B了。

天下没有免费的午餐

看了王福重的人人都爱经济学,认识了天下没有免费的午餐的真正含义。以前每到看到这句话,联想的都是万恶的资本家提供的暗藏玄机的免费午餐。摘抄一段书里的描述。

“天下没有免费的午餐。”首先说这句话的,是经济学大师弗里德曼。当你也这样说的时候,你可能误会了它本来的含义。它的本义是说,人家花钱请你吃饭,你没有买单,可是你是有代价的。因为你吃这顿饭的时间,可以用于做其他事情,这些事情,对你是有意义、有价值的。你把时间用于白吃这顿饭,就失去了这些本来能有的价值。 
  这就是机会考虑。它提示我们,做事的真正成本,不是为做一件事已经付出的多少,而是为做它所必须放弃的那些东西。当你面临两难选择的时候,你应该想想哪种选择所放弃的更多,两难也就不难了。

帕雷托最优

帕雷托最优(Ottimo paretiano)

帕雷托最优是指资源分配的一种理想状态。给定固有的一群人和可分配的资源,如果从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好,这就是帕雷托改善。帕雷托最优的状态就是不可能再有更多的帕雷托改善的状态;换句话说,不可能再改善某些人的境况,而不使任何其他人受损。

继续阅读“帕雷托最优”