2010年10月7日星期四

协稳的假设有多强?

多元时间序列分析一个特别醒目的概念,就是协稳:若干个时间序列,他们可能每个都不平稳,但是他们的某个线性组合是平稳的。
在计算广告学实践中,我们考虑一个网站的若干视频,每个视频的日访问量序列看作一个时间序列。很少有哪个视频的访问量是平稳序列,因为人们总是喜新厌旧,一个视频刚上线的一段时间内,看的人越来越多,一段时间后,就渐渐地没什么人看了。但是在成熟、稳定的市场(而非快速增长的市场),一个网站的视频日访问总量在较长一段时间内是平稳的,因为随着老视频陆续淡出,不断有新的视频上线,形成协稳的格局。
当然这只是美好的假设。现在让我们来看看这个假设究竟有多强。
假设有N个视频,用N维时间序列X(t)表示。M个网站,用M维时间序列b(t)表示。假设视频和网站的多对多关系用M*N的0-1矩阵A表示:即A[i][j]=1当且仅当视频j出现在网站i上。于是有下列线性方程组:A*X(t)=b(t)
模型假设说每个网站的流量都平稳,也就是A*EX(t)=Eb(t)=b。考虑方程组AX=b的非负数解,下面简称解。
当方程组无解时,说明"每个网站的流量都平稳"的假设不成立。
当方程组解存在唯一时,X(t)也平稳,这是退化的情形,即所有视频的流量都平稳,这在现实世界很难发生。
当方程组解存在且不唯一时,才是模型假设的经典情形,即若干非平稳序列的线性组合平稳,由线性代数知识可知,此时A的行秩小于N是必要的。

没有评论: