关键词为 “数据挖掘” 的文章

明星预报

by Yan on 12月 19, 2008

今天你在酒吧里热捧的小乐队,不久的将来会成为超级明星么?也许你并不关心,甚至私下里希望他们保持原状,因为看多了流行后的毁灭。但乐队们也许会关心,唱片公司们更会关心。早一点签约潜力乐队,意味着掌握一棵摇钱树。

凭个人的喜恶是无法判断乐队是否会流行起来的。要做有价值的预测,或许得进行一下大范围的调查了。而且是分期、多次的调查,不然如何得到趋势。还在打电话,发传单,进行抽样调查么?不需要了,目前各种网络应用已经记录了异常丰富的数据,比如各种查询,因为查询意味着关注。

以色列特拉维夫大学的研究人员开发了一个软件,对美国最大的点对点文件分享网络 Gnutella 中每日数千万的查询数据进行了分析。他们发现,如果把查询按地域分类画出趋势图,其中指数增长的歌曲,不管它的初始查询数有多小,都是非常有可能成为全国范围内的大热门的,即使刚开始时来自别处的查询几乎为零。他们认为,地域性的指数增长可作为预测未来大范围流行的判据。这不难理解,因为乐队、歌手们成名之前多在当地小圈子里演出的,在当地形成逐渐壮大的粉丝群体是日后流行的先兆。

通过这种算法,他们的预测成功率据说可达 50%。比如 07 年的时候,Shop Boyz 在他们的家乡亚特兰大两周内就流行起来。“Party Like a Rockstar” 变成热门单曲,该组合也获得美国全国性的声誉,接着签约环球唱片公司。但在几周之前,Shop Boyz 就已经从以色列人的程序中蹦出来了。

高兴也好,反感也罢。