特斯拉CEO埃隆·马斯克最近表示,为了查明Twitter上的虚假/垃圾账户是否如该公司长期宣称的那样低于5%,他准备随机抽取100名粉丝作为研究样本。
然而,社交媒体、虚假信息和统计分析方面的专家表示,马斯克的分析方法存在严重缺陷。
马斯克在推特上表示,“为了找到答案,我的团队将随机抽取100名@推特粉丝。我会邀请其他人重复同样的过程,看看他们会有什么发现。”
马斯克解释道,“选择任何一个粉丝量大的账号,忽略前1000个粉丝,然后每10个选一个。我愿意接受更好的想法。”
脸书联合创始人达斯汀莫斯科维茨(Dustin Moskovitz)通过自己的推特账号对这个问题进行了评论。他指出,马斯克的方法事实上并不随机,使用的样本太少,留下了巨大的误差空间。
“我认为‘我不信任Twitter团队帮我取样’本身就是一个危险信号。”他说。
华盛顿大学教授卡尔·t .博格斯特伦合著了一本书,帮助人们理解数据,避免被网络上的虚假陈述所欺骗。他说,对任何Twitter账户中100名关注者的抽样调查都不应该是对一项440亿美元收购的“尽职调查”。
他说100人的样本量比社交媒体研究者研究这类东西的标准小了几个数量级。马斯克在使用这种方法时将面临的最大问题将是选择偏差。
“没有理由认为官方推特账号的粉丝是平台账号的代表性样本。也许机器人不太可能关注这个账号以避免被发现,或者也许他们更有可能关注它以便看起来像一个正常的账号。谁知道呢?但我就是无法理解马斯克除了用这个愚蠢的采样计划欺骗我们之外,还做了什么。”