预测的作用
上周参加一场学术圆桌论坛,讨论到一个问题:预测对社会科学的作用?
有一种观点:对社会科学来说,预测并不很重要,我们更关心的是解释,是因果关系。
我赞同社会科学对因果、对解释的重视,我要解释的是:预测的作用,并不仅在于预测,预测对因果、对解释也很重要。
简单来说,预测的目的是为了验证模型。
比如,对于人类,计算神经科学的一个主流看法是把人脑看成是一个“预测机”,或“贝叶斯脑”,即把认知过程理解成贝叶斯公式:
p(m|D) = p(D|m) p(m) / p(D)
其中 m 就是人脑对世界的理解,即模型;D 是对世界的观察;而 p(D|m) 被称为似然(Likelihood),就是在当前的模型下,得到某个观察的概率,比如m告诉我们太阳会从东边升起,而我们每天观察到太阳确实从东边升起,似然 p(D|m) 就很大。
似然代表了模型预测的准确性,似然越大,则预测越准,如果似然小,则说明模型不对,我们要更新模型了,比如某一天如果我们观察到太阳从西边升起,那就说明世界发生了很大的变化,我们以前的模型不对了,此时需要去研究怎么回事,从而更新我们的模型,也就是把原来的 p(m)(称为“先验”)更新为 p(m|D)(称为后验)。
所以,预测的作用是验证模型,当预测正确时,我们对模型就有了信心,当预测失败时,就会触发模型的更新(也被称为“注意力机制”,关于注意力机制,今后可以专门写一篇)。
人类的日常行为中充满了这种预测,比如我们用眼睛看周围环境,为什么会转动眼珠,不断观察?是因为视觉认知的过程,不仅仅是从外到内(从外部环境、到眼睛、到大脑)的被动接受,也受到由内而外的指导(大脑会根据认知模型,形成关于外部环境的预测,然后指导眼睛去观察,从而去验证模型);转动眼珠,就是为了能在不同的视角下,去验证大脑对外部环境的认知模型。
不仅生物体如此,人工智能系统同样如此,在机器学习中,对模型要进行测试,而测试的方法就是拿一些输入,让模型预测输出,再与实际的输出进行比较,从而验证模型的准确性。
对社会科学来说,预测的作用也不仅仅在于功能性的“预测”,而在于通过预测,验证社会科学模型的能力。现在有些说法,把模型分为解释模型、预测模型等,我觉得是不妥的。
当然,如何预测(即如何验证模型)也是很有讲究的。我们希望预测的效果具有泛化能力,即在不同的情况下,模型都能预测准,要达到很强的泛化能力,可以通过大量数据,此时数据中包含了各种不同情况;也可以结合因果,当模型有很强因果性时,它对未见过的情况,也往往有很强的推理能力。
因此,看重预测,也促使我们更关注模型的因果性和可解释性。