本讲座选自清华大学心理学系教授委员会主任、心理学与认知科学研究中心主任蔡曙山教授于2015年12月10日在清华大数据“技术·前沿”系列讲座上所做的题为《经验、认知与大数据》的演讲。

刚才我看了一下调查的情况,大部分同学或者老师第一次参加认知科学的学术报告,对于大数据,大部分同学也是第一次参加,这应该说是当前最前沿的两个学科,二者之间有什么关系呢?这个关系就是“经验”,“经验”把他们联系起来,“经验”在我的报告当中始终扮演最重要的角色。


我个人的学术生涯,比较杂,讲得好听一点是比较综合交叉的学科背景。认知科学就是一个综合交叉的学科,我做过哲学、数学和逻辑学、语言学,语言学主要做语用学,也做过长时期的计算机科学与人工智能,自己编过程序,做过软件。来清华大学以后组建心理学,认知科学。为什么喜欢认知科学?因为我的背景做认知科学比较有优势。


简单介绍一下认知科学产生的背景。在上世纪50年代,我把它称之为“轴心时代”,是“心智探秘的启航”的时代。这个时代在计算机科学、语言学、心理学、生物学和生命科学这些领域都发生了重大的变化,发生了革命。计算机科学是50年代在美国第一台计算机出现,计算机逐渐演变为日常生活中必不可少的东西,离开计算机寸步难行。再后面出现了网络、手机,都是这次革命带来的结果。
语言学,在上世纪50年代主要是掀起的语言革命,使我们彻底认识了语言的本质。语言是我们最亲密的东西,我们每天都和语言打交道,离开了语言,人就不能称其为人,它的探秘是在上世纪50年代。
心理学,从行为主义心理学专项到认知心理学,也是发生了革命。社会学和生命科学,大家知道生命遗传的密码——DNA,从50年代开始探索它的秘密,到上世纪末,人类基因组的测序。这些领域都发生了革命。这些领域当中发生革命的共同点是什么呢?他们都把焦点对准一个共同的东西,就是Mind,这是非常神奇的。在这样的背景下,美国人感到将来的发展就是要揭开Mind的秘密。中文将它翻译成“心智”,有些文献翻译成“心灵”,我认为这个翻译是错的,因为它和古代的心灵哲学会发生混淆,心灵是有实体的,心智是没有实体的。在这样的背景下,这些学科把他们革命的目标放在心智上,要把这些学科综合起来,做一个新的学科框架,做一个新的学科的研究,这就是认知科学。

这是众所周知的认知科学的学科结构框架,六个学科,哲学、语言学、人类学、神经科学、计算机科学、心理学,都把目标对准了心智。比如说哲学,近代哲学的认识论研究人是怎么认识的,这是与心智相关的。心理学,从50年代以后告别行为主义心理学的时代,进入认知心理学的时代,核心就是心智。语言学,因为先天语言能力的提出,使他去寻找语言和心智之间的关联。计算机科学,做大数据的都知道它和心智的关联是AI(人工智能)。人类学,从150亿年的漫长历史当中,生命是怎么诞生的,从最初的简单生命到现在的人,心智在哪个阶段产生的,人类心智与动物心智的区别是什么?这是人类学要研究的内容。神经科学,就是脑和神经系统,直接和心智关联的。这六大学科在认知科学建立起来之后,在各自的学科领域又产生了新学科。哲学产生的叫心智哲学,现在欧美一流大学哲学系的教授大部分都是做心智哲学的研究,哈佛大学的哲学系20多名教授,有十多名在做心智哲学。认知心理学,这是心理学和认知学结合的,认知语言学,也叫语言、逻辑与认知。认知人类学,也叫文化、进化与认知,研究心智是如何产生的。


刚才这个图有没有问题呢?我做认知科学16年,在这之前也没有提出过异议,我认为这是理所当然的,认知科学就是这样的东西,由六大结构组成,诞生出新的学科,他们之间又交叉出更新的学科,有没有问题呢?经过这十多年的思考,我认为是有问题的。这是认知科学的学科结构,认知科学由这些学科来支撑,认知科学研究的对象是什么呢?是研究哲学、语言学、心理学、计算机科学、人类学、神经科学的吗?不是。认知科学的研究对象是人类认知的五个层级。认知科学的目标是什么?不是那六个学科,而是这五个层级的心智和认知。
人类的Mind可以分成五个层级,研究人的大脑对信息加工的过程才是认知科学研究的对象。


低层级的认知决定高层级的认知,神经认知决定心理认知,心理认知决定语言认知,如此类推。上面的认知要影响下面的认知,文化对思维是有非常重要的影响,思维对语言是有非常重要的影响。语言和思维到底谁决定谁?我有逻辑学的背景,我做报告的时候,逻辑学的人跟我说,到底谁决定谁?我可以告诉大家语言决定思维,但是思维会影响到语言。低级认知是人类以外的动物所具有的认知,高阶认知是人类所特有的认知。


讲心智的进化,左右脑的分工,在过去几千年,人类由左脑控制。今天所讲的内容都要落实到经验上面去,每一个层级都可以看到经验所起的作用。

我们可以画一个心智进化图,除了单细胞动物之外,其他具有神经细胞和神经系统的动物都具有心智和认知,果蝇是具有神经系统和大脑的最小的动物,神经科学家常常用它来做研究。后来出现两栖类、哺乳类动物,然后是灵长类动物,进化的最高端是人类和复杂的大脑。


有一个实验,有一只青蛙,饿几天以后让它捕食,左脑控制它应该从右边捕食,先让它喜欢吃的蚂蚱从左边进入它的视野,它没有任何反应,因为左眼进入它的视野,是右脑管它的视野,右脑不管进攻。这个蚂蚱如果从右边进入视野,一进入视野马上被捕食。左右脑的分工是上世纪神经科学领域最重要的研究结果。左右脑分工有趣的事情太多了,大家的身上也有很多例子,由于时间原因我就不一一举例了。

为什么今天要强调“经验”这两个字?在认知科学建立起来以前,人们是不够重视右脑的,人们重视的是左脑,所以上世纪,乃至于上上世纪,甚至两千年以来,人们重视的是左脑,重视的是理性思维。在人的左右脑发育进化过程当中,左脑发育的更充分还是右脑发育的更充分?左脑。为什么?为了生存,在过去的时代,人类处于食物不足,或者是饥饿的时代,捕食是第一要务,左脑发育的更充分,我们的逻辑思维、进攻能力很强,右脑往往被忽略。认知科学建立之后,要充分重视右脑,充分重视经验、直觉、心理的能力。
下面讲一下经验转向。如果用一句话来概括认知科学的特征,重要的就是经验转向,从唯理的科学转向经验的科学。数理化天地生、文史哲政经法是寻求统一的科学原理,用统一的原理来解释人类的活动,这种统一科学原理越来越受到挑战,统一科学原理解释不了个体差异性,认知科学要解释个体差异性。如果我们按照统一的数学和逻辑思维来认知人类本身的话,人类就千篇一律了。我们看同一部电影、同一本书应该有完全相同的看法,但是不可能,原因就是在于你的右脑让你所表现出来的心智、情感、情绪和你的亲兄弟、亲姐妹都会不同。
心智在本质上是涉身的。正是因为心智的差异性决定了个体的差异性,否则无法解释为什么会有这么多不同。人和动物的心智有些什么不同呢?人类的心智是以语言为载体的、是以思维和文化为特征的,动物是没有的,动物有心智,但是它的心智是行为的心智,它的心智只是一种刺激反应的行为方式。罗素讲过一句非常深刻的话,狗对主人的忠实不会用语言来表达,但是它会用行为来表达,它偶尔也会发出一些声音表达它对主人的忠诚。但是狗不会说“亲爱的主人啊,我和我的父母虽然很贫穷,但是我对你是无比的忠诚的啊!”,狗无法表达这样的思想,我们看到欧美的流浪者,他身边都有一条非常漂亮的狗忠实的趴在他身边,它们用行为来表达对主人的忠诚。东方人和西方人具有不同的心智。这个图是很有意思的,在解决问题的方式上,西方人一根筋,直接从起点到达目标。东方人到达目标要绕十万八千里。西方人是左脑型的,东方人是右脑型的,有证据吗?巴黎的典型建筑是埃菲尔铁塔,中国是万里长城,我上长城的时候就在想一个问题,这个长城到底用过吗?还有大学校园,西方人是开放的,东方人都用围墙围起来。在思维上,西方人重演绎,东方人重类比和归纳。不同民族有不同的心智特征,我们是农耕的民族,农耕民族和游牧民族有不同的文化。汉族和少数民族也有不同,中国在清朝以前的朝代主要防备从北方来的,当时是冷兵器时代,骑射是南方人对抗不了的。南方人和北方人具有不同的心智。南方是这样的民居,北方是四合院,北京的街道是正南正北,南方是依河而居,南方比较充足,冬天也不冷,并不在乎采光,北方认为采光是非常重要的,一个房子的南屋比北屋要暖和好几度,正房一定是朝南的,四合院是最合理的北方民居,完全符合进化的规律和逻辑。男人和女人具有不同的心智,因为心智是涉身的。女性在科学领域的成就很少,是因为身体的差异造成的,这不是歧视女性。女性相对于男性而言,更多的是右脑发达,所以在心理学系,女性占绝对多数。心智的种种差异决定了个体的差异性,个体差异性绝不可能由统一科学来提供答案,而是由认知科学来提供答案,因为认知科学提供经验,只有从人的右脑才能更多的解释。






认知科学的结论是通过隐喻,隐喻的形式是“A是B”,逻辑基础是类比推理。认知科学告诉我们,掌握这么多科学概念,完全来源于隐喻。我们自己最熟悉的是身体各个部分,首先拿来做隐喻的是我们自己的身体,小孩学习语言就是这么学的。认知科学家经过他们的研究,认为人类就是拿我们最熟悉的东西来打比方,逐渐的学会更多的抽象概念。
第四,大数据的经验性质。
我今天的题目叫经验、认知和大数据,大数据和认知科学是现在两个最热门的学科,这中间的关联就是经验。



语言层级处于五个层级的中间,又是高阶和低阶的分界,又是高阶认知的基础,所以它非常重要。无论怎么强调语言的重要性都不过分,因为人之所以为人,是因为我们有语言。
如果认为只有人类有语言就是语言中心主义。绝对不是这样,动物也有语言。
这是我做的语言分支图。肢体语言是最初级的语言,它使一切动物都具有的语言。但人类还进化出其他更高级的语言,我说话的时候用肢体语言,如果一种动物仅仅只有肢体语言,这种动物一定是低级动物。比如说蚯蚓、蚂蚁只有身体语言,而没有符号语言。这种语言有很大局限性,当危险来临的时候,交流信息太慢了。要进化出高级的物种,有一本书叫《脑与语言的双重进化》,为了进化出更高级的物种必须进化出更高级的语言,声音语言出来了,像鸟叫,交换信息快多了,物种也要高级一些。这两个有一个共同的缺陷,这种语言是无法脱离个体而存在的,个体死亡的时候这种语言没了。我们看到小鸟也好,猴子也好,老鼠也好,狗也好,他们个体发育到晚年的时候积累了很多的经验,如何捕食,如何躲避追杀的经验,从来没听说老鼠写一本书让小老鼠看的。这种动物每一代都得从经验开始学习,经验无法形成知识,所以他们是基因层次的进化。而人类不一样,人类有了语言这个东西以后摆脱了基因层次的进化,语言是人类进化成人的三大事件当中的最后一件,此后再也没有改变人类进化方向的事情发生,这三件事情就是直立行走、火的使用和语言的发明。语言发明之后人类交换了信息,发明文字以后人类的经验可以形成知识了,大家所学的知识99%都是间接知识,从书本上学来的,每天看到太阳东升西落,就说地球围绕太阳转,不说太阳围绕地球转,就是书本上学来的,人类进化摆脱了基因层面的进化,进入了语言、思维、知识、文化的进化模式。语言是非常重要的,使人最终进化成人。这是中国最古老的文字,诞生于三千多年前,甲骨文。我们有学校,有图书馆,有人文科学,有知识、有文化。


奥斯汀、塞尔他们最重要的贡献是发现人类是用说话来做事的,这是上世纪语言学最重大的发现,语言是我们最重要的东西,是我们最亲密的东西,但是我们知道它多少呢?上世纪在这个领域当中成就很大。人用语言来建构一切事情,美国的《独立宣言》、《宪法》、议会、世界认知科学大会、世界大数据的大会,都是语言来建构的,人民币、美元都是语言系统,街上的交通是语言系统,所有的都是语言,人用语言来建构一切事情。人类用语言来建构了整个人类社会,这叫语言建构论,在这方面也有一些重要的研究,如果人类不发明出这种强大的语言,我们无法建金字塔,也无法建长城,你不会相信除人类以外其他的动物可以建成金字塔,你也不会相信除了人类之外其他的动物能够建成万里长城,就是因为他们没有这种语言,他们无法协调这么一致的行为。如果我们对语言不能说出一二三来,真是辜负了对语言的认识。
第六,思维层级的认知。
思维也是人类和动物区别的一个更高的层级,思维的一些名言,最经典的就是我思故我在,Ithink,thereforeIam.therefore是因果关系,因为我思考了,所以我存在,我思考是我存在的原因,如果我停止思考了,我就没有存在的意义了。这是16世纪提出来的,现在很多国家定义死亡都是脑死亡,即使心脏还跳动,但是脑子已经死亡了,变成植物人,存在已经没有意义了,抢救只是一种人道行为。上世纪最重要的语言学家就是维特根斯坦,他的两本书《逻辑哲学论》和《哲学研究》标志着当代西方哲学的两个重要发展阶段:分析哲学和语言哲学。

过去认为推理是必然的,完全是左脑支配的,没有右脑的任何活动余地,现在我来告诉大家,这个结论可以推翻了。看一下三段论,这是人类使用最多的推理。三段论为什么重要?因为人类进化的早期,分类是关系到人生死存亡的,首先要会分类,所有食肉动物都是危险的,老虎是食肉动物,所以,老虎是危险的。因为那个时候人还不是食肉动物,而是食草动物。后来会用火以后变成杂食动物,比食肉动物还是弱小。三段论在人类进化早期非常重要。第一格AAA式,所有M都是P,S在M当中,S都是P,这也是很重要的。所有杀人犯都要被处以极刑,法官就是这么来判的,大前提是法条,小前提是事实,结论必须推出,没有例外。


其实动物就是这样的,老鼠碰这个键,食物掉下来,他就会碰这个键,碰另外一个键遭受电击,它再也不会碰这个键。我的结论是人和动物在他的头脑里都预装了这种逻辑,就像电脑一样,操作系统要预装,否则电脑开不了机。中国人思维把推理和论证当成一回事,论证需要前提真,推理不要,推理的前提是假设,这里可以验证出东西方人思维是很不同的,中国人不习惯反事实条件推理。推理只讲前提和结论的关系,这两个命题加在一起会不会蕴含这个命题?这是100%正确的推理。一个是真实的条件,如果下雨地面就会湿,现在下雨了,地面会不会湿?东西方被试没有差异,中国人的思维是不能接受反事实思维的假设。为什么这样请大家思考,我也在思考。逻辑学试图对左脑的思维进行一种完全纯形式化,和右脑无关的刻划,所以它是一种理想的模型,但是理想的模型是没有的,或者说只在逻辑学的教科书里有,人们一思维,右脑就进去,你的左脑和右脑能够不交换信息吗?人是正常的,左右脑中间是有连通的,我们做任何理性思维的时候,你的经验要不断的干扰它,认知科学认为这才是真实的人,人必须是这样的。
过去的决策是发展出非常复杂的模型,最后决策发展成这样,如果一个人的决策要用这么复杂的数学公式来表述,这个人就不用活了。我们的决策到底是服从数学还是服从直觉?现在设一个赌局,我做庄家,在座的可以选择参与或者不参与,如果你们输给我50元,你们赢我给你50元,愿意跟我赌的请举手。增加赢的筹码,赢的话是100,输的是50,愿意参加赌局的请举手。再添加赢的筹码,3倍,赢的话是150,输是50,愿意参加的请举手。实验的结果是到4倍的时候才有一半对一半的比例,为什么这样?人在失败当中承受的心理价值远远大于赢的时候所获得的心理价值的绝对值,人不能承受输。问题二,A是你肯定会得到900美元;B是你有90%可能会得到1000美元,实验结果是大多数人选择A,在面临赢的时候采取保守策略。问题三,A是肯定会输900美元,B是有90%的可能会输1000美元,实验结果是大多数人选择B,人输的时候会采取冒险策略。

我以中国的文化来举例,文字、语言、学习、医药、数学、逻辑、命理、科学都是经验的,这是过去被人看不起的,认为这些都是“不科学”的。鲁迅就彻底否定汉字和中国文化,他说汉字不亡,中国必亡。又说中国文化的仁义道德就是“吃人”!在今天我的课上跟大家极力宣传,要重视民族的文化宝藏。象形文字,中国的文字从根上来说跟西方不一样,是来源于经验的,就是画图。语言是经验的,语用要讲语境,语境就是经验。我们可以说吃饭、吃酒席、吃食堂,这些都是正确的语境,但是我们不能说吃教室、吃操场、吃桌子,为什么?吃酒席是宾语已经省略了,在酒席上吃饭,吃食堂,宾语省略了,只讲状语,因为状语重要,强调是在食堂吃的饭。英语要讲全了,所以英语是一种规范的语言,适合做科学的描述。
“苟利国家生死与,岂因祸福避趋之”,这种对联只有中国人能写,谁有本事把它翻成英语,要是翻成英语,诗意就完全没有了,汉语是世界上最美的文字,如果还有来世的话,我还要做一个中国人,因为汉语实在是太美了。“苟利国家生死与,敢因祸福避趋之”,这个是田家英改的,是一个才子,而且是文物收藏家,岂能因为祸福而采取避开他或者趋向他呢,“敢因”,“敢”就没有疑问的意思了,这样说有没有问题呢?——没有任何问题!因为这个太深奥了,老外没法理解。这种语言不是精确的语言,但是留下了无限的想象空间。再举个例子,学校有大小两个食堂,大食堂为学生食堂,小食堂为老师食堂。因为小食堂供应炒菜,许多学生过周末、过生日都跑到小食堂来吃炒菜,常常弄得老师反而吃不上饭,为此小食堂门口贴了一则告示:经研究决定,本食堂专卖老师,考虑到实际情况,兼卖学生,但要先卖老师,卖完老师,再卖学生。这个放在语境当中大家就能理解,不是卖老师,而是卖给老师,英文就必须说全了,中文可以不说全,这是我们语言的魅力。神农氏尝百草更是了,数学的勾三股四弦五,在人类认知的早期,勾股定理有什么重要?当时他要作出直角三角形来,这对于当时搞建筑非常重要。你怎么做出直角三角形来?取一个三单位的杆,四单位一个杆,五单位一个杆,绑在一起就得出一个直角,多聪明,不用变量。过去我们看不起这种数学,说这是初等的,没有普遍性,过去我们把科学的普遍性夸大了,科学的普遍性完全是假设出来的。勾三股四弦五是大禹治水时发现的,这三根棍绑在一起肯定得到一个直角,这对于建筑太重要了。《九章算术》也是一样的,很多东西都是用归纳得出来的,举很多例子之后得出来一个结论。
推理这个层次,这三种推理我们擅长,唯理的推理我们不擅长。十二生肖,大家是相信十二生肖还是相信星座,现在大多数相信星座。星座是月相说,是用月亮的周期来算命。从属相推知生年和年龄,从属相看个性和人格,从属相可以看命理,从属相可以看人缘和朋友关系,可以看婚姻关系,比如说“白马犯青牛,羊鼠一旦休,蛇虎如刀错,龙兔泪交流,金鸡怕玉犬,猪猴不到头”。婚姻有三种,第一种是相生,第二种是相容,第三种是相克,相容就是既不相生,又不相克,可以共处。后来我找到一个依据,在我们所处的环境中有什么样的周期是12年呢?太阳黑子活动是十一点九几的周期。这就是生肖的科学解释,但我们没能必要将它纳入到西方的唯理主义的解释框架下,因为中国文化包括科学都是经验的,规律都是从经验中总结出来的。




Q&A
提问:你刚才讲到东西方的心智差异,这个差异是先天的还是后天的。比如说一个中国孤儿被美国领养了,这样的会有差异吗?
蔡曙山:在美国我问过美籍华人,他们告诉我三代以后才能形成西方人的思维方式,一代肯定是不行,因为基因上已经带有了中国语言的遗传。
提问:以前都说科学是可以证实的,现在为什么说科学是可证伪的呢?
蔡曙山:这是一个好问题。你要了解科学过去被认为是发现,发现科学的规律。比如说物理学,大爆炸宇宙论这些都是发现。现在我告诉你,科学理论现在并不被看作是发现,而是发明。例如,大爆炸宇宙论成为一种科学理论,只是因为提出这种理论可以解释比较多的宇宙现象。科学理论可以表述为一个命题P,这个命题可以解释Q1、Q2直到Qm个现象;而另外一个科学理论能够解释Qn个现象,如果n大于m,人们就会认为后者比前者有价值,会把后者确定为科学理论。大爆炸理论是现在解释宇宙起源的最好理论,进化论则是解释物种进化最好的理论。这个理论出来之后,它能解释这些现象,这就说明它是能够证明的。什么叫证伪呢?证伪就是要看它的逆否命题。在前面所说的具有解释能力的科学理论中,假定发现某一个现象,这个现象与该科学理论能够解释的现象不符,根据我们前面介绍的逆否命题的推理,这个P就被证否,这就是科学的证伪理论的逻辑依据。一个科学理论,首先要有解释力,这个肯定是要成立。但请注意,尽管这个理论解释了n个现象,它也仅仅是一种理论假说。但是只要有一个反例出现,这个科学理论就被质疑,要重新提出别的理论来修改它。这也需要经验,你要通过经验去发现它推不出来的这个事实。
(整理:刘博 校对:辛洪录 编辑:张梦)
注:本稿件摘自数据观入驻自媒体—数据派
以下为PPT全文:
更多阅读: