人工智能中语言问题的哲学审视
时间:2020-07-17 07:27

  人工智能是对人类智能的模拟。在人类认知系统中,语言处于极为关键的地位,马克思恩格斯语言观为我们审视人工智能提供了重要思。语言作为思想的直接现实,产生于人类交往实践,在人类认识中发挥重要作用。通过对人工智能中语言问题的探究发现,人工智能存在语义理解的形式化缺陷、机器思维的意识难题、人类知识的表示困境和人工学习的社会化瓶颈等问题,人工语言与自然语言本质上的差异决定了人工智能与人类智能的根本分野。正如人工语言的工具性那样,人工智能也同样是工具性的,其未来的发展方向只是对人类智能的辅助和强化。

  在人类认知系统中,语言处于极为关键的地位。语言作为人类的重要特征,是认识世界的中介,也是重要的思维工具。因为语言的存在,人类成为文化存在物,能传递、储存知识,能观念地认识和世界。人工智能得以形成,从认识论的角度来看,也是通过人工符号系统模拟人类思维,实现类人“智能”。目前人工智能虽然取得一定进展但仍困境,这与语言有着莫大的关系。那么,语言到底是什么?人工智能和人类智能有哪些差异?人工语言能否实现对自然语言的复制?本文尝试从马克思恩格斯语言观的角度对人工智能中的语言问题进行审视,探讨人工智能与人类智能之间的差异与区别。

  在人类的进化发展中,语言是人之为人的重要表现。深入了解语言的起源、性质和功能对把握语言在认识中的作用具有重要意义,也对理解人类智能具有重要意义。马克思恩格斯并没有专门的著作对语言问题进行系统论述,但在《1844年经济学哲学手稿》《德意志意识形态》等文本中蕴含了丰富的语言观。不同于通过语言的分析来解决语言和哲学问题,我们所说的马克思恩格斯语言观指的是通过马克思恩格斯经典著作的深刻解读,还原和挖掘马克思恩格斯关于语言问题的哲学思考,这对于马克思主义哲学当代哲学发展具有重要意义。

  马克思恩格斯语言观建立在历史唯物主义基础之上,是在对费尔巴哈、鲍威尔等青年黑格尔派的中确立和呈现的,围绕着“实践”这一核心解开了人类语言的黑箱、思维和意识的谜底。在《德意志意识形态》中,马克思恩格斯了青年黑格尔派的史观,认为其“只是用词句来反对这些词句;既然他们仅仅反对这个世界的词句,那么他们就绝对不是反对现实的现存世界”1,也即是说,单纯的语言不能代替对现实世界的,只有根植于现实生活的语言才具有生命力,蕴含巨大的性,脱离了社会历史语境的主义语言观是无本之源。语言问题之所以引起马克思的注意,其根本原因在于这种悬浮于现实之外的抽象空洞的文字游戏消解了哲学的性,而以“改变世界”为旨的马克思主义哲学不可能忽视对现实的人的境遇的观照,因此,马克思语言思想必然以主义语言观为逻辑基础,一以贯之地将历史唯物主义思想运用到对语言问题的考察上,在对语言的产生发展和演变、与思维和意识的关系中阐释语言的性质特点,建立历史唯物主义的语言观。而这些观点和思想,对于我们今天的人工智能问题研究,具有极为重要的理论价值和实践意义。

  关于语言的起源问题,恩格斯进行了详细的考察和论述,他认为“语言是从劳动中并和劳动一起产生出来的,这个解释是唯一正确的。”2劳动对语言的产生具有决定作用。在人类诞生之初,生产力水平极为低下,在开展物质生产实践活动中,人类学会了制造和使用工具、大脑和发音器官得到进化和完善,尤其关键的是交往实践为语言产生所创造的社会性变革。一方面,为了人类和发展,在进行最基础的物质生产活动时,使得人类祖先组合成原始群体或部落,凝聚成一个社会关系的集体,造就了人的存在的社会性,为语言产生提供了社会基础。另一方面,在实践过程中,人类这种有别于动物的社会性存在,决定了交往活动的必要性和迫切性。“语言也和意识一样,只是由于需要,由于和他人交往的迫切需要才产生的。”2任何人都是群体中的人,任何人都不可能孤身行动,社会生产实践活动是自觉、有意识的活动,也决定了人不可能处在意识的封闭的世界中,主体之间需要交流、沟通、对话,需要通过集体经验去外部世界,产生“非说不可”的交往活动需求。通过对主体际关系的变革和,主体逐步获得实践的目的、计划、方式等,进而逐步在交往活动中提高认识和实践的能力,而且又“通过生产而发展着自身,造成新的力量和新的观念……新的需要和新的语言。”3马克思恩格斯始终站在历史唯物主义的立场来考察语言的起源,把语言从根本上看作一种实践方式和社会现象,消解了把语言看作一种思想产物的史观,蕴含了语言实践性、社会性和交往性的特质。

  从语言与思维、意识的关系来看,针对青年黑格尔派所认为的意识决定生活的主义观点,马克思进行了明确有力的回击:“思想、观念、意识的生产最初是直接与人们的物质活动,与人们的物质交往,与现实生活的语言交织在一起的。”2思想和语言产生于人类的生产生活实践,强调了他的唯物主义立场。而且,“语言是思想的直接现实”,2语言和思想具有同构性,两者相互交织、密不可分。思想只有寄居在语言这一物质载体中才能得以表达和,才能在实践中组织社会活动,产生世界的物质力量。离开语言,思想就变成一片朦胧的混沌之物,无法在不同个体之间传达,无法实现社会化。对于语言与意识,马克思认为,“”总是受到语言这一物质的“纠缠”,两者相互依赖,而且,“……愈来愈清楚的意识以及抽象能力和推理能力的发展,又反过来对劳动和语言起作用”,4两者又彼此促进。意识和思想观念的外化或对象化都离不开语言,通过语言,意识活动才可以从性的活动为物质性的活动,因此语言也成为物质性和性的双重统一。但是,并不能认为“语言完全属于意识形态”,因为,不论从系统发生的角度来看,还是从个体发生的角度来看,意识和语言都是社会的产物。从更为根本的层次来说,“语言是一种实践的、既为别人存在因而也为自身而存在的、现实的意识。”4语言和意识本质上是对现实生活的反映,生成于以实践为基础的对象性活动。

  从语言的功能来看,语言是知、情、意的统一体,具有认知、情感表达和价值评价的功能。语言作为“思维本身的要素”,是联通思维与外部世界的重要媒介,也是主体用来认识和处理自身同外部世界关系的中介。语言具有认知功能是因为语言能指称对象客体和世界,承载着意义,因而现实的人可以将认识客体或对象、或者认识主客体之间或主体间的某一规律或特征用语言进行表征,在交往过程中使得个体的认识能得到社会化的确认,就如“价格和铸币是从交往中产生的;它们实际上是由交往所创造的用语,是作为交换价值和交换手段的商品的交往用语。”5另外,“一切关系表现在语言里是概念”,6语言的抽象性使人类的思维能力得到巨大提升,使得人脑这个“微观世界”能观念地认识、把握和再现人类世界这个“宏观世界”,能够联通过去、现在和将来,于时间空间的制约,真正自觉的在思维中创造一个观念的世界。另一方面,马克思从来都不把语言当作一个纯粹的自然现象或者客观的科学问题来考察,而是把它放置于人类现实生活的场域中进行挖掘。人类交往活动是有意识的活动,“人们实际上首先占有物作为满足自己本身需要的资料,如此等等;然后人们也在语言上把它们叫做它们在实际经验中对人们来说已经是这样的东西”7,语言在描述客观对象的特征、属性和规律的同时,必然会涉及到主客体以及主体间的价值关系,传达主体的情感态度、思想观念等等。因此,语言作为一种人类特有的社会现象,绝不只是一个单调纯粹的符号系统,“语言本身是一定共同体的产物,同样从另一方面说,语言本身就是这个共同体的存在,而且是它的不言而喻的存在。”8它作为复杂的社会现象反映语言共同体的价值观念、风俗习惯、教等等,是一个价值观念系统和文化系统。归根结底,语言的这种认知、情感和评价功能皆建立在对象性的实践活动基础之上,“无论思想或语言都不能独自组成特殊的王国,它们只是现实生活的表现。”6

  相较于语言在人类认识中的重要地位,人工智能得以可能也根源于对“普遍语言”的追求,通过使用形式化的人工语言实现对人类智能的模仿。因而不论从其生成逻辑、运作规则、呈现等方面都与语言密切相关。那么,通过人工语言,是否可以完美复现甚至超越人类智能呢?以马克思恩格斯语言观作为我们考虑语言问题的基本出发点和立足点,通过对人工智能中的语言问题进行透析,可以让我们对人工智能的“智能”维度有清晰客观的认识。

  人工智能要模仿人类语言的认知机制,首先必须要理解语言。语言是指称和意义的结合。语言作为重要的交往工具和认识媒介,其价值主要基于能承载意义。在语义三角理论中,语义居于核心地位,意义将外部事物和名称联系起来,并将这种认识在头脑中固定,这种声音所表示的意义就是人们对客观世界的理解和认识。语言的意义是主体在认识中对客体的本质、属性和规律的反映,是客观的、相对确定的,这也是人工语言或形式语言得以形成的逻辑起点。但语言意义蕴含着知、情、意多方面的内容,在具体的操作运用过程中远要复杂得多。一方面,语言是在现实生活的土壤中生长的,实践活动的发展推动语义变化,且由于物质交往活动的差异,语义渗透着不同的思想、观念和意识,概念的语义并不是停留在字典中的静态的意义,实践活动的不同、交往的差异都会影响社会群体对某一概念意义的理解。另一方面,语言作为最重要的交往工具,在交往中语义与语境之间具有着结构性关联,这种关联赋予和确定了语义。虽然词语和句法的结构是稳定的,但由于主体本身的复杂性,场景的差异、使用习惯的不同等,都会造成交际时语义的改变。总的来说,语言作为的、动态发展的系统,语义具有多样性和复杂性,这是人工智能中语义理解难以规避的重要问题。

  从根本上来说,理解语言就是理解指称和意义的关系。尽管语言的指称与意义之间的关系最初是约定俗成的、客观的,但语义也具有模糊性、空指性、歧义性和不确定性,这些在马克思恩格斯语言观中都能得到合理解释:因为都是社会生活和实践活动的反映,都应该在人类实践活动中得到解决,也即是说,实践是理解指称和意义的最终根据。指称关系在一定的社会生活和实践中逐步形成,语言的意义则总是相应地随着人类实践的发展反映社会内容。语言是一种与世界交互作用的产物,而语言的意义就产生于这个交互过程之中,而人工智能的形式语言由于根源上的实践缺陷,要做到真正的语义理解显然先天不足。

  人工智能中的形式语言从本质上来说就是人类语言的一种现实运用,通过思想中一些命题的本原和逻辑关系,以此来映射世界的本原关系。在初级阶段,一些简单的符号演算或文字处理可以采取这种符号主义的进,以语法决定语义,但要实现人工智能的宏大目标,比如人机对话、机器学习等等,现有的语义理解根本无法满足需求。可以说,陷入语义理解的困境主要在于人工智能的实现根基与语义得以实现的条件之间存在鸿沟。这种鸿沟源自于逻辑与现实之间、符号与所指物之间,归根结底,这是由形式语言与自然语言之间的差异造成的。表现人类智能的自然语言语义的实现并不是一种封闭的、机械的活动,而是在语言应用和语境信息基础上的过程,只有真正具备能力将符号体系与其所指对象自觉关联,才能真正实现理解。而人工智能中的操作行为在事实上只是建立在符号规则的基础上,从本质上来说并没有涉及到语义,著名的塞尔的“中文屋论证”(The Chinese Room Argument)就对计算机理解语义进行了强烈反驳:在房间里的人对中文一窍不通,但通过对照操作手册,可以对房间外发送的信息进行处理并给出答案,房间外的人就以为实现了真正理解。事实上,在操作过程中意义并没有发挥作用。目前,即使是最好的自然语言处理系统也只是停留在单调的句法机层面,而人既是句法机,又是语义机。自然语言中的语义来源于人的实践体验,只有符号与所指物相对应时,语义才得以形成。因为机器语言所蕴含的信息内容与世界事实之间是基于被动关联,根本无法主动指称外部世界,因而人工智能在与人交流的过程中实际上处理的只是形式语义,只是进行按图索骥的符号操作,并未实现对深度语义的线.机器思维的意识难题

  马克思主义语言观是由语言与物质生产实践、社会交往、思想意识等重要要素所共同构建的,语言实际上是物质、意识、实践、交往的总体9。思维并不是的存在的,语言、思维和意识相互交织。人的思维活动是一种个体性活动,在人脑同外部世界进行信息接收、交换以及加工处理的过程中,作为“思维本身要素”的语言就作为信息的物质承担者发挥了作用,使得内在的思想性的东西具有了现实的物质表现,使得个体性思维实现了普遍性。所以说,人类的和认知是以语言为基础,以思维为特征的10。符号主义作为人工智能研究的主流学派,认为符号是人类的认知基元,认知过程即为符号操作,事实上也即是对语言与思维关系的现实应用。而人类思维中最为本质的特点是,人类的思维是有意识的,语言和意识不可分离,且共同起源和发展于人类的物质生产劳动之中,两者相互推动又互相依赖,“具有同样长久的历史”。

  从智能生成的逻辑来看,人工智能通过物理符号系统模拟人脑的思维规律,其相通之处是通过信息的输入和输出实现信息的加工处理和传递,但在本质上是通过一定的算法对人脑组织结构和运作机制进行模拟,计算才是人工智能的本质11。据脑科学和神经科学研究发现,人的大脑思维并非是一种信息内容不断堆积的线性运作机制,而是一种动态的、性的网络系统,这也证明了人类思维的复杂性和意识性。马克思指出,“意识在任何时候都只能是被意识到了的存在”,12作为人类思维要素的语言就是意识的物质表现,因此,语言形式本身并非是语言表达的意义,而意义在于意识。但人工的形式语言只是转接承载人的意识,并不能自觉生成意识,更无法实现和发挥意识的能动作用,这种省略了意识的思维注定了是一种被动的思维、机械思维。因此,相较于人类的意识思维,人工智能是一种纯粹的形式思维,其形式语言直接跨越了自然语言的演化过程,只是一种现存的人工符号,意识在思维过程中自然而然地被过滤掉,成为了一种依程序所进行的符号排列13。

  即使目前随着各项综合研究技术的不断推进,机器代码可近似地模拟人的神经元脉冲,但其关键的人工智能机械-物理过程意识的,只是人类知识和程序的被动投喂,因此,相比于人类思维注定是局部的、有限的。一方面,由于缺乏意识,人工智能不可能能动地产生和创造观念。人工智能的思维活动就像是“镜像反映”,没有主观能动性的发挥,思维活动都是被动的、是按预设程序径运行的,简单来说即不可能输出没有经过预设输入的东西。虽然在分析、综合、逻辑判断、推理方面具有极大优势、但对于一些与主观感受、心理活动密切相关的抽象概念无法进行体验和判断,也根本无法主动地提炼问题、形成思想,更谈不上创新性、创造性的观念和思维。博登认为,将思想组合产生“新奇”的观点对机器来说并不困难,但并没有一个有意识的价值评价机制,单纯的思想组合不等于创造,人工智能所有的创造都通过形式化来实现,也注定了“创作性”不可能摆脱形式化的控制14。另一方面,人类通过语言,智能的主体本身或者主体间才能进行对话,基于对话才能形成内在循环功能的思维,进而能够产生意识,可以说,人类意识蕴藏于语言能力之中,理解人类语言有助于破解意识的秘密15。因为具有意识,人类能进行反思,而人工智能并不“知道”自己在做什么。因为具有意识,人类可以实现确认,人类不仅可以将一切事物纳入思想对象,而且能够把意识自身也视为思想对象。意识的关键在于意识的反思能力,而不在于处理数据的能力15。虽然机器能进行推理,可以挖掘发现一些问题,但是只是限于在现有的数据情况下依程序进行分析综合和理解,并不具备“反思”或者“”的意识思维功能。

  赫拉利在《人类简史》中指出,人类在有了语言、文字之后产生了认知,相较于之前缓慢的基因演化,实现了文化演化的快速发展。可以说,人之为人,更为深刻的是知识、文化的进化。知识来源于人类对对象世界的把握,具有客观性,又以语言、文字等感性形式实现物化和外在化;而且知识以个体认识为前提,其中蕴含了个体对世界的情感、和,受到了个体的经验背景、价值体系等影响,又内在于人的主观创造。总的来说,知识在人类认识和世界的过程中得以产生、发展和,是客观性和主观性、外在性和内在性的辩证统一。这一过程着主体与客体、以及主体与主体间的相互交往,正是在社会交往过程中,知识得以检验和确定。

  因为知识在人类认知中的重要地位,人工智能学科中也形成了专门的“知识工程”研究,其任务是要整合和抽取人类专家知识,建立“专家系统”。其中,知识表示是不可逃避的首要问题。就人类自身来说,知识的物化离不开语言,而语言作为现实生活的表现,其“表现”必须要借助于概念的思维力量来实现,不论是思想、观念还是意识,要将之为感性现实都离不开概念。概念作为人类认识的结晶,是对认识对象的属性、规律和特征的抽象,也是人类思维的基本单位。语言包涵了概念,概念藏在语言之中,但马克思认为,并不能将两者简单的等同,概念只是语言中的概念,是语言对现实生活世界的逻辑把握,两者的辩证关系是:概念可以进行抽象把握,但它并不是作为的东西而有意义,而是作为从某种他物中得出的抽象且仅仅是作为这样一种抽象才具有意义。就比如说,“”事实上就是抽象出来的“物质”,其根源还是物质。16也即是说,不能孤立地、片面地看待概念,概念要在一个具体的抽象系统之内才具有价值和意义,其意义必须放在一定的体系当中去理解。而且,就概念的形成而言,如马克思恩格斯语言观所指出的,背后渗透着文化背景、认知图式、价值系统等各主观因素,并不是纯粹的物理符号,这一切都需要放置于实践活动中才能得以理解。概念正如知识本身一样,是主观性和客观性、外在性和内在性的辩证统一。人工智能中的知识表示是对人类已有的知识通过计算机可识别的方式进行描述和存储,要对人类知识进行形式表征,也必然需要以概念作为基础模型,通过搭建概念系统形成知识体系,但由于概念本身的特点和属性,如果单纯只考虑从字面上、形式上来把握知识,也就是简单地将语言和概念等同,忽略了概念的产生来源和适用背景,也势必对知识的理解产生偏离。正如在人工智能知识表示的具体操作中,会产生专家语言与日常语言概念之间的差异,以及在脱离了具体中描述求解的方法与实际采用方法之间有差别等现象,形成知识畸变17。

  且从另一方面来看,语言作为人类知识表示的方式,其归根到底是社会的、公共的、非个人的。因此,作为一种概括性的符号系统,语言是一般和个别的辩证统一。就如列宁所说,这一矛盾关系就包涵在最简单、普遍和常见的东西之中,就在语言中任何一个命题之中,比如树叶是绿的,伊万是人,哈巴狗是狗等等。18黑格尔曾经说到“语言实质上只表达普遍的东西;但人们所想的却是特殊的东西、个别的东西”,列宁摘引了这段话之后,在旁边加注强调:注意在语言中只有一般的东西。19一般是从个别中的抽象和概括,但不可能包括全部的个别,这也就注定了,一方面,因为所有的词语都是在概括,总有“只可意会,不可言传”的认识的存在。虽然机器可以通过硬件等技术来对人类知识进行存储,在效率和速度上远优于人类,但因为语言自身的属性,并非所有知识都能用语言表示、都可实现数字化。另一方面,概念中所概括的都是一般的东西,个别在词语中被冲淡,并非了解了概念就能等同于掌握了认知。言传认识也需要通过和主体的实践经验本身结合才能被充分、全面地把握。其中极为典型的就是关于常识的表示,是人工智能知识表示的“瓶颈”问题之一。在对日常基本知识的理解中,除了基本的概念意义的掌握,更重要的是作为认识根源的实践活动和体验。例如人类一看见牛就能完成对这一动物属性的认知,在交流中提及“牛”这一概念,就可对应其形象和意义,并不需要细致地了解牛的颜色、种类、大小、品种,在任何形态和表现下的牛都能识别,可以进行情境迁移。而智能机器对“牛”的概念可能有无数的关于其各类属性、特征等等的描述,且在近万张的存储图片中进行识别训练,但当牛躲在一棵树后,仍旧不能识别到底是树还是牛。另一方面是概念框架问题。概念框架在不断的认识和实践活动中形成、检验、确定,也可称之为背景知识。认识主体是处于社会的主体,其概念框架必然受一定的社会背景、和现实状况等各方面的影响。个体在认知过程中自然形成的概念框架系统是相对完备且相互通用的,而人工智能的应用背景是特定、有限和专属性的,其框架系统不能自觉产生、更新和完善,系统之间不可通约,无法实现和背景的自动关联等等。因而,对于知识表示的困境,罗林斯的点评一针见血:因为我们是机器,而不是逻辑机器20。

  学习是人类重要的实践活动,贯穿了整个人类社会发展的历史过程。任何个体都是具体的历史的个体,任何个体的认识都是有限的,通过学习,可以将人类认识吸收为个体认识,能够掌握人类经验开展活动,实现个体自身以及人类的发展。在大数据时代,知识体量大、更新速度快,机器虽然在信息存储和运算上具有巨大优势,但要在智能上有所发展,也必须要通过学习机制才能提高获取知识和解决问题的能力。

  从认识论来看,学习某种程度上可以说是客体认识主观化和主体认识客观化的相互交融和转换,语言作为重要的物质中介在学习活动中发挥了重要作用。人类的学习不只是在现实的世界中进行,也不仅限于世界的思索,还可以在以语言建立的观念的世界中体验。如科学哲学家波普所划分的三个世界:物理世界(世界1)、世界(世界2)和客观知识世界(世界3)。“世界2”表示的是个体的主观活动,“世界3”即是人类的产物,也可以说是客观意义上的观念世界,要素非常广泛,有科学问题、语言、文字、理论体系等等。世界同人的而,但客观知识世界可以以语言、文字等各种物质载体和形式留存下来。只有人类能学习语言文字中所呈现的“世界3”,在语言所建构的观念世界中深化认识、追求真理。

  既然学习是一种实践活动,也就必然具有社会性。作为学习工具和手段的语言具有实践性、社会性,使用语言也就是作为学习主体的人的社会性的印证,正如马克思说:“人是最名副其实的动物,而且是只有在社会中才能的动物……就像许多人不在一起生活和彼此交谈而竟有语言发展一样,是不可思议的”。21从微观上来说,学习是个体开展的,但是个体的学习活动并非处于真空,而是处在一定的社会文化中,学习的个体性蕴含于社会性当中。而学习的过程,实际上也就是个体社会化的过程,在这个过程中,个体通过社会交往,按照人类经验来改变和调整自身的实践活动以适应的需要,达到发展的目的。在不断的交往实践活动中,一方面,语言的和论证功能促进人类知识的检验和进化,另一方面,语言的描述功能将人类认识为理论框架,优化人类和个体的认知图式,个体和人类通过学习将知识系统呈现为一个过程的集合体。

  机器学习的目标是要通过改进算法提高性能,对人类学习进行模拟,实现知识的更新和重构,提升自主处理问题的能力。自然语言本身的属性和特点使得人类在学习过程中不论是对于观念的学习还是社会经验的学习都能得心应手,而人工智能的学习只是基于算法,是在封闭下的学习,非社会性的学习是人工智能学习的重大缺陷。由于学习发生机制的根本区别,导致了机器学习所掌握的是纯粹的知识本身,没有交往实践,缺少了社会化机制,也就不懂如何运用知识、不懂如何生成知识。人类可以通过阅读获取知识和间接经验,可以读诗写诗进行诗歌创作,而计算机智能根据算法进行匹配,微软小冰可以写诗,但也仅仅只是基于语料库的机械的词语排列。目前,专业化人工智能的水平都得到了进一步的提高,AlphaGo相比之前“深蓝”计算机采用了一些学习策略和算法,但实际上都是基于海量数据的训练,人工智能的学习被参数、程序等局限在一定范围内。现在人工智能深度学习通过模拟人的生物神经网络来模拟人的思维,但是如果无法形成社会交往和社会实践,不具有意识性、自发性,不能构与人、人与世界的互动,归根到底还是由人来辅助和操作的非自主学习。学习具有社会性,怎样在“世界3”中掌握思想的和观念的世界,如何利用语言的论证功能、描述功能和构建功能去主动进行学习和思考,是人工学习人类学习绕不过的“关口”。

  语言历来与“智能”关系密切且受人关注。通过词源上的考察我们可以发现,“语言”与“智能”几乎形影不离。古希腊的“逻各斯”(logos)是和语言的涵义,而其词根lego,是“言说、话语”的意思;中国古代哲学的代表之一所论及的“道可道,非常道”中“道”同样是道理和言说的统一体;就我们所熟知的哲学词汇“”(dialectics)的词根“dial”也是源于“对话”(dialogue)。从认知的角度来说,语言是产生智能的核心要素,是智能的外在和内在的表征。蔡曙山认为:人类和认知分为神经、心理、语言、思维、文化五个层级,人类智能就是这五个层级上所表现出来的认知能力22。其中,语言在这些层级中处于非常关键和特殊的地位。只有拥有了语言认知,才会产生思维和文化这样的高阶认知。可见,如果以非自然生长的方式模仿和复制智能,“语言”的出现和使用是必不可少的。

  人工智能语言是一种机器语言,其实质就是人为的为机器运行所设计的一种工具性语言。从历史上来看,对人工语言的设想在17世纪就已然活跃,研究者们试图建立一个直接对应于事物和观念的符号系统,以扫除需要用差别各异的语言来描述世界的障碍,从某种意义上来说,这也是机器语言思想的溯源。培根设想“实体符号”,著名的数学家、哲学家莱布尼茨认为可以使用数学计算替代言语思想,之后,分析哲学的代表人物弗雷格、罗素等,设想可以从逻辑出发创造一种严格精确的逻辑语言或理想语言。可以说,当代人工智能机器语言的思想与分析哲学的人工语言思想一脉相承。金观涛认为,目前人工智能的符号主义着眼的只是人类智能的冰山一角,从符号的角度来看,人类智能的本质还包括四个层面:主体可以地给出符号,通过符号系统指涉对象;运用语言传递知识,组织社会和产生社会行动,而且产生社会意识;人意识到自己有意志,让意志指向某种符号系统,创造应然世界;应然世界的演变进一步强化主体的,以创造出更为复杂的符号系统23。从现今的人工智能发展应用和前文中有关语言问题的分析我们可以看到,人工语言与自然语言之间存在着不可逾越的鸿沟,人工智能与人类智能之间也尚存差距。

  一方面,自然语言与人工语言关系密切。简单来说,自然语言是自然生成的,而人工语言则是为某一特定目标而人为地设计制造的。从语言本身来看,从自然语言到人工语言,是对语言确定性的追求,是对语言歧义性、模糊性以及民族性等弊端的克服和超越。在某些方面,自然语言的缺陷和不足会产生交流或人类认识活动的某些障碍,人工语言是一种辅助和补充。从人类自身来看,因为认识的不断进步,随着实践对象复杂性和丰富性的提高,认识客体和对象对主体本身提出了更高要求,因此,对于一些需要耗费人类主体自身脑力的简单的重复性劳动,可以交由机器去完成,分解部分的脑力劳动负担,例如简单的问答式机器人等;另外,由形式语言所形成的虚拟大脑作为人脑的延伸,在某些领域内代替了人类大脑的思考,在思考的速度、效率、逻辑上发挥出色,在形式化的分析、综合和推理方面具有巨大优势,可以辅助人类智能。可以说,这是人工语言之所以产生的动力和根源所在。

  另一方面,自然语言与人工语言有着本质区别。人工语言既然是一种经人为设计的语言,工具性是其根本属性。从原则上来说,相对于自然语言,它就是另一种语言,为某一特定的目标和对象服务,不是自然语言的替代品,也不是自然语言的深层结构,并不具有同自然语言相同的本体论身份和地位。从其形成来看,如恩格斯对语言起源的考察,自然语言是随人类社会实践活动自然生成演化的,而人工语言是随人类认识和实践发展的技术需要人为构建的形式系统,虽然遵循逻辑推演的规律,但只是单一地处理数字和符号,其使用的语词、逻辑规则、语法规则都是预先的人为,具有一定的适用范围和局限,并不是自足的系统。而自然语言作为人类思想的现实表现,它首先产生于“人脑”这一生理器官,具有语音、词汇、语法、语用等不同层次,与人的价值系统、主体意向、情感意志密切相关;它不是一个单调冰冷的符号系统,其本身就是一种社会现象和生命活动,是觉、记忆、思维等许多心理活动的重要载体和中介,其模糊性、歧义性也是客观现实生活的反映。马克思恩格斯对语言的历史唯物主义考察已经深刻地说明,语言根源于人类的生产生活实践,具有实践性、社会性和历史性,与思想、意识和观念相互交织,是一个知情意的统一体。从某种程度上来说,在人工智能的现实运用中,人工的形式语言系统变成了一个脱离实践的、的、抽象的王国,一个代码的世界。它社会性的,虽然其逻辑更为严密、推理更为精准,但它并没有生活世界,无法实现交际互动和社会化的经验,也并不是主观能动地对现实生活的表现,既不具备自然语言所体现的意向性,也缺乏“以言行事”的实践功能,与根源于人类实践活动的自然语言具有本质的差别。

  显然,人工语言从一产生就是工具性的,其工具性也就决定了人工智能的工具性。人工语言不可能实现对极其复杂的自然语言的完美复制,仅仅依靠单一的、规范化的二进制语言来实现对复杂的人类认知模拟,可以说任重而道远。要解决人工语言所带来的局限,必然需要突破形式语言的。因此,从工具的角度来看,人们所担心的人工智能“奇点”就是一个伪命题,人工智能未来的发展只可能是对人类智能的不断加强,所发挥的是辅助和服务的功能,而所谓的和人类也只是“杞人忧天”。

  总的来说,要实现人工智能的类人“智能”,语言是一个不可回避的问题,而且是首当其冲的重要问题。人工智能虽然取得一定进展但仍困境,是因为其仅仅从功能层面模拟智能行为,而并没有对智能本身进行有效的哲学分析。在马克思恩格斯语言观的审视下可以看出,人工智能不可能实现对人类智能的复制和超越,因为“迄今为止,并没有任何一部真正理解人类语言的机器,因此更不会有像人一样能够进行创造性思维的机器和具有人一样的文化方式的机器”。24由于语言在人类认识中的特殊地位和作用,带领人工智能突出重围,深入研究语言是十分必要的。如何弥补机器语言的缺陷,实现机器语言的社会性、实践性,实现语言与意识、思维以及外界的交互作用,建立机器语言的意向性机制,实现指称与意义的自然联系等等,都是人工智能努力的重要方向,值得重点关注和探索。

      大红鹰娱乐