过去一年多,随着生成式人工智能的开发和应用在全球范围内进一步展开,越来越多的人意识到,人工智能正成为推动人类进入智能时代的关键力量。
各国都在加速布局AI,不想依赖“进口”人工智能,推出国家战略或支持领头羊企业。英国知名期刊《经济学人》称这种现象为“人工智能民族主义”时代。另一边,美国推出《关于安全、可靠和可信的AI行政令》,欧盟就《人工智能法》达成协议,世界范围内对人工智能领域的相关指导准则或法案的探索正在火热推进中。
2021年4月19日,在首届济南国家级人工智能创新应用先导区高端峰会暨黄河流域人工智能创新应用博览会上,与会嘉宾在体验智能设备。图|新华社记者 郭绪雷 摄
回望中国人工智能的发展,可谓波澜壮阔。虽然中国人工智能错过了上世纪50年代世界人工智能的第一波高潮,但从上世纪70年代起,我们迎头追赶,以相对有限的资源投入,不仅在符号主义人工智能的研究上取得了世界级的成果,也赶上了神经网络研究的热潮,逐步发展到今天的世界前列水平。
其中,不得不提到一件大事——“863计划”。1986年,面对世界高新技术蓬勃发展、国际竞争日趋激烈的严峻挑战,国家发布了旨在提高我国自主创新能力的“863计划”。作为当时的高科技热点,智能计算机主题(“863-306”主题)被列入“863计划”中。
当时正值第二次人工智能浪潮的一个高点,专家系统框架及其理论成为当时人工智能研发高潮的重要推动力,人工智能得到了空前的关注。基于此,日本率先提出了第五代计算机计划,该项目被称为“科技界的珍珠港事件”,并引发了全球范围内符号处理和知识处理的人工智能复兴。后来,由于日本第五代计算机的失败和人工智能研究遇到发展瓶颈,20世纪90年代全球人工智能又一次跌入低谷。
在这一转折的时刻,“863-306”主题通过持续的投入,不仅在高性能计算机、智能接口、智能应用等方面取得了一批重大的科研成果,也成为一大批高技术公司的发展源头。更有价值的是,这为我国发展人工智能培养了一大批人才,奠定了较为坚实的人才基础。
文 | 林军 岑峰
编辑 | 王乙雯 秦小童(实习生)
本文为瞭望智库书摘,摘编自《中国人工智能简史:从1979到1993》(人民邮电出版社2023年8月出品),原文有删减,原标题为《1986 年:第五代计算机归来,上马智能计算机》;《1993年:306渐入佳境》。
1
一场巨大的震动
1982年夏天,在日本ICOT(新一代计算机技术研究所),所长渊一博(Kazuhiro Fuchi)的讲演深深打动了在座的每一位听众:“将来,你们会把这段时间当作一生中最光辉的一段时间来回顾,这段时间对你们来说具有伟大的意义。毫无疑问,我们会非常努力地工作,如果计划失败,我负全责。”
渊一博和研究人员把他们研制的操作系统称作“知识信息处理系统”(KIPS)。其应用程序将达到知识表达级,具有听觉、视觉甚至味觉功能。人们不再需要为它编写程序指令,只需要口述命令,它就可以自动推理并完成工作任务。这种新型的机器,也就是当时人们常挂在嘴边的“第五代计算机”。
“第五代计算机”是日本首创,具有过去电子计算机所没有的“联想”和“学习”功能,能够帮助人们进行判断、决策,开拓未知领域和获得新的知识。日本通产省全力支持了该项计划,总投资预算达到8亿美元,并且组织富士通、NEC、日立、东芝、松下、夏普等8大著名企业配合渊一博的研究所共同进行开发。
日本研制第五代计算机的消息在计算机行业引发巨大的震动,世界各国纷纷行动起来,开展了“五代机”的激烈竞争。
首先是美国。美国国防部高级研究规划局计划在6年内投资6亿美元,研制能看、能听说和有思维的计算机;1983年,在美国政府的支持下,13家高新技术公司集中了他们最优秀的技术人员在得克萨斯州创办了微电子技术和计算机技术研究中心,同年美国总统里根在一次演讲中提出“星球大战计划”,实质上这是美国将高科技作为未来竞争力的一种体现。
西欧17国也制定了旨在大力发展尖端技术的“尤里卡计划”,计划研究能每秒进行300亿次浮点运算的大型向量计算机和每秒进行100亿次浮点运算的高速并行计算机。
苏联与东欧集团也迅速制定了包含新一代计算机的研究计划在内的“科技进步综合纲领”,印度发表了“新技术政策声明”,韩国推出了“国家长远发展构想”……
2
寻找适合中国人工智能的道路
对于新一代计算机的发展及所引发的高科技浪潮,我国政府也给予了相当大的关注。国家发布了旨在提高我国自主创新能力的“863计划”。作为当时的高科技热点,智能计算机主题(“863-306”主题)被列入“863计划”中。
受当时国际智能计算机研发计划,特别是日本第五代计算机研究计划的影响,我国专家们一致同意紧跟国际趋势,做智能计算机系统,但要不要直接对标上马第五代计算机,并没有统一的结论。
在执行过程中,专家组发现,日本第五代计算机的主要目标是实现自然语言翻译,但自然语言之间的翻译规则多到通过人力无法全部找到,而且人们对规则是什么也没有统一的意见,最重要的是这个目标即使实现也不能直接有力地支持当时社会各行业的信息化和数字化发展。而同期美国的研发重点是个人计算机、高速工作站、超级计算机和互联网,这些是工业和各行业实现信息化和数字化的先决条件。
在具体实施上,如何在千头万绪中抽丝剥茧,找到一条适合中国人工智能的道路,对专家组来说是一个巨大的挑战。
专家组组长汪成为带着这些问题去请教钱学森,在与钱学森讨论几次后,他认为日本的路子至少不适合中国国情。
1987年12月15日,钱学森来到清华大学甲所(专家组开会的现场)和全体成员交流。汪成为回忆道:“钱老十分谦虚地说他不是计算机专家,他是来向大家学习的。然后剖析了人工智能的本质和关键之处,结合中国的国情,提出了应该从人工智能、脑科学、认知心理学、模糊数学、并行运算等11个方面开展人工智能技术的研究。”
与钱学森的这次交流让专家组开始不单朝着第五代计算机的方向研究,也开始寻找适合自己的发展道路。
3
战略转移,“曙光一号”诞生
在1984年召开的第五代计算机系统会议(FGCS1984)上,日本展示了第五代计算机在第一阶段的研究成果,包括速度为20KLIPS(逻辑推理/秒)的PSI样机和检索数据时间只有过去数据库产品几百分之一的知识关系数据库DELTA。正是这一知识信息处理的阶段性结果,将人工智能的“扩军备战”推向了一个高峰。
专家组在反复调研、评估了我国现有信息基础设施的状况并预估了经费预算额度后,一致决定不走日本第五代计算机的路,发展国家急需的高性能计算机。
“银河-I”巨型计算机。图|新华社
高性能计算机起源于大型计算机。1983年12月22日,中国第一台每秒钟运算一亿次以上的“银河-I”巨型计算机研制成功,中国也成为继美国、日本之后,第三个能独立设计和制造巨型计算机的国家。但在软件和实际应用上,“银河-I”还存在不少问题,无法满足部分用户的需求。
之所以从智能计算机转向高性能计算机,也是因为这一部分没有被满足的需求。长期以来,在计算机界有这样一种看法:如果中国的微电子产业无法得到发展,自己不能做先进的微处理器芯片,那么中国的计算机产业就会受制于人,也就没有希望。但专家组认为,发展计算机的方针不能按照先发展微电子再发展计算机,进而推广应用这样的步骤进行,而应该配合国家正在实施的重大电子信息“三金工程”(即金桥工程、金卡工程和金关工程)和国民经济信息化,带动高性能计算机,尤其是多处理机服务器的发展,进而通过计算机与通信的发展带动微电子产业的发展。
“863-306”主题战略转移的决策催生了曙光系列。在“曙光一号”的研发过程中,作为主要负责人之一的李国杰不仅确定了高性能计算机多处理机服务器的方向,还主导了“顶天立地”的技术路线:“计算机的研制以市场为导向,研制成果一定要具有市场竞争力。不论是采用先进技术还是降低产品成本,缩短研制周期,都要在全世界范围内做优化选择。”
【注:李国杰,中国工程院院士,发展中国家科学院院士。李国杰领导中国科学院计算所和曙光公司为发展中国高性能计算机产业、研制龙芯高性能通用CPU芯片做出了重要贡献。(中国科学院计算技术研究所评)】
李国杰选择以多处理机服务器作为突破口也和在美国考察的结果有关。从美国考察归来后,李国杰得出两条结论:第一,传统的小型机和大型机市场正在萎缩,多处理器在性价比上具备明显的优势;第二,国外并行处理技术尚不成熟,这也为我们迎头赶上提供了难得的机会。多处理机服务器采用CMOSRISC芯片,不仅功耗低,印刷电路板与组装工艺也与PC的生产工艺相似,难点在于系统软件,这方面国内虽然与世界水平存在差距,但因为中国的人力成本远低于西方,所以可以集中人力,从而具有很大的竞争力。
尽管如此,这一路线在执行过程中还是遇到了各种困难。
首先是资金不够。相比银河机2亿元人民币的预算,最终分给“曙光一号”的只有200万元。
另一个困难是人才和经验的缺乏。高性能计算机多处理机服务器的关键点在系统软件上,但这方面的人才智能中心根本招不到。
在资金、人才都相当紧缺,计算机设备生产条件不足的情况下,智能中心决定组织陈鸿安、樊建平、刘金水、李如昆、王永杰五人到美国。在硅谷不仅购买软件、零部件方便,有的软件还可以免费使用,国内国外两步走,软件硬件两手抓,不到一年时间就完成了“曙光一号”的研发。
“曙光一号”的诞生是中国超级计算机历史上里程碑式的事件。“曙光一号”诞生后仅3天,西方国家便宣布解除10亿次计算机对中国的禁运。然而李国杰清醒地认识到,在高性能计算机方面的工作基本上是在“补课”,实际上我们只是缩短了与世界先进水平的距离,离跨进世界先进行列还差很远。
李国杰与计算技术研究所在“曙光一号”的基础上又用500万元和两年的时间推出了“曙光1000”,为曙光之后实现商业化打下了坚实的基础。在“十五”期间,李国杰又冒着巨大的风险领导胡伟武启动了通用CPU芯片“龙芯”的研发工作。之后胡伟武的学生陈云霁与弟弟陈天石一起攻关,两兄弟一个做硬件一个做软件,将计算机体系架构与人工智能结合起来发布了寒武纪芯片,寒武纪公司也成为全球第一个量产商业人工智能晶片的公司。
我国自主研发的新一代通用CPU——龙芯3A6000。
从时间表上看,“863-306”主题项目正式启动是在 1987 年,但在智能计算机的具体研究路线上 则花了两三年的时间来调研和确认,真正做出成绩则到了1993年前后。【注:1993年“曙光一号”诞生。】专家组明确指出中国的智能计算机要从软件和硬件两方面入手,硬件上发展高性能计算机,满足市场需求;软件上通过智能接口的研究,实现人与机器交互。硬件和软件两个方向的关键人物分别是李国杰和高文。李国杰主导了高性能计算机“曙光”系列的开发与研制,而智能接口研究在高文的协调主导下进入了一个创新成果层出不穷的时代,在全球人工智能研究的低谷期为中国的人工智能研究保留了火种。
4
智能接口,成果显著
智能接口是为了建立和谐的人机交互环境,使人与计算机之间的交互能够像人与人之间的交流一样自然、方便。“863-306”主题中智能接口涵盖的研究方向包括汉字识别、语音识别、机器翻译、文本识别、计算机视觉等,凡是和计算机输入输出有关的研究都包含在内,而这也正是人工智能的重点应用方向。
新一届专家组中负责智能接口的正是高文。1992年,高文36岁,是当时整个“863计划”15个专家组中年龄最小的专家组成员。
专家组认为,未来智能计算机的特征之一就是“傻瓜化”,它的主要功能之一就是帮助建立和谐的人机环境。正是在这样的战略思路的指导下,“863-306”主题把支撑多媒体技术的软硬件平台、可视化计算、图形图像处理、先进的人机接口列为关键技术,把各类多媒体的应用系统列为重点应用开发项目。智能接口也是“863-306”主题几个方向上最早做出成绩的:
智能接口方向部分课题研究重大成果(编辑整理)
除了保证研发目标和研究内容的先进性之外,“863计划”更关注研究成果向产业转型的可能性以及成本的可控性,因此多智能接口评测中成长出了一批知名企业。
1987年,在中科院自动化研究所攻读博士学位的刘迎建获得了他技术生涯中的第一个“863计划”资助项目“脱机手写汉字样本采集与识别”。刘迎建的汉王手写识别系统最早采用的就是结构模式识别的方法。项目启动后,刘迎建和汉王又获得了多个“863计划”课题资助。为改善系统的识别率,在1991年课题研发期间需要针对每个汉字构建神经网络进行大样本的计算,而课题组的资源远远不够。
经专家组的协调,中科院计算技术研究所“863计划”并行计算机项目组向汉王课题组开放资源,大半的神经网络计算在并行计算机上不到两个月完成,为课题组节省了一半时间。改进的神经网络识别方法对稿纸上的工整手写汉字的识别率达到90%以上,该成果也获得1992年度中科院自然科学一等奖,课题组在1992年底响应中科院把研发成果转化为应用产品的号召,正式挂牌成立了科技公司。2010年,汉王科技在深圳证券交易所正式挂牌上市。
智能接口方向的另一家由“863-306”课题组孵化出的上市公司是科大讯飞。科大讯飞脱胎于王仁华教授的语音识别课题组。1993年,在中科大召开的全国语音识别与合成研讨会上,王仁华教授提出的试用播音员录音的基因片段加处理的方法获得了高文的首肯。在此之后,王仁华教授的课题获得了“863计划”的滚动支持,而科大讯飞也成立了公司,实现产业化经营,并在2008年在深圳证券交易所挂牌上市,成为中国第一个由在校大学生创业的上市公司,也是当时中国语音产业唯一的上市公司。
5
机器翻译,全球领先
“863-306”主题下第一个国家科技进步奖一等奖“智能型机器翻译系统”也来自智能接口领域。1982年PC开始应用在机器翻译的研究开发上,机器翻译研究进入繁荣期。
2021年5月9日,首届中国国际消费品博览会上展示的国产翻译机。图|新华社记者 郭程 摄
1985年,高庆狮为博士生陈肇雄选定了机器翻译的方向,经过三年的钻研,陈肇雄提出了子类文法,在语法规则中引入了上下文相关条件测试,实现了数据与操作的一体化处理,突破了复杂多义区分等一系列关键难题。这一研究的相关论文《智能型机器翻译理论体系》在1988年的第12届国际计算机语言学大会上宣读,得到了国际专家的高度评价,博士学业没有完成的陈肇雄也被中科院破格提升为副研究员,该研究也于这一年获得了“863计划”的44万元资助。
1992年,陈肇雄课题组开发完成智能型英汉机器翻译系统并通过国家级鉴定,随后陈肇雄领导开发了世界上第一台袖珍英汉翻译机──快译通EC-863A,型号中的“863”明确点出了项目脱胎于“863计划”。由于抓住了国人学习外语和在国外长大的子女学习中文的需求,这款产品推出后销量非常好,“智能型英汉机器翻译系统”(IMT/EC-863)被评为1995年国家科技进步奖一等奖,陈肇雄也被评为全国十大杰出青年科学家。
乘胜追击,陈肇雄创建了华建电子,随后又将华建电子和四通一起组成了中关村软件集团,他本人也转型为技术管理干部。
“快译通”的成功不仅仅开拓了一个新的产业,更将中国的机器翻译带进了一个快速发展的时期。
“快译通”激活了过去十余年中人才、技术和资源的积累,国内出现了许多商业化系统,对中国机器翻译以及后续的自然语言处理的发展产生了深远的影响。
还有一个机器翻译系统是由董振东牵头、军事科学院研制的“KY-1”(科研一号)英汉机译系统,后来开发成中国第一个机器翻译商品化系统“译星”。董振东自20世纪70年代就开始从事机器翻译研究工作,先后担任军事科学院研究员、五国机器翻译国际合作项目中方技术负责人,中国软件公司语言工程实验室主任。他称自己“这一辈子做了两件事,一件是别人不愿做的事,一件是别人做不了的事”,前一件事指的“科研一号”和“译星”,后一件事指的则是他在20世纪90年代所建立的大型知识系统“知网”。
6
人才培养,薪火相传
“863计划”及智能计算机主题的专家们对人工智能的发展和智能计算机的实现路径保持了清醒的头脑,积极地开展相关研究与战略规划工作,通过对当中优质项目的支持,我国仍然保持着一支相对稳定的人工智能队伍,在世界人工智能困难和萧条的大环境下,这一点显得难能可贵。
【注:20世纪80年代后期,世界人工智能研究遇到了发展瓶颈。其获得的经费大大减少,很多一拥而上的人工智能公司纷纷改弦更张,另谋出路。】
“863计划”还为我国的人工智能发展提供了充足的人才储备。从启动之初,专家组就感觉到与世界强国相比,我们最大的不足不是在资金上,而是在对世界信息领域的发展动态和关键技术所知甚少上。于是,专家组一直将培养青年一代作为“863-306”主题的重大战略决策之一。
这一工作由李未负责,他在暑期组织了多期高级人才培训班,邀请计算机领域和人工智能领域的国内外知名专家来培训班授课,大大开阔了学员们的眼界,拓宽了学员们的创新思路,提高了他们的实际动手能力。
此外,我国建立了第一批人工智方面的国家重点实验室,包括我国信息科学的“金三角”——中科院自动化研究所的模式识别国家重点实验室、清华大学智能技术与系统国家重点实验室、北京大学视觉与听觉信息处理国家重点实验室。
如今人工智能领域的很多技术专家是在国家“863计划”的推动下成长起来的。最典型的例子是高文,他不仅在“863计划”的项目中深入理解和了解了多个领域的研究动向,帮助项目成长,自己也有所收获,带领团队在数字视频广播编码传输与接收系统,人脸识别理论、技术、系统及其应用等多个项目上获得国家科技进步奖二等奖,在智能计算机主题中也担任项目负责专家,而后成为主题专家组组长。
专家组成员梅宏院士则是在1992年到北大随杨芙清院士从事博士后研究,参与了获得1998年国家科技进步奖二等奖的863项目“大型软件开发环境青鸟系统”的研究。作为北大青鸟阶段863课题的第二负责人,梅宏从 “运动员”向“教练员”转变,在2000年后参与了“863-306”主题专家组的收尾工作,开始了15年的863专家的经历。
此外, “863-306”专家组还成为20世纪八九十年代人工智能研究者交流的平台。
在20世纪90年代全球进入人工智能低谷期的十余年中,我国通过对“863-306”主题持续进行投入,为计算机与人工智能领域培养和锻炼了一批人才,缩短了与国际水平的差距。这也为第三次人工智能浪潮兴起时,中国能够迅速跟进奠定了基础。