本篇文章7216字,读完约18分钟
尼克(澎湃情报蒋立冬绘)尼克,乌镇智囊团理事长,数知科学技术创始人,国家“千人计划”专家 年轻时输给了美国,师从“强化学习”算法的发明者那里。 我在哈佛和惠普工作 最近,尼克的《人工智能简史》由人民邮电出版社出版,他在书中全面刻画了人工智能半个多世纪的历史,再现了ai史上大师的工作和交流。 关于人工智能的历史、现实和未来诸问题,《上海书评》采访了他 尼克:《人工智能简史》,人民邮电出版社,年12月,第320页 《经济学家》( the economist )今年7月15日发表的《在中国或人工智能行业赶上或打败美国》( china may match or beat america in ai )的复印件中,有乌镇智囊团制作的人工智能 乌镇智囊团和人工智能之间有什么关系? 从数据上看人工智能,能告诉我什么? 尼克:乌镇智囊团包括所有专利、所有学术资源、所有经济金融数据、法院判例、过去十几年所有语言维基百科和各种在线百科全书数据、社会交流媒体数据等人类历史上几乎所有的 我们把这些数据都做成知识地图,也整合了ibm有名的watson系统的基础开源知识地图。 在我们制作的各个领域的报告中,影响最大的确实是关于人工智能的系列报告 现在,《经济学家》、《金融时报》、《高盛》等机构关于人工智能的深入报道大量引用了我们的数据 中文媒体关于人工智能的报道可以说其数据部分的来源大多在我们这里 经济学家杂志刊登的2005年,年相关国家ai专利申请数,年相关国家ai企业数 具体来说,从专利看人工智能,1980年代,中国还没有专利制度,不能说是人工智能专利,但从年到年,中国人工智能的专利总数已经超过了美国,专利质量还不高。 专利质量可以定量计算,学术论文结果也类似 根据我们创造的人工智能大学排行榜,前40名没有中国,但从第40名开始就是清华。 人工智能的分支学科中,20世纪80年代极为盛行的专家系统,今天无人问津。 这在工业界的反映是日本第五代计算机项目的衰退 年后兴起,至今仍受欢迎的人工智能子学科有机器学习、计算机视觉、自然语言解决等 机器翻译属于自然语言解决 金融时报上刊登的ai相关研究论文引用排名也可以利用数据用于地区研究 中国对人工智能的投资已经是世界第二,但几乎是以色列的四倍 以色列是个人人口八百万的国家,比上海的一个区小 根据我们进行的物品网络报告,中国物品的网络体比以色列大40倍以上 这涉及高级技术,以色列很强,涉及人口和制造,中国证明很强。 你为什么要写人工智能的历史? 去年,alphago继续获得人类围棋冠军,alphago zero可以自己从低级到高级玩游戏。 我可以谈谈和这个团队的关系吗? 人机围棋对决,柯洁比不上alphago 尼克:现在人工智能这么热,需要证明其历史的书 另外,国内很少有像样的人工智能科普 我见过很多假媒体人和“砖家”的各种言论,胡说八道的程度被指出来了。 可怕的是,其中一个人还有很大的发言权和影响,控制着各种资源。 我自认有资格写这样的书 人工智能迅速发展的过程中的许多事情我都大致清楚 一方面很有趣,我的老师和大兄弟是这个行业的大师级人物,他们发明了“强化学习”算法 谷歌收购的deepmind团队有一半是我的大师兄学生,他们曾经是人工智能的少数派,但在deepmind干的alphago战胜李世石后,这个派又成了显学 迈克尔·阿布( michael arbib )邀请我的老师去麻省理工学院 他是控制论创始人维纳最后的博士生。 阿布一家表示,人工智能是控制论的替代品 我想流亡阿布,一去学校,他就转会到南加州大学,结果和老师研究加强了学习。 从这个意义上来说,我是像alphago这样的人们的长辈 迈克尔·阿布deepmind团队我上学时人工智能低潮 通常,美国大学的计算机系统分为三组。 制造系统的人,制造理论的人,制造人工智能的人。 制造系统的人和制造理论的人相互鄙视,但他们鄙视制造人工智能的人 现在情况不同,制造人工智能的人都应该咸鱼翻身,都成了公共知识分子。 我那时才解释说疏学浅,看不清楚强化学习的远景,关于机器学习的理论结果离开了。 其实,在人工智能的所有分支中,大致上只有强化学习还留下一点控制论的影子,有人认为强化学习包括所有人工智能。 “人工智能”和“控制论”的词数(引用自“人工智能简史”)对于人工智能学界,国内有与美国不同的现象:中国在人工智能行业最有发言权的是自动化系,对应中国科学院的是自动化所( 美国的大学没有划分得那么详细。 加利福尼亚大学伯克利分校和麻省理工学院至今仍是EECS ( department OFelectricalengineering and ComPuterscience )。 这在中国至少可以分解成五所大学 中国小学科的分支都是一个学院,学院之间没有老年死亡往来 人工智能这样的学科,如果不擅长图灵的计算理论,讨论就不太深入 除了正本清源,我还想鼓励专家之间的交流 我也希望决策者读我的书,了解科普和历史。 也许不会被假媒体人和“砖家”们欺骗,不会浪费社会资源。 我再说就要生气了 西方有对人工智能历史的古典记载吗? 尼克:美国人写的人工智能历史是纳尔逊( nils j. nilsson )的“人工智能探索”( thequestforartificialintelligence:ahistoryofideasandachievements ) 纳尔逊是人工智能学科的早期参加者和领袖,常年担任斯坦福研究所( sri )人工智能部门的负责人和斯坦福大学计算机系部长 但是他的这本书首先是他自己熟悉的,写喜欢的行业 麦克达克( PamelaMcCorduck )在1979年写的“可思考的机器”( Machineswhothink:APersonalinquiryintothehistoryandprospectsofartificialinteliges ) 纳尔逊:“探索人工智能”麦克达克:“可以思考的机器”另外,明尼苏达大学的查尔斯·巴贝奇( charles babbage )研究所创造了计算机科学的口述历史,采访了很多人工智能学家 大部分的采访都有录音 我听了将近一百个小时的录音,从这些第一次资料中有了一点感兴趣的新发现 中文和英语,现在都没有合适的人工智能历史读物 总的来说,我的这本书还很公正全面,我儿子正在把它翻译成英语。 通过第一手资料,关于ai史的新发现是什么? 尼克:比如“人工智能”( artificial intelligence )这个词是谁最先提出的 一般的误解是,“人工智能”一词是1956年达特茅斯大学夏天研讨会人工智能的起源召集者麦卡锡( john mccarthy )想出来的,其实并非如此 麦老晚年承认这句话最初是从别人那里听到的,但不记得是谁了 后来,英国数学家伍德沃德( philip woodward )在《新科学家》杂志上写信说他是ai一词的原创者。 因为麦卡锡于1956年访问了麻省理工学院,与麦卡锡进行了交流 但是麦卡锡在1955年在其建议书中采用了“人工智能”一词 现在当事人很多已经去世了,这件事恐怕是个悬案 其实英国人最初的说法是“机械智能”( machine intelligence ),这是1950年发表在哲学杂志《心》( mind )上的传世复印件“计算机与智能”( computingmachineryandintellii ) 最初的computing machinery指的是计算机,computer指的是人肉计算器,使用机器计算机简单地重复计算 图灵的《计算机与智能》发表在1950年10月的《心》上。 另外,我比较详细地考证了美国人工智能的几个大学派之间的矛盾和争论。 美国有斯坦福大学、麻省理工大学和卡内基梅隆大学三个人工智能基地 三大基地是三组不同的人建立的,这些实验室经历了各种斗争、分裂和重组 这些人事纠纷构成了人工智能学科的历史 实际上,图灵于1948年在英国国家物理实验室的内部报告书中分为“肉体智能”/“附属智能”、之后的统计派/神经互联网派(智能模拟设备)时 人工智能祖先之一纽尔( allen newell )说ai史是斗争史(大意是这样)。 也就是说,无论什么时候,每种方法都有对立面。 模拟和数字、知识和逻辑、意义和语法、连续和符号、串行并行、置换和增强、机械论和目的论、生物学和活力论、工程和科学……斯坦福大学人工智能实验室司马贺的第一个麦卡锡,司马贺( herbert simon )是它 近年来,知识地图技术在谷歌的提倡下,为符号派留下了血统 人工智能起源以来,半个多世纪过去了,它在那些方面已经突破了吗? 尼克:参加达特茅斯会议的纽尔和司马贺在1957年预测,10年内电脑下棋会战胜人,10年内电脑可以解释人还没有解释的定理吧。 他们太乐观了 这两个预测分别在1997年和1996年实现,大约花了40年 1985年4月14日,纽尔在旧金山参加了美国计算机协会的人机交互大会 2006年,达特茅斯会议50周年时,当时10名参加者中有5人死亡,活着的5人——摩尔、麦卡锡、明斯基、塞菲里奇和所罗门诺夫在达特茅斯再会。 从人工智能的历史来看,确实过去不太容易处理的问题往往被慢慢处理。 例如,面部识别在最近五年在国内发展迅速 目前,利用“深度学习”(多层神经互联网)的语音识别系统已经达到了实用阶段 这几年出现了很多同质的企业 机器翻译还没有突破吗? 尼克:确实,随着语音和图像识别技术的成熟,人们认为在现在的人工智能中很难解决的问题是自然语言解决 专家最近说“懂语言的人取天下” 机器翻译是自然语言解决的一部分 年,谷歌是一个利用深神经网络的神经机器翻译( google neural machine translation )系统,大大提高了机器翻译的水平。 今年facebook利用了自己擅长的卷积神经网络,机器翻译的效率也进一步提高了。 但是,理想的场景,比如人们不用学习外语,就可以在人的耳朵里嵌入微型翻译器,自动翻译听到的外语。 还很远。 谷歌神经机器翻译系统翻译的例句自然语言解决涉及许多哲学主题,从图灵测试到小区“中文屋”虚拟实验,都与此有关 每次出现新的人工智能工具时,都会被用来尝试解决自然语言。 除了翻译,自然语言解决的另一个课题是人机对话 现在的对话都在短场景10句以内。 因为问答系统依赖于常识和浅层推论。 知识地图是核心 一个问题总是与who、when、where、how、why相关,这些要素可以适用于知识图像中的类和实体的属性和关系 对年后的各搜索引擎说:“梁启超的媳妇是谁? ”。 答案至少有“林徽因”和“林洙” 系统的基础知识地图知道梁思成是梁启超的儿子,所以梁思成结婚了两次,第一次林惠因,第二次林洙。 当知识地图足够大时,它回答问题的能力会令人吃惊:年ibm华生( watson )在美国电视智力竞赛节目jeopardy! 打败人类选手 但是,现在要达成长人机交互场景并不容易 华生在jeopardy! 打败人类选手的这些技术是人工智能下一步的突破口我们也努力在这些行业做有意义的创新工作 像《银翼杀手》这样的机器人电影总是关注未来人工智能的主体意识和人际关系这一议题 你怎么看奇点? 尼克:奇点是指机器超过人,或者根据“未来简单历史”( homo deus:abriefhistoryoftomorow )的作者,新物种智能地超过人类本身的定义并不严格 用某种单一的指标论来说,机器早就超过了人 讨论这个问题首先要定义什么是智能,什么是人 现在,有时总是有一个人会但不会机器,有时会机器但不会人,但总是有这个体会,有时那个身体不会? 其中一个不是人吗? 我们在你折断胳膊,改变别人心脏的时候,你还是你吗? 如果把你的头换成别人的身体,你还是你吗? 这时,dna可能是别人的,但意识还是你的 科幻电影总是把人工智能的问题看做能不能制造人形机器人,这是低级和庸俗的 定义什么是人和智能,询问机器是否有智能,需要诉诸计算理论 年6月7日,高考机器人ai-maths在切断网络中断题库的状态下完成了北京文科数学卷和全国两卷数学卷,分别是时间22分钟和足够,成绩分别是15分和百分(满分150分)。 有强人工智能和弱人工智能两个词。 强大的人工智能可以制造全面超越人类的机器。 弱的人工智能是指可以制造国际象棋和面部识别等超越人类的机器 根据丘比特=图灵论题( church-turing thesis ),所有功能足够强的计算装置的计算能力与图灵机同等,不存在比图灵机强的计算装置 除了丘吉尔论题之外,还具有在任何计算装置间相互模拟的价格都相似的类似性 这两个论题蕴藏着很强的人工智能可能性:智能等于图灵机,人类等于图灵机 现在的计算机科学(包括人工智能)的事业是基于这个认可的 如果按照摩尔定律(每18个月新闻解决能力倍增)的计算装置的进化速度超过人类进化的速度,“奇点”就会到来 那时自然语言理解,机器定理证明都不是事 运行的纸带版图灵机也不是所有科学家都相信与丘吉尔论题的相似性 代表人物是英国数学家,“皇帝新脑”( emperor’s new mind:concerning computers,minds,and the laws of physics )作者彭罗斯( roger penrose )。 现在受欢迎的量子计算机可能不服从相似性 量子计算机也许能比较有效地处理素数分解问题,但这是现在公钥密码算法的基础,如果量子计算机成功,对现在的电子商务系统感到不安 当然,实现大规模实用的量子计算机依然很困难,目前这方面最领先的是ibm 彭罗斯:“皇帝新脑”根据你的理解,人工智能为什么在这几年发展迅速? 尼克:主要原因有两个。 一个是大规模的数据累积,另一个是计算能力的提高,达到了拐点。 我想提出更普遍的观点:今天测量人类文明的标准是全社会的计算能力 斯坦福大学历史学教授莫里斯( ian morris )在《西方统治多久》( why the west rules—for now )一书中,以能源消耗量为第一测量参数,对东西文明进行了比较 但是,随着新能源技术的出现,例如随着几年前页岩气的开发,能源问题得到了一定程度的缓解 我认为过去一百多年来,测量文明的指标是新闻解决能力 具体来说,在这几十年前,新闻解决能力可以用计算能力来衡量——全社会的计算能力是全社会的计算设备数量和单一设备的计算能力之积 论文、计算机科学专利、万维网流量、社会计算能力、人工智能全球融资总额、摩尔定律和学术出版物的增加趋势今年6月,马云在天津召开的第一届世界智能大会上报告了“智能改变世界”的主题。 以前腾讯也实践了聊天机器人 人工智能在中国的前景怎么样现在有泡沫吗? 尼克:无论是去年中国科学家、公司集团发起的未来科学大奖(中国诺奖,以单项奖金100万美元为荣),还是今年阿里巴巴设立的探索科学技术未来的实验室“达摩院”(宣布3年内投资千亿美元),中国都将在科学技术行业走向世界 不管具体实施如何,我承认了民间援助科学技术的这个构想和运营方法 阿里巴巴“达磨院”,1980年代日本五代机的教训足以告诫我们。 当时,日本在制造业和集成电路上大大超过了美国,5代机是日本野心确立世界新闻产业领先地位,从制造大国向经济强国转变的计划的一部分。 另外,美国的费根鲍姆( edward albert feigenbaum )等人也强烈提出了向本国政府施加压力,以增加科学技术行业,特别是作为自己行业的专家系统投资为目的的5代机。 当然,最后五代机是彻底的失败。 5代机的失败使日本的新闻产业整体落后于美国,日本最聪明的集团黄金10年被误解,也严重打击了当时所谓的“日本第一”的民族自信 1981年第一次五代机会议的会议记录(全288页)几年前,我花了时间研究日本五代机全体会议的论文集 从1988年的会议记录1,300页的3大卷可以看出,当时的5代机已经成为大杂烩,失去了焦点,8根棍子不到的行业也拼命接近它。 这就像现在人工智能行业的创业,与人工智能无关的人一夜之间成为了人工智能的专家 许多企业家也在考虑拿到风投的钱后做什么 现在可以说人工智能一定有泡沫了 但是并不是有大泡沫。 我不能说。 大的问题是同质化,解决语音的企业有很多,认识脸的企业也有很多,收集了巨额的风险投资,这些评价已经超过了多个上市企业 资本没有意想不到的回报就是泡沫 共享自行车是同质企业竞争的例子,现在的合并被认为是缩小泡沫 识别颜制品风险投资堆积如山的投资是不健康的,是泡沫的根源之一 他们应该积极向上,不是人云亦云 了解人工智能的历史可能会让你更深入地了解潜在的投资行业 无论是美国还是中国,最好的风险投资机构对领域都有独特的看法 中国和美国可以在人工智能行业比较吗? 中美在人工智能行业的竞争尼克:美国经历了几次科技泡沫,人才和资本更成熟,应对措施也越来越多样化 日本五代前没有经历过科学技术泡沫,一旦危机来临,就走投无路,最后只能互相隐瞒。 除了融资行业的泡沫外,中国科学技术政策的制定和实施也可以吸取教训 总的来说,中国的人工智能和美国一起处于第一步 我们深入研究过中国的三个经济区京津冀、长三角和广东港澳大湾区。 中国的人工智能公司、人才、资本约7成集中在北京。 这几个类似于美国硅谷。 我们的研究表明,目前中国确实在人工智能方面超越了美国,至少出现在企业、专利和论文数量上,但质量还有距离 硅谷总的来说是世界上的灯塔 (本文来自澎湃信息,越来越多的原始信息请下载《澎湃信息》app )