“废柴巨人”人工智能的质变
编者按:本文来自微信公众号“远川科技评论”(ID:kechuangych),作者:董指导,36氪经授权发布。
从匹诺曹、爱德华到大黄蜂、贾维斯,人类对于机器智能的憧憬和追求就从没离开过荧幕。而在现实生活中,最引人注意的莫过于“机器人司令”马克·雷波特(MarcRaibert)。他是麻省理工学院(MIT)的教授,在1992年时创办了波士顿动力公司,全力研发各样智能机器人。
2009年时,波士顿旗下的BigDog(大狗)亮相互联网,它虽然体积庞大,但行走平稳、转向灵活,仿生状态非常惊艳。4年后,其发布的人形机器人Atlas更是名声大噪,初代产品可以伸展双臂平衡通过狭窄的“独木桥”;随后更具备了倒立、翻转、空中劈叉等动作,甚至跑酷的姿势也非常优美。
波士顿动力的每一款产品问世,都能成为网红焦点。而雷波特及其公司也成为谈及AI时所无法避开的行业典范。因此在11月4日东莞举办的企业创新生态圈大会上,雷波特也远程参会交流。和他对话的,则是中国AI(人工智能)公司云从科技的创始人周曦。后者也是学霸创业,从中国科学院走出来的行业中坚。
两位科技大佬对话的一大背景是,当下人工智能正在从又一波高峰滑落:外界总期待AI人工智能无所不能,但实际却像个“废柴巨人”。
就拿波士顿动力来说,就连充满探索精神的谷歌,收购公司之后,看着商业化进程这么缓慢,也坐不住了,最终卖出转手。而国内的AI,在大众认知里似乎依然停留在语音、人脸识别这些不够“性感”的方向。
确实,历经六十多年发展,AI技术已有大幅提升,甚至学术界担忧,AI过于强大从而带来威胁、统治人类。然而,现实却是,成熟商业化的领域依然不多,对社会的影响也感知颇浅。因而,社会普遍认为,AI就像个“废柴巨人”,看上去很有创造力和破坏力,但除了饭(烧)量(钱)大(多)也没啥本事。
那么,AI该如何摆脱废柴的尴尬?该如何秀出肌肉、舞动拳头、发挥力量又不至于统治人类呢?
人工智能之父可以追溯到在二战中做出密码破译机的图灵,而行业的起点则从1956年达特茅斯学院的暑期会议,世界第一座AILab实验室开始。自此后的十年,AI领域一片红火:美国政府投资了数百万美元、西洋跳棋程序诞生并战胜了人类大师、会文本聊天的机器人、专家系统、根据指令抓积木的机器人相继诞生。
然而,这波热潮却在1973年被一份报告泼了冷水、湿得透透:到目前为止,该领域的任何发现都没有产生当初承诺的重大影响。[1]随后学术界进行了一轮深刻的批评与自我批评,AI的研究进入平静阶段。
1976年,诞生了十余年的专家系统,终于开始在商业中发挥作用,借助数据库积累参与医疗诊断咨询。借助专家系统,AI复兴快速展开,日本政府拨款8个多亿美元支持研发、英国耗资3亿多英镑打造AI工程。然而,又过了十年后,人们遗憾发现,机器专家也不灵光,AI研发再次陷入低谷。
1960s年代、1980s年代,两次产业的迸发与消退、人类的狂喜与失望,归根结底就是一句话:机器没有人们期望的那么智能。
事后来看,结果是显而易见的。硬件方面,晶体管、芯片的集成度仍处于早期,视觉、触感等信息的获取,也十分困难。软件方面,支持建立模型的数据量仍严重不足,算法规则理念也不够先进。可以说,不是机器不够智能,而是人类的功课还没准备充分。
两次的周期往返让产业深深质疑,AI到底是不是一个方向?未来会好吗?甚至有人开始反思,大象根本不玩象棋(ElephantsDon’t Play Chess),但大象却可以根据环境变化做出判断、反应。用人类设定规则的方法,也许是错误的。
幸运的是,科学家并没有停止探索。寒冬中播下的种子,在暖风之下,开始生根发芽。
跨学科研究:概率论、统计学、控制理论、工程学、神经学等等,越来越多学科跨界进入AI研究,交叉体系打破了先行设定规则的思路,神经网络、深度学习技术开始发展。
硬件大提速:在摩尔定律的促使下,芯片集成度指数型发展,CPU、GPU、MPU等等功能芯片层出不穷。而云的诞生,也使得算力可以近乎无限扩大。光学镜头、红外等传感器也性能提升,对外界环境的辨别、关键信息的捕捉也更加高效。
软件爆发潮:在互联网、移动互联网时代,产生的数据量爆炸性增加,每年产生的量就等于过去人类上千年积累的百万倍,真实世界的活动得到了前所未有的记录,为建立模型提供了充分的素材。在互联网大潮中,码农数量也随之增加,如今全球达到了3000万人左右。
在这些因素的促使下,AI产业再次昂首阔步:“深蓝”战胜国际象棋冠军,AlphaGo完虐人类围棋高手,无人驾驶车也行驶在路上,AI甚至出现在了美国禁令清单中。技术爆发性“奇点”似乎就要到来,以至于比尔盖茨、霍金等大佬纷纷劝阻,别搞太快了,很危险;AI会取代人类。
实际情况是,机器学习、深度学习、强化学习技术支撑的这一轮AI热潮,也根本快不起来,纯粹深度学习的算法演进,已走入绝境。OpenAI的GPT-3模型训练成本高昂,其智商却无法理解“冰箱里的奶酪是否会融化”这样的常识。
2008年金融危机后,为避免再次发生世界性危机,全球最顶级的金融人才开始修订《巴塞尔协议》,而如果交给GPT-3,起码要经历千百次金融危机它才能学会。
周曦认为,“这个时候我们需要另外一条路,我们叫专家知识。我们要相信人的力量,把人工智能和人结合。人能够在很复杂的环境,很小样本的情况下,作出创造性的决定。”
如此一来,人机协同,成为人工智能进化的必然方向,同时,也是人类合理使用AI的必然要求。
电影《黑客帝国》中展示了这样一副图景:人类生活在一个虚拟世界中,而创造并控制这个世界的是叫做“母体”的AI人工智能系统。人类仿佛是AI饲养的动物,没有真实的自由,而实际上,人类不过是一行行代码程序。然而,更可怕的是,99%的人类对虚拟世界完全没有察觉。
电影结尾,黑客Neo用人类的爱情战胜了机器的理性,但电影仍令人后背发凉,人类的肉身如何抵抗AI的超级之躯。尽管超级AI还为时尚早,但AI已经开始取代部分人类工作:
比如计算机开始取代机关机组人员工作,负责编排航班时刻表、分析异常报告;算法也取代了编辑,自动向用户推送内容;机器人替代搜救队员到危险地方工作,替代了医生进行高效诊疗,减少失误;雷达和算法,替代人脑更快判断车距和避险。毫无疑问,AI的智能化正改善着人类的生活。
然而,AI未必能永久智能。2010年,交易算法故障导致纽交所闪电崩盘,几分钟内蒸发了万亿美金;2018年,计算机故障导致欧洲1.5万个航班严重延误或取消。[2]除了金钱损失之外,AI过度使用,也在冲击着人类社会文明:
剑桥分析公司不当使用数千万用户信息,个人隐私遭到破坏;而DeepFake带来的换脸等应用,流行于网络,社会秩序、公共安全遭到极大冲击。甚至军事领域,也开发了大量AWS(无人指挥下,自主寻找目标并进行击杀)武器,大大加大了杀戮的残暴。
而在讨论超级智能AI对人类的威胁时,总有人会说,到时关闭电源不就好了,但诡异的是,AI的目标是为了完成人类赋予的任务而克服万千困难,“被断电”显然也是它认为需要克服的困难。因此,如果AI只是被设定用来实现“最大化目标”,那么AI的终极,就是超级AI、就是全面接管人类。
毕竟,初出茅庐的AI,并不能短时间内具备人类的社会经验和价值判断。基于此,人工智能学者斯图尔特·罗素(StuartRussell)认为,人类应该致力于研发“可证明对人类有益的人工智能”(ProvablyBeneficial AI),而不是人类及超人类级别的AI。
罗素对AI提出了三个原则:最大化实现人类目标;对人类保持敬畏之心;基于人类行为设定机器偏好。浓缩成一句话的话,好AI应该是“以人为本的人机协同”:人类居于主导地位,基于人类的经验、判断与偏好,研发服从于人类利益的AI,最终拍板的依然是“我们”。既不做半机器半人类,也不做机器下的人类。
而要让AI成为助手,总共分三步:第一步,在多个人机协同感知端实现技术突破,将人力从繁复的工作中解放出来;第二步,在感知、认知到决策全流程提升效率,助力决策;第三步,在人机交互体验帮助创造者,丰富终端的产品和服务内容。
这个“三步走”战略,逻辑严密前景美好,但要实现却并非易事。它要求每一步都算数,每一步都得踏实走。不少国内公司都在迈出第一步,在感知端的工作已经成为追求精度的竞赛。率先迈开第二步的,才能更快完成人机协同的目标。而这则有一个先决条件:市占率说了算。
只要在终端分布的感知端数量越多、喂给认知与决策算法的数据才会越多,而经过训练反馈的结果也才会趋近于最优。这也是统计学、概率论发挥作用的基础。
国内不少企业也在如此布局。2015年成立的云从科技,凭借“行业专家+工程师”模式的充分开发,云从对银行和机场进行了最为广泛的AI覆盖。这保证了公司在向认知与决策端延伸时,有足够优质海量的数据可以使用,为成功迈出第二步做了充分保障。
人机协同成为人类和AI的亲密接触,而需求则成为了AI竞争的关键,也成为了中国AI发展的优势。
截止2016年,全球深度学习领域,中国论文总量与引用均位列第一,AI领域的发明专利中国位列第二;而在商业化方面,2011年成立的旷视,2012年成立的依图,2014年成立的商汤,以及2015年成立的云从,都在短期内快速崛起,被并列称为中国的“AI四小龙”,赶着来投钱的资本,从中国一直排到了美国。
这几家基本都是以计算机视觉技术CV起家,所以大众普遍认为所谓的AI,不过是认脸、下棋、刷论文、或者套着AI名义做个政府集成外包。虽然AI商业化的进程缓慢,但毫无疑问,这些印象还是刻板过时了。
AI商业化的良性之路,正在形成。
以云从为例,已经实现了AI从感知(人脸、人体、物体、语音)到认知(语义、知识图谱、大数据)到决策(风控、推荐、画像)的技术闭环。除此之外,云从的“3D结构光人脸识别”、商用跨镜追踪(Re-ID)、人体3D重建等技术也走在技术前列、商用舞台。
人机协同也早已取代计算机视觉,成为这家小巨头的新标签。周曦做了一个总结:每次科技的进步都是效率的提升,都是对人的延展。
既往的几次科技革命,都只是对人类四肢的延展。而人机协同则带来新的质变——对人脑的延展,既然人的思维没有边界,那么在人机协同这个方向下,人工智能就不应再被束缚在具象化的实物上,而是能够像思维一样拓展出无限的边界。
以AI在医疗中的应用为例,如果仅有传统的计算机视觉技术以及语音识别技术,那么AI的最多还是只能看看CT,顺便帮医生录入病例。然而,对于那些挣扎在死亡边缘的的病人来说,他们面对的最大困难则是,能够耄耋之年冲上一线的钟南山院士只有一个,能够殚精竭虑无私奉献的陶勇医生也只有一个。
人机协同则可以通过在人工智能技术这个黑匣子中置入专家知识,将钟南山、陶勇们的知识技能模型化、自动化,通过AI解决掉90%以上诊疗信息,协助医生付出10%的精力处理其他关键性问题,进而让医疗专家的服务能力扩大10倍以上。
在海关监管系统中,云从已经开始进行人机协同的阶段性实践,研发了海关立体监管决策指挥系统、集装箱全流程监管以及智慧查验等系统,将海关监管的现实场景数字化、结构化、模型化,帮助海关专家做出更好的决策。
云从之外,商汤的算法平台,旷视的物联网,也都已取代计算机视觉,成为各自新的目标。中国AI产业,正依靠着广阔的需求市场,走上世界舞台。
而无论是银行风控专家,还是三甲医院主任医生,在中国,都是极其稀缺的资源,但老百姓对高品质服务的需求是实打实的。人机协同,既可以将高质量产品与服务普惠于民,又避免了人机岗位的冲突。
对于我们这样人口大国来说,发展人机协同的普惠型AI,延展我们的智慧,是产业发展的趋势,也是工程师红利和群众需求结合的必然选择。
虽然火器大炮在中国早有使用,但清朝时期的大炮“只知道用铁铸成炮身,不知道做炮膛,全无科学分寸,所以施放不能有准头”,[3]火炮内外凹凸不平,其中最大的凹陷,可以倒入4碗水而不溢出。最终在和列强的战斗中,清朝军队惨败负辱。
诚然,如今的世界,爆发大规模战争不再容易,但不可否认的是,国与国之间的竞争、甚至对抗,却从未停止。而科学、科技,无论在清朝,还是如今,都是自强自立的根本保障。而在AI领域,经过几批人的努力,中国已经有资格和海外公司站在同一阶段,这是弥足珍贵的成绩。
任正非曾说,只有长期重视基础研究才有工业的强大,人工智能是影响和塑造一个国家的核心变量。
作为拥有14亿人口的中国,我们需要提升效率创造更多的财富、也需要注重平等共同富裕。也许AI看似“废柴”,但我们却不能忽视“巨人”的存在。包容创新、包容那些探索的人,我们的基础教育、我们的技术强国,也才会有保障。
参考资料
[1] 《莱特希尔报告》(LighthillReport),ScienceResearch Council of Great Britain,1973
[2] 《AI新生》,斯图尔特·罗素(StuartRussell),中信出版社
[3] 《中国历史纵横谈全集》,萧枫,辽海出版社