2020-06-09 浏览:2793 来源:方德信基金
自18世纪以来,人类社会共发生过三次大型的技术革命,分别是蒸汽机革命、电力革命和信息互联网革命。每一次的技术革命均伴随着相关学科的发展,理论知识又在实际运用中得到完善,“技术突破-知识学科进步”形成良性循环,并且成为后续其他的技术发展的支撑,对社会的影响力也将随之增强。得益于互联网信息时代的数据积累,半导体行业设计、制程进步和芯片运算能力提升,深度学习结合强化学习带来的计算机视觉、语音技术、自然语言处理技术应用更精准,人工智能将是第四次技术革命中的重要技术。
人工智能是新一轮科技竞赛的制高点,对经济增长和国家安全均至关重要。科技实力是国家实力的核心,能否抓住智能时代的变革机遇,是中国建设现代化强国的关键。
第一部分 人工智能进入新阶段
一、人工智能发展历程
人和动物的根本区别之一是:人类有创造意识,可以制造工具和机械改变生存的空间和环境;而其他动物只能根据环境改造自己。公元前3000多年前,古埃及人利用杠杆、滑轮等基础机械修建了雄伟的金字塔。18世纪中叶,近代蒸汽机诞生,人类第一次获得源源不断的动力,开启了工业革命。19世纪中叶,电动机诞生。20世纪中叶,核能、生物技术、电子计算机、航天技术发明和应用。人类的发展史是不断制造和使用更高级工具的历史。计算机技术是人类发明创造的巅峰之作,从巴贝奇和艾达•奥古斯塔基于纯机械工程设计的第一台计算机,到以图灵(Alan Turing)为代表的现代电子计算机的发展;从认为计算机只能按照人类编好的程序来执行既定任务,到提出计算机可以模拟出人类思维,可以像人一样“独立思考”,图灵称之为“学习机器”,人类一直在人工智能的发展方向上不断探索。
1956年夏天在美国达特茅斯大学的一场学术会议上,人工智能的概念被提出并获得肯定,标志着人工智能科学诞生。不同于传统计算机技术是机器根据既定的程序执行计算或者控制任务,人工智能可以理解为用机器不断感知、模拟人类的思维过程,使机器达到甚至超越人类的智能。通常认为,人工智能应用具有自学习、自组织、自适应、自行动的特点,有近似生物智能的效果。
自人工智能科学诞生至今60多年的发展历史过程中,各行业的专家学者们做了大量的探索与实践。人工智能经历了三次发展高潮,分别是1956-1970年代,1980-1990年代和2000年代至今。
智能应用成为互联网下一演进阶段周期的核心要义,人工智能部分技术已经进入产业化发展阶段,带来新的产业兴起。基于机器学习技术快速进步,互联网正凭借快速提升的人工智能,为用户提供个性化、精准化、智能化服务,大幅提升业务体验,并与生产生活的各个领域相融合,有效提升各领域的智能化水平,给传统领域带来变革机遇。
二、人工智能技术分类
人工智能技术分支如今已形成了包括芯片层、基础层、感知层、认知层以及平台层等五大核心架构在内的技术布局。
芯片层作为推动人工智能技术不断进步的硬件基础,基于大数据、人工智能算法和大计算的强大基础能力支持,感知层的语音技术和计算机视觉技术使得仿人的听觉能力和视觉能力成为了现实,认知层包括自然语言处理、推荐与搜索、决策与推理三部分内容,并通过知识图谱、语义理解、机器翻译等方面实现大规模产业化应用,最后在平台层通过接口将人工智能能力进行输出。
1、芯片层
硬件的进展是人工智能发展的基础推动力量之一,而作为人工智能技术的核心,人工智能芯片也备受关注,引得国内外科技巨头纷纷开始自主研发人工智能芯片,并且人工智能芯片的应用场景细分市场越来越多,专门为某些人工智能应用场景定制的芯片适用性明显高于通用芯片。这样的形势,如百度昆仑芯片、百度鸿鹄芯片、寒武纪芯片和地平线的人工智能视觉芯片、地平线自动驾驶芯片等陆续推出,人工智能芯片如火如荼的同时,已然呈现出三分天下的态势,FPGA、GPU和TPU芯片,并且已经在人工智能领域大规模应用。
2、基础层
人工智能算法
首先是对算法和理论的研究,目前在语音、图像、语言与知识等多个领域取得重大突破,在语音识别方面,已将注意力机制的建模技术用于在线语音识别,推出了流式多层阶段注意力模型SMLTA,实现了流式的基于注意力机制的声学语言一体化建模,在个性化语音合成方面,还推出了处理语音风格和音色迁移的个性化韵律迁移语音合成技术Meitron。该技术在训练时,交叉组合不同声音的训练样本,实现了声音的声色、风格和情感的解耦。在计算机视觉领域,推出了基于图文关系的大规模图像分类弱监督算法。在图像超分辨率领域,目前提出了基于级联回归的CDSR模型,用于图像的超分增强,还提出了自适应注意力多帧融合技术,用于视频的超分增强。在医学图像领域,目前提出全新的基于深度学习的病例切片肿瘤检测算法,在公共数据集 Camelyon 大赛上肿瘤定位FROC分数高达0.8096。在自然语言处理领域,已经开发了更具有表现力的主体嵌入和知识图嵌入表示学习模型,能够高精度地从语言数据中捕获主题信息。同时,通过联合恢复知识图嵌入空间中的“头实体”、谓语和“尾实体”表示,问答系统的回答准确性得到进一步提高。
大计算
人工智能时代,算法能力快速提升,同时算法对算力的要求也越来越高。为了应对算力、效率和多元化场景等核心挑战,已经提出了端到端的人工智能计算架构,通过芯片。链接、系统和调度的协同设计和技术创新,满足人工智能训练方面计算密集通信密度的需求,以及人工智能推理方面大吞吐和低延迟的需求。与此同时,包括芯片之间、系统之间、设备之间的相互连接,将帮助不同场景中计算连接在一起,产生更大的计算力。在系统层兼顾端云,软硬一体,实现了对算力资源的灵活调度。特别是随着技术的发展,还陆续出现了5G边缘计算和量子计算。
大数据
大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集。大数据具备Volume、Velocity、Variety和Value四个特征,简称为“4V",即数据体量巨大、处理速度快、数据类型繁多和价值密度低。所谓大数据技术,就是从这些各种各样类型的数据中,快速获得有价值信息的能力。根据大数据处理的生命周期,大数据的技术体系涉及大数据的采集与预处理、大数据存储与管理、大数据计算模式与系统、大数据分析与挖掘、大数据可视化分析及大数据隐私与安全等几个方面。
3、感知层
语音技术是实现人机语言的通信,包括语音识别技术(ASR)和语音合成技术(TTS)。智能语音技术的研究是以语音识别技术为开端,可以追溯到20世纪50年代。随着信息技术的发展,智能语音技术已经成为人们信息获取和沟通最便捷、最有效的手段。语音识别让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音合成又称文语转换(Text to Speech)技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。基于这两大技术分支,随着语音技术应用的不断深入,又衍生出声纹识别、语音唤醒等技术分支。
计算机视觉是一门研究如何使机器“看”的科学,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉包含图像图像处理、模式识别和图像理解,具体覆盖了图像技术、视频技术、人脸与人体识别、文字识别和软硬结合等方面。
4、认知层
自然语言处理是是一门通过建立形式化的计算模型来分析、理解和处理自然语言的学科。它研究能实现人与计算机之间用自然语言进行有效通信、以及通过计算机提升人与人之间自然语言交流效率的各种理论和方法,是计算机科学领域与人工智能领域中的一个重要方向。自然语言处理所涉及的主要技术方向包括:深度问答、篇章理解、智能写作、对话系统、机器翻译、语义计算、语言分析、知识挖掘、反馈学习以及个性化。
知识图谱是人工智能认知层的核心技术之一,拥有数亿实体、千亿事实,并具备丰富的知识标注与关联能力,构建了通用知识图谱、行业知识图谱、汉语语言知识图谱、关注点图谱等多维度图谱。搜索引擎是用户获取信息的最重要入口,但传统的搜索引擎只能根据关键词罗列出很多个候选结果,用户需要再次筛选判断才能找出想要的答案,融合了知识图谱等人工智能技术的智能搜索引擎,可以更好地理解用户需求,给用户更直接的答案,并以更便捷、更友好的方式呈现。在智能移动设备迅速普及、人工智能技术快速发展的时代背景下,用户期望以自然语言表达搜索需求、直接获取正确答案,基于关键词的传统搜索引擎已不能满足便捷、高效、精准地获取信息的需求。融合知识图谱、自然语言处理及深度学习技术,研发深刻理解意图、精准呈现结果、自然便捷交互的智能搜索引擎,已具备图谱问答、推理计算、智能推荐、语义理解、智能排序、深度问答等能力。主动预测用户需求的智能推荐能力,也是智能搜索引擎的特点之一。基于知识图谱丰富的属性和关系,搜索引擎可以自动判断用户想要触及的“知识点”,进而给出用户最想要的答案,同时主动激发和满足用户的潜在需求。人工智能技术和搜索等产品正相互推动彼此进化,更好地运用人工智能将推动智能搜索引擎持续发展。
5、平台层
通过平台层向开发者和企业用户开放人工智能能力,并提供了一系列定制化人工智能开发平台,不断降低各行各业人工智能的应用门槛,助理各行业智能化升级。以百度人工智能开放平台为例,作为中国服务规模最大的人工智能开放平台,已在语音、听觉、语言等方面实现全面升级,从深度学习框架、场景化人工智能能力、定制化训练平台,到软硬一体模组和解决方案等多方面,加速人工智能在工业、交通和医疗等领域的落地。
三、人工智能应用领域
综合考虑技术角度、行业角度、专利角度,将人工智能行业划分为金融、医疗、安防、智能车、智慧零售、媒体及娱乐、智慧政法、教育、农业、工业、智慧城市、通信、智慧物流以及智能家居十四个一级的行业分支。
从人工智能技术落地产品形态角度,将人工智能产品划分为智能安防设备、智能终端、智能车、智能家居、智能医疗设备、人工智能芯片、智能网络优化、搜索引擎、企业服务、机器人以及云服务十一个产品类别,人工智能赋能产品更加智能化,例如智能医疗设备在人工智能技术的加持下,诊断结果的专业性可以不输专业医生,从而实现在不同医疗水平地区的医疗同质化。
四、人工智能商业模式