陆奇一再强调百度是一家人工智能公司,重点开源智能语音系统和智能驾驶系统
百度总裁兼首席COO 陆奇正在将美式的管理和技术开发模式带进百度,这次AI 开发者大会也可见一斑。http://www.hibor.com.cn【慧博投研资讯】百度需要陆奇来力挽狂澜,但是能否推动百度内部制度的变革才是更为重要的,也是我们估值的基础。http://www.hibor.com.cn(慧博投研资讯)智能的认识高度上,百度无疑站在了国内所有互联网企业的制高点。这不是一场简单的技术变革,而是全球范围内兵不血刃的大规模人类演进的较量。百度“All in AI”的具体落实体现在技术、人才、数据三方面。基因于搜索业务17 年的积淀,百度搭建了全球领先的大规模神经网络,储备了2000 多名AI 核心研发人员,拥有了万亿级的搜索数据和百亿级的定位数据。和谷歌一样,百度涉及 智能的切入点也是智能语音和智能驾驶,这和搜索引擎公司的技术积累偏重于文字检索识别以及高精地图提供这两方面分不开,检索能力从文字识别图像识别跃升到了语音识别和视频识别,地图定位导航能力提供了智能驾驶的重要资源。因此此次开源的社会生态是智能语音系统DuerOS 和智能驾驶系统Apollo,两者基于中间层的百度大脑和终端智能云的计算和存储支持。百度开源DuerOS 和Apollo 一如2007 年谷歌开源Android 系统,试图以最快速度抓住后移动互联时代的霸主即人工智能技术的入口。尽管人工智能技术经历了三起两落,但是我们认为由于AI 技术的颠覆性,百度这次的战略改革具有卓远见识。
DuerOS 智能语音平台是新一代人机交互系统,力求融合语音助理、智能家居产业链
智能语音技术试图取代触屏交互成为新一代人机交互系统。DuerOS 以唤醒万物为己任,认为听清、听懂、满足是唤醒万物的核心三要素。目前百度的语音识别准确率已经达到97%以上,在远场语音识别方面,百度正在研发的技术包括麦克风阵列、回声消除、波束成型、语音唤醒和远场识别等。听清之上听懂,是打造对话系统的必要条件,要求语音系统不仅理解关键词,还能理解?本语句以及各种场景中的自然语言输入。百度的积累基于深度学习的实践、自然语言处理技术、多轮对话技术和搜索技术。其中搜索技术方面,百度具有世界首家语音图像多模态智能化搜索,率先从关键字索引进化到语义索引。对话技术方面,百度具有基于深度学习和增强学习应用的多轮对话系统,率先实现设备场景个性化的多轮对话系统。加上10 多年覆盖所有自然语言处理技术的经验,已经将深度学习应用到对话、自然语言处理、搜索、广告的各个方面。语音识别技术在国外市场已经进入到白热化竞争阶段,包括亚马逊Alexa,谷歌Google Assistant,苹果Siri,微软Cortana,中国市场仍然具有巨大的潜力。百度的DuerOS 不仅运用在度秘的智能语音聊天助理端,更与合作伙伴开发智能家居、智能驾驶助理、生活服务等各方面。本次开放赋能的DuerOS 包括核心层的小度对话核心系统、能力层的小度技能开放平台,应用层的小度智能设备开放平台,面向开发者提供技能开发工具和开发套件。