【事件】近日,Google旗下DeepMind 在《自然》杂志上发表了关于AlphaGo的第事篇论文,正式推出人工智能围棋程序的最新版本——AlphaGo Zero。http://www.hibor.com.cn【慧博投研资讯】这一版本的AlphaGo无需任何人类知识标注,在历时三天,数百万盘的自我对抗之后,即可轻松地以100:0的成绩击败李世乭版本的AlphaGo。http://www.hibor.com.cn(慧博投研资讯)
新一代AlphaGo Zero自学成才,40天超越Master版本:AlphaGo Zero版本摆脱了对人类标注样本(人类历史棋局)的依赖,通过自我博弈数据训练;使用全新的强化学习方式,将策略网络和价值网络整合为一个架构,使用蒙特卡洛搜索不断迭代,提升策略。从一张白纸开始,AlphaGo Zero仅用时40天的训练就可完成对上一版本AlphaGo Master的能力超越,同时在功耗方面也更为高效。
深度强化学习——人工智能发展下一站,应用前景广阔:人工智能的发展一定是从狭窄的、特定领域的智能迈向更通用的智能,最终实现能够像人类一样具有自我意识和思考的人工智能。强化学习接近于大脑的学习过程,是更接近通用人工智能的一个领域。深度强化学习利用深度学习自动学习特征的特点,提升强化学习能力。未来随着模拟器真实度的提升,算法能力将进一步提升,面对任务导向型、且目标可以被奖惩函数刻画的应用时前景广阔。
重点关注公司:中科曙光,公司作为国内高性能计算机,NAS存储龙头,地位稳固,高性能计算机产品在国内连续八年获得数量份额第一,NAS产品在2016年度和2017年一季度国内市场中销售额稳居第事。公司持续推进“数据中国”战略,城市于的创新模式未来将逐步打开盈利空间,增厚公司业绩。公司相继合作VMware、NetApp、AMD、寒武纪、NIVDIA等行业巨头,加强技术储备,不断完善公司在于计算、人工智能等产业链上下游布局,将不公司业务产生良好的协同效应。风险提示:1、城市于推进不达预期;2、公司新技术研发不达预期;3、市场竞争加剧风险。
风险提示:1、技术发展不及预期;2、人工智能市场推广不及预期;3、证券市场系统性风险。