您的浏览器版本过低,为保证更佳的浏览体验,请点击更新高版本浏览器

以后再说X

欢迎访问绘芯科技网站!

全国订购热线:
027-87052087 13329706647

行业资讯

甩屏软件 阿尔法狗算法公开_阿尔法狗神经网络算法_阿尔法狗下载

作者:hxceshi 发布时间:2020-06-23 19:18 次浏览

引领“阿尔法狗”出奇制胜的系统,是一套“深度学习+强化学习”的算法模型。在人工智能的日常应用中,能够进行小样本分析的“迁移学习”算法模型也十分重要。

世界排名第一的围棋棋手柯洁对人工智能机器人连输三盘,被“阿尔法狗”虐哭。

世界排名第一的围棋棋手柯洁与谷歌旗下的人工智能机器人AlphaGo(“阿尔法狗”)5月23日至27日在乌镇的对弈,吸引社会广泛关注。这是“阿尔法狗”去年3月大胜韩国棋手李世石后,与围棋大师的再次交战。不出不测的是,柯洁连败三局。

引领“阿尔法狗”出奇制胜的系统,是一套“深度学习+强化学习”的算法模型。在人工智能的日常应用中,能够进行小样本分析的“迁移学习”算法模型也十分重要。业内专家表示,未来人工智能的发展趋势将是深度学习、强化学习、迁移学习三者融合互补。

“阿尔法狗”不断进化:

深度学习+强化学习

去年韩国职业棋手李世石曾与“阿尔法狗”对弈,采取的五局三胜制,最终“阿尔法狗”以4:1获胜。今年柯洁与“阿尔法狗”对弈改变了规则,仅比三局,柯洁连败。

“阿尔法狗”的“大脑”,是机器学习系统,即一套机器模仿人脑运算的体系。支撑“阿尔法狗”的机器学习算法,是“深度学习+强化学习”。

先来解释深度学习。优秀国人工智能学会理事、香港科技大学计算机科学及工程学系主任杨强告诉记者,实际上,人工智能技术已走过了60年历程,直到近年来机器学习技术中的深度学习算法取得突破,才迎来春天。深度学习概念由加拿大学者Geoffrey Hinton提出并不断完善,意为使机器模仿人脑神经网络的学习、判断和决策能力。

在深度学习过程中,数据至关重要,是训练机器智能的沃土。去年在对弈李世石前,“阿尔法狗”以半年时间集中模仿学习了3000万步人类围棋大师的走法,并从自我对弈中积累胜负经验。

与去年相比,今年,“阿尔法狗”的算法有三大显著的进步。

其一,其学习的数据全部来自机器自身,而非人类。“阿尔法狗”项目担任人David Silver引见,最非常好的训练数据不是来自于人类,而是来自于“阿尔法狗”自己,利用其强大的搜索能力,生成数据,让下一代的“阿尔法狗”学习。由于数据优质、算法高效,因而“阿尔法狗”计算量仅为去年对阵李世石时的1/10。

其二,由多机运行升级为单机运行,更便于应用。去年“阿尔法狗”使用了谷歌云上的50个左右TPU,使用多台电脑运行,而今年的“阿尔法狗”使用了4个TPU,单台电脑即可运行。

其三,强化学习重要性进一步凸显,机器自我决策能力大大提高。人工智能强化学习概念,自创自心理学,即机器会在环境给予的奖励或惩罚的刺激下,逐步构成对刺激的预期,产生能获得最大利益的习惯性行为。强化学习的本质是实现“自动决策”。机器会在没有任何指导、标签的情况下,尝试行为,得到一个结果,再判断是对还是错,由此调整之前的行为,通过不断地调整,算法持续优化。搜狗CEO王小川认为,强化学习的算法更接近于人类的思维模式。

目前,深度学习和强化学习的算法已经得到了一定的应用。研发“阿尔法狗”的团队、谷歌旗下的DeepMind公司已与英国国家医疗服务体系(NHS)合作,与眼科医院共同开发一套用于早期识别视觉疾病的机器学习系统,通过对眼球扫描图像的分析阿尔法狗算法公开,发现糖尿病视网膜病变、老年性黄斑病变的早期症状。

国内云知声、科大讯飞公司运用深度学习算法,开发了语音识别系统,在北京市的部分三甲医院应用,语音录入病例,节省了医生的大量时间。第四范式公司利用深度学习算法,为银行开发了风控模型。还有诸多巨头都在开发人工智能的“对话机器人”,如微软的“小娜”、谷歌的“Allo”、苹果的Siri、百度的“度秘”等,均应用了深度学习和强化学习的算法。

迁移学习:

人工智能新高地

目前的深度学习和强化学习算法,虽然进步迅速、得到了一定的应用,但仍面临一定局限性。

客服