北京时间10月19日早间音讯,谷歌旗下人工智能研讨部分DeepMind发布了新版AlphaGo软件,它能够彻底靠自己学习围棋。
这款名为AlphaGo Zero的体系能够通过自我对弈进行学习,它运用了一种名为强化学习的技能。在不断练习的过程中,这套体系开端靠自己的才能学会围棋中的一些高档概念。
通过3天的练习后,这套体系现已能够打败AlphaGo Lee,也便是上一年打败韩国顶尖棋手李世石的那套体系,并且比分高达100比0。通过40天练习后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以打败AlphaGo Master(本年早些时候打败世界冠军柯洁的体系),比分为89比11。
结果表明,详细到不同技能的作用,人工智能在这一范畴仍有许多学习的空间。AlphaGo Master运用了许多与AlphaGo Zero相同的开发技能,但它需求首要运用人类的数据进行练习,随后才切换成自我对弈。
值得注意的是,尽管AlphaGo Zero在几周的练习期间学会了一些要害概念,但该体系学习的办法与人类有所不同。别的,AlphaGo Zero也比前几代体系愈加节能,AlphaGo Lee需求运用几台机器和48个谷歌TPU机器学习加快芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需求运用一台配有4个TPU的机器即可。
深圳赛亿科技,,大型电子规划解决计划提供商。自成立以来,共服务过3000多家电子产品制作企业,十年电子产品软硬云计划开发规划经历,累计开发电子产品应用规划计划5000多个。回来搜狐,检查更多
相关新闻