区块链学术前沿:1、IEEE 院士刘绍强等 3 人提出名为 Q-learning 的多维强化学习算法,通过人工智能找到最优挖矿策略,称比传统的自私挖矿以及诚实挖矿更有利可图;2、卡耐基梅隆大学等研究者提出名为 SquirRL 的深度强化学习算法,进行区块链激励攻击的自动化发现,但实验表明在多个攻击者存在的情...
知识:比特币,挖矿,AI,技术,观点,激励机制,SquirRL,Q
...理学习成功的策略,并从与环境的反复试验中获得最大的长期回报。目前,Q-learning是最流行的强化学习(RL)算法,它可以通过更新一个状态动作值函数来学习一个好的策略,而不需要环境的操作模型,强化学习(RL)算法已成功地应用于许多具有挑战性的任务中,例如玩电子游戏、围棋以及控制机器...
知识:比特币,AI,以太坊,自私挖矿