对话 Gensyn 联合创始人 Ben Fielding:a16z 领投的去中心化计算协议,如何实现 AI
时间:2024-06-17 来源:区块链网络 作者:techflow深潮
Gensyn 代表一种双重性质的解决方案:它既是软件连接的开源协议,也是资源补偿的财务机制。 采访:Sunny and Min,深潮 TechFlow 嘉宾:Ben Fielding,Gensyn Co-Founder 我们的目标不是垄断整个机器学习生态系统,而是将Gensyn建立为优化计算资源利用的协议,仅位于电力之上,来显著提升人类有效利用计算资源的能力。 -- Ben Fielding,Gensyn CoFounder 2024年1月,OpenAI CEO Sam表示,未来两种重要“货币”将是算力和能源。 然而,作为AI时代的权力货币,算力往往被大公司所垄断,特别是在AGI大模型领域,既然有垄断,也就有反垄断的力量,去中心化人工智能(Decentralized AI)应运而生。 “区块链这一无需许可的组件可以为算力的买卖双方创建一个市场(或任何其他类型的数字资源,如数据或算法),在全球范围内无需中间商进行交易”,知名投资机构a16z曾在一篇文章如此阐述AI算力的区块链之道,其描述项目即为Gensyn。 Gensyn 是去中心化的深度学习计算协议,旨在成为机器学习计算的基础层,可通过智能合约方式可促进机器学习的任务分配和奖励,来快速实现AI模型的学习能力,并降低深度学习训练的价格。 Gensyn可将开发人员(任何能够训练机器学习模型的人)与解题者(Solver,任何想用自己机器训练机器学习模型的人)联系起来。通过利用世界各地闲置的、具有机器学习能力的长尾计算设备(例如小型数据中心、个人游戏电脑),将机器学习的可用计算能力提高10-100倍。 总结起来,Gensyn核心目标是通过区块链计划实现AI民主化。 2023年6月, Gensyn 宣布完成4,300万美元 A 轮融资,由 a16z 领投,CoinFund、Canonical Crypto、Protocol Labs、Eden Block 等参投。 Gensyn 由计算机科学和机器学习研究资深人士Ben Fielding和Harry Grieve于2020年创立。Harry Grieve曾就读于布朗大学和阿伯丁大学,是一位数据科学家和企业家;Ben Fielding毕业于诺桑比亚大学,曾担任SaaS平台Fair Custodian的联合创始人及Research Analytics董事。 深潮 TechFlow 采访了Gensyn联合创始人Ben Fielding,了解其加密AI之旅,以及Gensyn的AI武器。 从创始人视角看 Gensyn 的价值主张 TechFlow:是什么激发了您创立 Gensyn ? Ben: 我最初的背景是在学术界,曾经作为一名机器学习研究员,专注于神经架构搜索 (Neural Architecture Search) 领域。这个领域涉及优化深度神经网络的结构,尤其是用于计算机视觉应用。 我的工作是开发算法,以群体方式演化神经网络结构。这个过程包括同时训练众多候选模型架构,并逐步将它们演变为针对特定任务优化的单一元模型。 在此期间,我遇到了与计算资源相关的重大挑战。作为一名博士生,我可以使用几台高性能 GPU,它们就放在我桌子下的大型工作站中,这些工作站是我设法购买的。 同时,像 Google 这样的公司也在进行类似的研究,但他们在数据中心使用成千上万的 GPU 和 TPU,持续运行数周。这种差异让我意识到,尽管拥有除了充足的计算能力外的所有必要资源,世界各地的其他人也面临同样的限制,这阻碍了研究和社会进步的速度。我对这种情况感到不满,这最终是我们创建了 Gensyn。 在全心投入 Gensyn 之前,我花了两年时间共同创立了一家数据隐私初创公司。这家企业专注于管理消费者数据流和基于同意的用户数据访问,旨在改善个人与企业在数据方面的互动方式。 这段经历教会了我宝贵的教训,包括常见的创业陷阱,并加强了我对个人数据流和基于同意访问的谨慎态度。 四年前,我关闭了我的创业项目,并加入了伦敦的一个加速器 Entrepreneur First,在那里我遇到了我的合伙人 Harry Grieve 。就在那里,我们启动了 Gensyn,目的是解决全球计算资源的挑战。我们最初的策略涉及跨单个组织的私有数据孤岛分配计算任务 (联邦学习),这非常有趣。我们很快意识到扩展这种方法至全球的更广泛潜力。为了应对这一扩展的愿景,我们必须解决与计算源本身相关的基本信任问题。 Gensyn 自那时起致力于通过证明、博弈论激励机制和概率检查的结合,确保在设备上处理的机器学习任务的准确性。虽然具体内容可能相当技术化,但 Gensyn 致力于开发一个系统,使全球任何人都可以使用任何计算设备来训练机器学习模型。 TechFlow:Sam Altman 需要 7 万亿美元来经营 AI 芯片工厂,以应对全球芯片短缺问题。他的计划在规模化芯片供应方面是否现实?与此同时,Gensyn 正在解决哪些与 Altman 的解决方案不同的AI问题? Ben: 关于 AI 领域及其面临的挑战,Gensyn 正在解决与 Altman 面临的问题类似的问题。本质上,解决计算访问问题有两种方式。机器学习正在变得越来越普遍,可能会集成到我们使用的每一项技术中,从命令式代码过渡到概率模型。这些模型需要大量的计算能力。当你比较计算需求与世界芯片制造能力时,你会注意到显著的差距;需求正在飞速上升,而芯片生产仅逐渐增长。 解决方案在于(1)制造更多芯片以满足需求或(2)提高现有芯片使用效率。 最终,这两种策略都是解决不断增长的计算资源需求的必要手段。 我认为 Altman 有效地正面应对了这一问题。问题在于芯片供应链,这是一个非常复杂的系统。这个供应链的某些部分尤其具有挑战性,只有少数公司有能力管理这些复杂性。目前,许多政府开始将其视为地缘政治问题,投资于国内重新定位半导体制造厂和解决供应链中的一些瓶颈问题。 在我看来,Altman 所提出的,是以 7 万亿美元的数字测试市场,以衡量全球金融市场对这一问题的关注程度。这个惊人的数字没有被直接拒绝,这非常引人注目。它促使人们重新思考:“这听起来荒谬,但是真的吗?” 这种反应表明确实存在重大关切,并且人们愿意拨出大量资金来解决这一问题。通过设定如此高的基准,Altman 实际上为任何未来的芯片生产努力创建了一个参考点。这一战略举措表明,即使实际成本没有达到 7 万亿美元,也为该领域的大规模投资设定了先例,表明了解决芯片制造挑战的坚定承诺。 Gensyn 的方法有所不同;我们旨在优化全球现有芯片的使用。许多这些芯片,从游戏 GPU 到配备 M1、M2、M3 芯片的 Macbook,都没有得到充分利用。 这些设备完全有能力支持 AI 处理,无需开发新的专用 AI 处理器。然而,利用这些现有资源需要一个协议,将它们整合成一个统一的网络,类似于 TCP/IP 促进互联网通信的方式。 这种协议将使这些设备能够按需用于计算任务。 我们协议与传统开源协议如 TCP/IP 之间的主要区别在于财务方面。虽然后者纯粹是技术解决方案,但使用硬件资源本身涉及固有成本,如电费和硬件本身的物理成本。 为了解决这一问题,我们的协议融入了加密货币和去中心化原则,以建立价值协调网络来激励硬件所有者的贡献。 因此,Gensyn 代表一种双重性质的解决方案:它既是软件连接的开源协议,也是资源补偿的财务机制。 此外,机器学习市场面临的挑战不仅仅是计算资源。 数据访问、知识共享等其他因素也起着关键作用。通过去中心化技术,我们可以促进这些不同组件的价值归属,推动更加集成和高效的生态系统。因此,Gensyn 并不是孤立地运作;我们解决了更广泛挑战的一部分,但其他解决方案也需要解决剩余的问题。这种协作努力对于推动机器学习领域的发展至关重要。 定义 Gensyn 的双重性( Dual-natured)解决方案 TechFlow:您能用最简单的术语解释一下 Gensyn的双重解决方案吗? Ben: 简单地说,Gensyn 是一个基于开源软件之上的点对点网络,让你的设备参与其中只需运行这款软件,而且你的设备必须能够执行机器学习训练任务。这个网络由多个节点组成,每个节点都像你的设备一样运行该软件,它们之间直接通信,共享有关可用硬件和待执行任务的信息。这样做的好处是不需要中心服务器,你的设备可以直接与其他设备交互,从而避免了中心服务器的需求。 Gensyn 的一个重要特点是它的通信过程没有中央权威,例如,如果你正在使用 MacBook,它会直接与其他 MacBook 连接和通信,交换有关硬件能力和可用任务的信息。 Gensyn 面临的主要挑战之一是验证链下的非确定性 (non-deterministic) 计算,这些计算对于区块链来说太大。 我们的解决方案是引入一个验证机制,允许设备生成可验证的计算证明。这个证明可以由其他设备检查,确保工作的完整性,同时又不会透露将要验证任务的哪些部分,从而防止设备仅完成可能被检查的任务部分。 我们的系统鼓励设备作为解决方案提供者和验证者参与加密证明过程或选择性工作重运行,以确定已完成任务的有效性。本质上,Gensyn 旨在实现节点之间的互操作,相互验证工作,并就完成的任务达成共识。任务的支付在这个框架内执行,利用区块链的信任机制。这个技术生态系统模仿了以太坊的功能,专注于节点间的相互验证,以确保任务的完整性。 我们的主要目标是通过最小的计算努力实现任务完成的共识,确保系统的完整性,同时容纳大规模机器学习任务。 综上所述,Gensyn 可以分为两个主要部分。 第一部分是区块链方面,包括我之前提到的状态机。这是参与者之间共享计算发生的地方。 Gensyn 的另一半涉及通信基础设施,侧重于节点如何相互作用以及处理机器学习任务。 这种设置允许任何节点执行任何计算,前提是它可以稍后在区块链侧验证工作。 我们正在搭建一个覆盖所有节点的通信基础设施,以促进信息共享、必要时的模型分割以及广泛的数据处理。这种设置支持各种模型训练方法,如数据并行、模型并行和管道分区,而不需要立即的信任协调。 双重性解决方案 = 状态机+ 机器学习任务通信 Gensyn状态机 TechFlow:Gensyn 链如何在特定的机器学习点对点网络中发挥作用? Ben: 最初,我们假设所有参与者都在按照他们的角色履行任务并生成相应的证明。然后,我们将注意力转移到区块链方面,在那里我们维护一个类似于其他区块链的共享状态,包括哈希化交易和操作,还有哈希化前一个区块,这样形成了一个完整的链条。 参与者之间的共识是,如果一个区块中的计算匹配并产生相同的哈希值,则认为工作正确完成,允许我们进入下一个链环。 Gensyn 使用 POS 运作机制,奖励那些验证区块生成的贡献。 创建一个区块涉及对 (1) 机器学习验证工作所需的操作进行哈希化,和 (2) 记录该区块内发生的交易。 虽然我们的方法与以太坊等系统相似,但我们的独特贡献主要在于通信方面,特别是节点如何管理和协作处理机器学习任务。 TechFlow:Gensyn 链与以太坊有何不同?如果核心基础设施并非新颖,POS 链是如何设计来满足机器学习的特定用例的? Ben: 我们的区块链核心结构并不新颖,除了一个新颖的数据可用性层。显著的不同在于我们处理更大计算任务的能力,这使得我们的操作比以太坊上通常可能的更加高效。 这对于卷积运算(convolution operations) 特别相关,这是许多机器学习模型的基本组成部分。 在以太坊虚拟机(EVM)中使用 Solidity 高效执行这些运算是具有挑战性的。 Gensyn 链提供了更多的灵活性,允许我们更有效地处理这些计算,而不受 EVM 操作范围的限制。 真正的挑战在于实现模型的泛化性(Generalizability):这意味着模型能够在遇到全新的样本时准确预测其位置,即使此前未曾见过,因为它具备足够广泛的空间理解。 这种训练过程需要大量的计算资源,因为它需要反复通过模型传递数据。 Gensyn 的机器学习运行时的任务是获取模型的图形表示,并将其置于一个框架中,以便在执行计算时生成每个操作的完成证明。 这里存在一个重要问题,即确定性和可重现性。 理想情况下,在数学世界中,重复一个操作应该产生相同的结果。然而,在计算硬件的物理世界中,不可预测的变量可能导致计算结果出现轻微变化。 到目前为止,在机器学习中的一定程度的随机性是可以接受的,甚至是有益的,因为它有助于防止模型过度拟合,并促进更好的泛化。 然而,对于Gensyn而言,泛化性和可重现性都至关重要。 计算结果的变化可能导致完全不同的哈希值,这可能导致我们的验证系统错误地标记工作为未完成,从而面临财务损失的风险。为了应对这一点,我们的运行时确保操作在各个设备上都是确定性和可重现的,这是一种复杂但必要的解决方案。 这种方法在某种程度上类似于使用诸如PyTorch、TensorFlow或JAX等机器学习框架。用户可以在这些框架内定义模型并启动训练。我们正在适应这些框架和底层库,例如计算统一设备架构(CUDA),以确保模型执行时能够在任何设备上以可重复的准确方式进行。 这确保了一台设备上操作结果的哈希处理在另一台设备上产生相同的哈希,突显了我们系统中机器学习执行这一方面的重要性。 Gensyn通过开源区块链通信协议实现了云服务的去中心化,以支持去心化机器学习 TechFlow:那么在Gensyn链之上,这套特定于机器学习网络的区块链通信设施又是如何的? Ben: 通信基础设施的目的是促进设备间的相互通信。其主要功能是允许一台设备验证另一台设备生成的工作和证明。 在本质上,设备之间的通信用于互相验证工作,这一过程需通过区块链进行,因为区块链在任何争议中都扮演着中心仲裁者的角色。区块链是我们系统中唯一的可信来源,缺少它就无法可靠地验证参与方的身份,任何人都可能声称他们已经验证了工作。 区块链及其加密技术使身份验证和工作确认变得安全。设备可以在这一机制下证明自己的身份并安全提交信息,使得其他方可以识别并验证这些信息的真实性。 这一系统的最终目的是向设备所有者提供补偿。如果你拥有可执行机器学习任务的硬件,你可以将其出租。 然而,在传统系统中,这一过程复杂且成本高昂。例如,购买大量Nvidia GPU并出租它们——将资本支出转化为运营支出,类似于云服务提供商——涉及众多挑战。你需要找到对你硬件感兴趣的AI公司,建立销售渠道,发展模型传输和访问的基础设施,并管理包括服务级别协议(SLA)在内的法律和运营协议。SLA要求现场工程师确保与客户约定的正常运行时间,任何停机都会导致基于合同的责任和潜在的财务风险。这种复杂性对个人或小企业是一个重大障碍,这也是集中式云服务成为主流的原因之一。 Gensyn提供了一种更为有效的方法,消除了这些交易通常涉及的人力和商业成本。你只需运行一些软件,而不依赖法律合同和工程师建设基础设施。法律协议被智能合约取代,工作验证通过自动化系统进行,检查任务是否正确完成。不再需要手动处理违约索赔或寻求法律解决,所有这些都可以通过技术立即解决,这是一个显著的优势。这意味着供应商只需运行一些软件,就可以立即从他们的GPU获取收益,无需承担任何额外麻烦。 关于 Go to Market 我们鼓励供应商加入Gensyn网络的方式是,告诉他们他们可以通过运行开源软件,立即进入机器学习计算的需求市场。这是一个前所未有的机会,显著扩大了市场,允许新入者挑战像AWS这样的传统服务的统治地位。AWS和其他公司需要管理复杂的操作,而我们正在将这些操作转换为代码,创造新的价值流动途径。 传统上,如果你有一个需要训练的机器学习模型并愿意为计算付费,你的钱将流向垄断供应的主要云提供商。他们因能够有效管理而占据市场。尽管Google Cloud、Azure和其他公司的竞争日益激烈,这些供应商的利润率仍然很高。 关于去中心化云服务的目的:去中心化训练 Vs. 去中心化推理 TechFlow:机器学习大致分为训练(training)和推理(inference)两部分。Gensyn 的 P2P 计算资源在在哪个部分发挥作用? Ben: 我们的重点是训练,这涉及到价值的提炼。 训练包括从最初的学习到微调,而推理只涉及用数据查询模型而不改变它,基本上是根据输入看模型预测什么。 训练需要大量计算资源,通常是异步的,不需要即时结果。 相比之下,推理需要快速执行,以确保实时应用中用户的满意度,这与训练时计算密集型的特性形成了明显对比。 去中心化技术目前还不足以解决对推理至关重要的延迟问题。未来,为了有效地进行推理,模型需要尽可能靠近用户部署,通过利用地理接近性来最小化延迟。 然而,启动这样的网络颇具挑战,因为其价值和效能会随网络规模的扩大而增长,这符合梅特卡夫法则,类似于我们在Helium网络等项目中看到的发展动态。 因此,Gensyn 直接应对推理挑战是不现实的;这个任务更适合由专注于优化延迟和网络覆盖的独立实体来承担。 我们支持专注于单一功能优化的协议,而非尝试在多个领域同时发展,以避免效能的稀释。这种专业化推动了竞争和创新,并导致了一系列各自精通生态系统特定方面的互操作协议。 理想情况下,除了运行Gensyn节点进行计算任务外,用户还能操作其他功能节点,如推理、数据管理和数据标记。这些网络的互联将有助于构建一个强大的生态系统,其中机器学习任务可以在各种平台间无缝转移。这种去中心化的未来愿景预示着一个新的网络层次,每个层次都通过集体的贡献增强机器学习的能力。 去中心化人工智能生态:如何与去中心化数据协议达成共赢? TechFlow:考虑到计算和数据是机器学习的重要输入,Gensyn 的计算协议如何与数据协议协作? Ben: 计算只是一个方面;数据是另一个重要领域,同样可以应用价值流动模型,尽管验证和激励机制不同。 我们设想一个丰富的生态系统,包括在像你的 MacBook 这样的设备上运行的多个节点。你的设备上可能有一个 Gensyn 计算节点、一个数据节点,甚至是一个数据标记节点,通过游戏化激励或直接支付贡献于数据标记,通常不直接意识到这些模型背后的过程。 这个生态系统为我们雄心勃勃地称之为机器智能革命铺平了道路,标志着互联网的新阶段或进化。当前的互联网作为一个巨大的人类知识文本形式的仓库。 计算是重要的一环,数据则是另一关键领域,同样可以应用价值流动模型,虽然验证和激励机制有所不同。 我们设想一个充满活力的生态系统,包括在像MacBook这样的设备上运行的多个节点。你的设备上可能不仅运行一个Gensyn计算节点,还可能包括数据节点和数据标记节点。通过游戏化激励或直接支付,这些节点将为数据标记做出贡献,用户通常不会意识到这些背后的复杂过程。 这个生态系统为我们所称的机器智能革命铺平了道路,标志着互联网进入一个新的发展阶段。目前的互联网是一个庞大的人类知识的文本库。 我们展望的未来互联网,是通过机器学习模型而不是文本来呈现互联网。这意味着在全球范围内,从MacBook到iPhone再到云服务器,机器学习模型的片段将分布在这些设备上,使我们能够通过这一分布式网络进行查询和推理。与由少数云提供商控制的集中式模型相比,这种模型承诺了一个更开放的生态系统,得益于区块链技术。 区块链不仅促进资源共享,还确保了任务的即时验证,验证远程设备的任务执行正确无误且未被篡改。 Gensyn致力于在此框架内开发计算基础,并鼓励其他人探索数据网络的激励方案。理想情况下,Gensyn将与这些网络无缝集成,提高机器学习训练和应用的效率。我们的目标不是垄断整个机器学习生态系统,而是将Gensyn建立为优化计算资源利用的协议,位于电力之上,显著提升人类有效利用计算资源的能力。 Gensyn特别解决了将价值和数据转化为模型参数的挑战。本质上,如果你有一个数据样本——无论是图像、书籍、文本、音频还是视频——并且你希望将这些数据转化为模型参数,Gensyn促进了这一过程。这使得模型能够对未来类似数据做出预测或推断,随着参数的更新而进化。将数据提炼为模型参数的整个过程正是Gensyn的专长,而机器学习栈的其他方面则由其他系统管理。 额外话题:AI与加密货币初创公司是否受地理限制? TechFlow:考虑到你丰富的经验,你能比较一下早期作为技术领域的建设者和研究者在处理计算和技术的挫折和挑战时,与你当前的经历有何不同吗?你能分享一下这种转变和伦敦技术文化对你的发展和成就的影响吗? Ben: 伦敦乃至整个英国的科技环境与硅谷有着显著的不同。尽管英国的技术社区充满了杰出人才和开创性的工作,但它往往更加内向。这为新来者试图融入这些圈子设置了障碍。 我认为,这种差异源于英国和美国之间态度的对比。美国人通常表现出更开放的风貌,而英国人通常更加怀疑和保守。这种文化细微差别意味着融入和适应英国的技术生态系统需要努力和时间。然而,一旦你做到了,你会发现一个充满活力且丰富的社区,从事着引人入胜的项目。区别在于可见度和外联;与硅谷不同,那里的成就被大声庆祝,伦敦的创新者倾向于更加低调地工作。 最近,英国特别是在向去中心化和人工智能转变的过程中,似乎正在为自己开辟一个利基。这部分是因为美国和欧洲的监管发展。例如,最近美国的法规,如拜登总统的行政命令概述的那样,对人工智能开发施加了一些限制,包括对超过特定阈值的项目强制政府报告。这些法规可能会抑制新开发者的热情。相比之下,英国似乎采取了更开放的态度,倾向于开源而不是严格的监管,从而培养了一个更有利于创新的环境。 旧金山以其强大的开源运动而闻名,面临着加州立法与联邦行政命令相呼应的新挑战。这些法规,尽管出发点是保护社会,但无意中将人工智能开发集中在已建立的实体中。这些实体有能力遵守监管要求,而潜在具有革命性想法的小型参与者则处于不利地位。英国认识到开源作为对人工智能开发进行社会监督的一种手段的价值,避免了对限制性政府监控的需求。开源实践自然促进了审查和协作,确保人工智能技术在不扼杀创新的情况下保持受到检查。 欧盟对人工智能的初步监管比我们在英国看到的要严格,英国设法找到了鼓励开源开发的平衡点。这一策略不仅旨在实现相同的监管目标,还确保市场保持活力和竞争力。英国的定位对于培育一个充满活力和开放的人工智能和加密创新生态系统特别有利。这对伦敦的科技行业来说是一个激动人心的时刻。 更多相关阅读: https://docs.gensyn.ai/litepaper https://epicenter.tv/episodes/471 https://www.techflowpost.com/article/detail_14995.html https://hyperobjects.substack.com/p/understanding-maximum-computing-supply |