DeepMind放出新AI大招：竟能自我纠错但有致命弱点…

更新时间：2025-08-11

点击次数：

　　5月15日消息，谷歌旗下人工智能研发实验室DeepMind宣布研发出新型AI系统AlphaEvolve，专门攻克具有机器可评分解决方案的难题。

　　DeepMind表示，在实验中AlphaEvolve已成功优化谷歌用于AI模型训练的部分基础设施。开云体育（Kaiyun体育）公司正在开发该系统的用户交互界面，计划先向特定学者开放早期测试，后续考虑全面推广。

　　大多数AI模型都存在幻觉问题——因其概率架构特性，有时会自信地编造答案。值得注意的是，OpenAI的GPT-3等新一代模型的幻觉发生率较前代更高，凸显出这一问题的复杂性。

　　AlphaEvolve通过引入自动评估系统这一创新机制减少幻觉发生。系统调用模型生成多种可能答案，经批判性筛选形成候选池，再自动评估答案准确性并打分。

　　AlphaEvolve并非首个采用该方法的系统。数年前，包括DeepMind团队在内的研究人员就已在多个数学领域运用过类似技术。但DeepMind强调，开云体育（Kaiyun体育）由于AlphaEvolve采用了尖端的Gemini模型，其性能显著超越早期AI系统。

　　使用AlphaEvolve时，用户须向系统输入问题，可选附上说明、公式、代码片段及相关文献，同时，用户还必须提供以公式形式实现的自动评估机制。

DeepMind放出新AI大招：竟能自我纠错但有致命弱点…(图1)

　　由于AlphaEvolve只能解决可自我评估的问题，该系统目前仅适用于计算机科学和系统优化等特定类型的问题；此外，AlphaEvolve最终输出的解决方案只能以算法形式呈现，因此难以处理非数值问题。

　　为进行基准测试，DeepMind让该系统尝试了约50道涵盖几何、组合数学等领域的数学题目。据称，AlphaEvolve能在75%的题目中“重新发现”最优解，并在20%的案例中提出改进方案。

　　DeepMind还将AlphaEvolve应用于实际问题评估，例如提升谷歌数据中心效率和加速模型训练。据实验室称，AlphaEvolve生成的算法持续回收了谷歌全球0.7%的计算资源，其优化方案使Gemini模型的整体训练时间缩短了1%。

　　需要明确的是，AlphaEvolve尚未取得突破性发现。例如在某实验中，该系统针对谷歌TPU AI加速芯片设计提出的改进方案，实际是其他工具早前已标记过的。

　　不过，DeepMind与其他AI实验室的立场一致：AlphaEvolve系统能节省专家大量时间，使专家专注于更具战略意义的工作。（辰辰）

扫一扫，添加微信

联系电话：

18514600994

河北省邢台市威县高新技术产业开发区

125696552@qq.com

KAIYUN体育科技有限公司 - 藤球运动技术领航者