科技媒體 marktechpost 昨日(5 月 14 日)發(fā)布博文,報道稱谷歌 DeepMind 團隊推出革命性編碼工具 AlphaEvolve,基于 Gemini 2.0 大語言模型(LLMs),自動化算法發(fā)現過程,解決傳統算法設計和科學發(fā)現中依賴專家直覺和手動迭代的局限性。
AlphaEvolve 結合進化計算和自動化評估,自主生成、改進算法代碼。不同于普通代碼助手,AlphaEvolve 能通過結構化反饋循環(huán)不斷提出、評估和優(yōu)化候選方案,逐步逼近最優(yōu)解,其系統架構支持異步分布式運行,靈活應對從構造函數到整個優(yōu)化流程的各類問題。
AlphaEvolve 的核心在于其多組件協同工作:提示構建模塊基于歷史高分方案生成輸入;Gemini 2.0 Pro 和 Flash 混合模型兼顧質量與速度;評估框架通過自定義評分函數量化算法表現;進化循環(huán)則利用歷史程序數據庫平衡探索與利用。
在數學研究中,AlphaEvolve 在 50 多個公開數學問題上表現出色,約 75% 的案例中重現了已知解,20% 的案例中發(fā)現了更優(yōu)解。例如,在“親吻數問題”(kissing number problem)中,它為 11 維情況找到了一種新配置,包含 593 個球體,刷新了下限記錄。
IT之家注:接吻數問題(Kissing Number Problem)是一個幾何學中的經典問題,旨在研究在 n 維歐幾里得空間中,有多少個相同大小的球體可以同時接觸一個中心球體,而彼此之間不重疊。這個最大數量被稱為 n 維的“接吻數”。
此外,它還改進了 4x4 復雜矩陣乘法算法,僅用 48 次標量乘法完成計算,超越了 1969 年的經典 Strassen 方法,展現出在算法數學領域的創(chuàng)新能力。
在通用性方面,AlphaEvolve 的表現也非常值得關注。在 Erd s 最小重疊問題中,75% 的案例匹配最先進成果,20% 甚至超越現有方案。在硬件設計和編譯器優(yōu)化中,它為 TPU 電路和 FlashAttention 執(zhí)行分別帶來顯著性能提升。
AlphaEvolve 最適合可算法化表達并自動評估的問題,DeepMind 認為其在材料研究、藥物開發(fā)和工業(yè)流程優(yōu)化等領域具有廣闊前景。
該系統目前對需現實實驗驗證的問題效果有限,但 DeepMind 正在探索結合語言模型進行初步定性評估的混合方法。
相較于 2023 年推出的 FunSearch 系統,AlphaEvolve 不僅能解決數學問題,還能創(chuàng)建更廣泛實用的完整算法,標志著自動化算法發(fā)現的新里程碑。