香港大学黄超团队开源的DeepCode在「论文复现代码」方面,首次在PaperBench测试中超过来自剑桥、伯克利等8所顶尖高校的机器学习博士,并领先Claude Code、Cursor等先进的商用代码智能体。
在AI领域,学术论文往往承载了算法、模型架构等方面的最前沿突破。
但想要真正理解论文的核心知识,并成功复现其中的算法和实验结果,却经常面临巨大挑战。
问题的主要症结,在于「关键实现细节」上的缺失!
现实中论文作者通常将复杂的算法逻辑高度抽象化为几行数学公式,省略了真正影响成败的核心细节,比如:
超参数的具体取值范围、训练过程中的技巧性调整、数据预处理的细节步骤、网络初始化策略等。
然而正是关键实现要点上的缺失,导致了理论与实践之间的巨大鸿沟。
就连资深研究员也经常对此束手无策。
怎么破?
近日,香港大学黄超教授团队开源的DeepCode,为这一难题的解决提供了超强的AI利器。
它不仅能够分析论文内容,理解算法逻辑,还可以自动生成可运行的代码。
DeepCode演示
DeepCode视觉交互界面
在基准测试中,DeepCode在复现成功率和代码质量方面表现出众,在多项指标上超过了顶级大学的机器学习博士。
DeepCode自今年7月发布首个版本——DeepCode v1.0.0以来便备受关注,并登上 GitHub Trending榜首,斩获近8千星标(截至11月1日数据)。