首页 > 媒体生活 > 媒体生活 > AI首胜人类博士,顶会论文秒变代码!港大90后开源刷爆8k星

AI首胜人类博士,顶会论文秒变代码!港大90后开源刷爆8k星

发布时间:2025-11-01 20:51:04

香港大学黄超团队开源的DeepCode在「论文复现代码」方面,首次在PaperBench测试中超过来自剑桥、伯克利等8所顶尖高校的机器学习博士,并领先Claude Code、Cursor等先进的商用代码智能体。

在AI领域,学术论文往往承载了算法、模型架构等方面的最前沿突破。

但想要真正理解论文的核心知识,并成功复现其中的算法和实验结果,却经常面临巨大挑战。

问题的主要症结,在于「关键实现细节」上的缺失!

现实中论文作者通常将复杂的算法逻辑高度抽象化为几行数学公式,省略了真正影响成败的核心细节,比如:

超参数的具体取值范围、训练过程中的技巧性调整、数据预处理的细节步骤、网络初始化策略等。

然而正是关键实现要点上的缺失,导致了理论与实践之间的巨大鸿沟。

就连资深研究员也经常对此束手无策。

怎么破?

近日,香港大学黄超教授团队开源的DeepCode,为这一难题的解决提供了超强的AI利器。

它不仅能够分析论文内容,理解算法逻辑,还可以自动生成可运行的代码。

DeepCode演示

DeepCode视觉交互界面

在基准测试中,DeepCode在复现成功率和代码质量方面表现出众,在多项指标上超过了顶级大学的机器学习博士。

DeepCode自今年7月发布首个版本——DeepCode v1.0.0以来便备受关注,并登上 GitHub Trending榜首,斩获近8千星标(截至11月1日数据)。

媒体生活更多>>

三星Galaxy S26系列正式发布:影像全面升级,搭载防窥屏幕 Aliro 1.0智能门禁标准亮相:让iPhone 17等手机变“万能钥匙” 魅族官宣战略转型:暂停国内手机新产品自研硬件项目,专注Flyme软件生态赋能 Now is Your Run:华为Mate 80 Pro重返海外中国科技领全球赛场 移动办公旦用难回 OPPO Find N6支持AI手写笔 英伟达黄仁勋评太空数据中心:没有空气流动,需要相当大的散热器 美团、淘宝、京东齐发声!响应外卖新规,联合骑手整治虚假店铺 万人大厂宣布裁员 40%:利润在涨,人却多余了 谷歌版的“豆包手机”来了 瑞士工程科技公司Lightium研发量产级薄膜铌酸锂光子芯片代工服务,实现光子芯片规模化量产 英特尔发布24.20.0无线驱动:新增支持BE211/BE213网卡 3nm AI网络芯片来了!102.4Tbps带宽,专为Agent时代设计 最强天玑旗舰蓄势待发!联发科天玑9600 9月亮相 Intel新CEO重磅警告:内存比算力更紧缺!芯片战争真正瓶颈首次曝光 韩国砸1兆韩元入局!目标五年内做出10款国产AI芯片 联想YOGA Air 14 Aura AI元启版笔记本新增U5-228V,7999元 HKC推出“G27M5Pro”27英寸显示器,1699元 树莓派因内存涨价再度上调产品价格 最高加价60美元 OPPO Find N6手机通过阿联酋TDRA认证,海外有望近期上市 加了风扇和肩键就叫Ultra?红魔姜超称游戏手机天花板必须足够高 REDMI Turbo 5标准版销量大增 卢伟冰:很多用户非常认可中尺寸、精致设计 阿里千问放大招!30亿请全国人民“吃喝玩乐” “隐身”的腾讯云,不想当第一 机器人1小时可检测200米排水管道 消息称大疆“换壳”突围,Osmo Nano变身Xtra ATTO布局北美 REDMI Turbo 5 Max官宣兼容PPS协议: 支持百瓦快充与反向充电 华硕无畏Pro 16 2026上架:酷睿Ultra 300与锐龙AI9 H465对决 NVIDIA N1X Arm笔记本芯片方案曝光:20核CPU配RTX级独显 最快今年一季度登场 小米18标准版大提升!玄戒O2曝光 消息称苹果iPhone 18 Pro手机“左上角打孔”系误传