首页 > 媒体生活 > 媒体生活 > AI首胜人类博士,顶会论文秒变代码!港大90后开源刷爆8k星

AI首胜人类博士,顶会论文秒变代码!港大90后开源刷爆8k星

发布时间:2025-11-01 20:51:04

香港大学黄超团队开源的DeepCode在「论文复现代码」方面,首次在PaperBench测试中超过来自剑桥、伯克利等8所顶尖高校的机器学习博士,并领先Claude Code、Cursor等先进的商用代码智能体。

在AI领域,学术论文往往承载了算法、模型架构等方面的最前沿突破。

但想要真正理解论文的核心知识,并成功复现其中的算法和实验结果,却经常面临巨大挑战。

问题的主要症结,在于「关键实现细节」上的缺失!

现实中论文作者通常将复杂的算法逻辑高度抽象化为几行数学公式,省略了真正影响成败的核心细节,比如:

超参数的具体取值范围、训练过程中的技巧性调整、数据预处理的细节步骤、网络初始化策略等。

然而正是关键实现要点上的缺失,导致了理论与实践之间的巨大鸿沟。

就连资深研究员也经常对此束手无策。

怎么破?

近日,香港大学黄超教授团队开源的DeepCode,为这一难题的解决提供了超强的AI利器。

它不仅能够分析论文内容,理解算法逻辑,还可以自动生成可运行的代码。

DeepCode演示

DeepCode视觉交互界面

在基准测试中,DeepCode在复现成功率和代码质量方面表现出众,在多项指标上超过了顶级大学的机器学习博士。

DeepCode自今年7月发布首个版本——DeepCode v1.0.0以来便备受关注,并登上 GitHub Trending榜首,斩获近8千星标(截至11月1日数据)。

媒体生活更多>>

烟台72岁保洁爷爷的数学梦,他因数学手稿火爆全网,环境简陋却从未放弃追梦,没有书桌,那就以腿为“桌 ”! 定了!11月18日上市! 岚图泰山破局50万级豪华SUV市场 华为Mate70 Air已预售:首次可选CPU,4199起! 突发,iOS 18.7.2 正式更新,真正的养老版本来了 中兴通讯携AI全光智会屏亮相,彰显全光网络与AI融合创新成果 巨亏百亿元!国际巨头宣布:出售总部大楼 刘强东参加峰会;东哥眉头紧皱,一脸不耐烦,章泽天全程陪同 216岁全球最年长夫妻:80年婚姻藏着最朴素的幸福密码 上海“大师凉白开”风波:28元的鸡尾酒,是创意还是“坑”? 新车 | 24.98万起 全新坦克400领衔开启潮酷越野新时代 快讯!陈芋汐/掌敏洁获得全运会跳水女子双人10米台冠军 苹果公众号喊话:1314钉子户,不如现在就换17 Pro,让旧款\"过时\" 立冬时节,真的一天比一天冷吗? 天问一号捕获“星际访客”!4亿公里解锁宇宙原始密码 金价暴涨的背后 为什么三四线金店有这样的困局 何小鹏回应 IRON 机器人里“藏真人”质疑 17项!2025年世界互联网大会领先科技奖出炉 今日立冬,无论多忙,牢记最该做的4件事情,立冬安康,福寿绵长 5.99mm还支持插卡!联想moto X70 Air发布:2399元起 W43周:苹果三连冠,荣耀进前五,OPPO第四 同档唯一165Hz超高刷直屏!一加Ace 6图赏 双11品牌官方旗舰店销量涨300%,美团闪购:大促首日近800个品牌、300类商品销量翻倍 AI首胜人类博士,顶会论文秒变代码!港大90后开源刷爆8k星 全新奥迪Q3来了,配2.0T,内外大变样,这才是“颜值巅峰”! 外观内饰配色均有新增 2026款起亚奕跑正式上市 起亚奕跑焕新了,这台6万出头的小型SUV,挺懂年轻人 开源中国董事长马越:Gitee已成为中国最大、全球第二的开源代码托管平台 超满配旗舰,一加Ace 6综合体验优秀 消息称三星 HBM3E 已量产供货英伟达,HBM4 产能被预订一空 联想moto X70 Air首发评测:极致轻薄,拍照与续航均超预期