首页 > 媒体生活 > 媒体生活 > 与DeepSeek-OCR不谋而合,NeurIPS论文提出让LLM像人一样读长文本

与DeepSeek-OCR不谋而合,NeurIPS论文提出让LLM像人一样读长文本

发布时间:2025-11-10 15:53:05

NeurIPS 2025 论文中,来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST(Vision-centric Token Compression in LLM),为大语言模型的长文本高效推理提供了全新的 “视觉解决方案”。值得注意的是,这一思路与近期引起广泛关注的 DeepSeek-OCR 的核心理念不谋而合。

研究背景

在处理短文本时,大语言模型(LLM)已经表现出惊人的理解和生成能力。但现实世界中的许多任务 —— 如长文档理解、复杂问答、检索增强生成(RAG)等 —— 都需要模型处理成千上万甚至几十万长度的上下文。与此同时,模型参数规模也从数十亿一路飙升至万亿级别。在 “上下文长度激增” 与 “模型参数量膨胀” 的双重挑战下,Token 压缩不再是优化项,而是必需品。若不能有效缩减输入规模,即便最强大的大语言模型,也难以高效处理我们需要它分析的海量信息。

VIST 的出现,正是为了解决这一痛点。

让大模型学会像人一样读

该团队早在一年多以前就开始探索 ——如何让模型像人类一样,以视觉的方式更高效地理解长文本。(相关研究发表于 NeurIPS 2024:《Leveraging Visual Tokens for Extended Text Contexts in Multi-Modal Learning》)

人类阅读文章时,不会逐字读完每一个词。“的”“了”“和”这些功能性高频词,几乎是被大脑自动略过的。真正让我们停下来的,是那些承载意义的低频词—— 名词、动词、数字等。

VIST 的核心思想,就是让大模型也具备这种 “选择性阅读” 能力。它设计了一种模仿人类“快–慢阅读通路(Slow–Fast Reading Circuit)”的视觉化压缩机制,让大模型在理解长文本时,既能快速扫读,又能深入思考:

 

  1. ♂️快路径(Fast Path):将远处、相对次要的上下文渲染为图像,由一个冻结的轻量级视觉编码器快速提取显著性语义;
  2. 慢路径(Slow Path):将关键的近处文本直接输入 LLM,用于深层推理与语言生成。

 

这种 “视觉 + 语言” 的双通道协作,就像人类的眼睛与大脑 —— 一边扫视全局,一边聚焦要点,深度思考。VIST 让模型真正具备了 “像人一样速读” 的能力。

媒体生活更多>>

三星Galaxy S26系列正式发布:影像全面升级,搭载防窥屏幕 Aliro 1.0智能门禁标准亮相:让iPhone 17等手机变“万能钥匙” 魅族官宣战略转型:暂停国内手机新产品自研硬件项目,专注Flyme软件生态赋能 Now is Your Run:华为Mate 80 Pro重返海外中国科技领全球赛场 移动办公旦用难回 OPPO Find N6支持AI手写笔 英伟达黄仁勋评太空数据中心:没有空气流动,需要相当大的散热器 美团、淘宝、京东齐发声!响应外卖新规,联合骑手整治虚假店铺 万人大厂宣布裁员 40%:利润在涨,人却多余了 谷歌版的“豆包手机”来了 瑞士工程科技公司Lightium研发量产级薄膜铌酸锂光子芯片代工服务,实现光子芯片规模化量产 英特尔发布24.20.0无线驱动:新增支持BE211/BE213网卡 3nm AI网络芯片来了!102.4Tbps带宽,专为Agent时代设计 最强天玑旗舰蓄势待发!联发科天玑9600 9月亮相 Intel新CEO重磅警告:内存比算力更紧缺!芯片战争真正瓶颈首次曝光 韩国砸1兆韩元入局!目标五年内做出10款国产AI芯片 联想YOGA Air 14 Aura AI元启版笔记本新增U5-228V,7999元 HKC推出“G27M5Pro”27英寸显示器,1699元 树莓派因内存涨价再度上调产品价格 最高加价60美元 OPPO Find N6手机通过阿联酋TDRA认证,海外有望近期上市 加了风扇和肩键就叫Ultra?红魔姜超称游戏手机天花板必须足够高 REDMI Turbo 5标准版销量大增 卢伟冰:很多用户非常认可中尺寸、精致设计 阿里千问放大招!30亿请全国人民“吃喝玩乐” “隐身”的腾讯云,不想当第一 机器人1小时可检测200米排水管道 消息称大疆“换壳”突围,Osmo Nano变身Xtra ATTO布局北美 REDMI Turbo 5 Max官宣兼容PPS协议: 支持百瓦快充与反向充电 华硕无畏Pro 16 2026上架:酷睿Ultra 300与锐龙AI9 H465对决 NVIDIA N1X Arm笔记本芯片方案曝光:20核CPU配RTX级独显 最快今年一季度登场 小米18标准版大提升!玄戒O2曝光 消息称苹果iPhone 18 Pro手机“左上角打孔”系误传