DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

2025-03-02 10:16 · 稿源：机器之心公众号

原来，大型推理模型（Large Reasoning Model，LRM）像人一样，在「用脑过度」也会崩溃，进而行动能力下降。近日，加州大学伯克利分校、UIUC、ETH Zurich、CMU 等机构的研究者观察到了这一现象，他们分析了 LRM 在执行智能体任务过程中存在的推理 - 行动困境，并着重强调了过度思考

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R1

阿里Qwen团队正式发布他们最新的研究成果QwQ-32B大语言模型。这是一款拥有320亿参数的模型，其性能可与具备6710亿参数的DeepSeek-R1媲美。QwQ-32B已在HuggingFace和ModelScope开源，大家也可通过QwenChat直接进行体验！

阿里Qwen QwQ-32B 大语言模型

25天前
荐DeepSeek V3“小版本更新”背后，V3和R1正在融合成一个模型

在R2和V4到来之前，DeepSeek先让我们看到了“V3Plus”。3月24日，DeepSeek一声不响的在Huggingface上发布了V3的“小版本”迭代“DeepSeek-V3-0324”。DeepSeek这开源的仗还会继续打下去，好戏还在后面。

DeepSeek

4天前
老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

日前美团技术团队宣布对DeepSeekR1进行了INT8精度量化，让DeepSeekR1可以在如A100等老型号GPU上进行部署。DeepSeekR1发布以后不少企业和个人都在尝试部署满血版本，但原生版本的模型权重为FP8数据格式，对GPU芯片类型有严格限制，仅能被英伟达新型GPU支持，其他型号GPU无法直接部署。目前量化代码已经发布在了开源LLM推理框架SGLang上，量化模型已经发布到了HuggingFace社区：https://huggingface.co/meituan/DeepSeek-R1-Block-INT8https://huggingface.co/meituan/DeepSeek-R1-Channel-INT8对具体过程感兴趣的，可以查看官方技术报告。

DeepSeek R1 INT8量化

23天前
荐寻找DeepSeek梁文锋

AI大模型DeepSeek凭借好用、开源、免费三大特点火爆全球，成为史上最快突破3000万日活跃用户的APP，如今当下各行各业都在被DeepSeek化。就是这样一家公司，在爆火之前，外界知之甚少，它极少出现在媒体报道、猎头招聘、同行调研之中，也从未像“AI六小龙”那样激起过市场的水花。但无论如何，DeepSeek打破巨头了在AI领域的叙事，现在投资人们迫切希望在下一个DeepSeek出现之�

DeepSeek AI大模型开源软件

28天前
32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

【新智元导读】HuggingFace的OpenR1重磅升级，7B击败Claude3.7Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试，以及模拟真实竞赛的提交策略优化，这款模型展现了惊艳的性能。结合来自数学和代码等多领域的奖励信号，并引入奖励模型来评分非推理数据。

DeepSeek-R1

18天前
荐我用扣子Coze搭建了一个超频版DeepSeek-R1

DeepSeek-R1发布已经一月有余，接入这个爆火的模型，也成了各大AI应用共飨盛宴的财富密码。直接复制一个不宕机的DeepSeek-R1，明摆着只是想吃这一波流量，并没有创造新的价值出来。嗯，基本上就是在这一个界面里，我整出了这么一个超频版DeepSeek-R1，没有意外的话，我会一直把这个智能体当做自己的长期助手来用，同时也把它发布到扣子的商店里了，搜索超频版DeepSeek-R1就能�

Coze

26天前
DeepSeek官方辟谣：R2发布为假消息

有传闻指出DeepSeek将于3月17日发布下一代R2模型。DeepSeek官方企业咨询账号在用户群中予以回应，明确表示辟谣：R2发布为假消息”。与DeepSeek相关的一切信息均以官方账号发布为准，任何非官方账号、个人账号发布的信息都不代表DeepSeek的观点，提醒大家注意甄别。

DeepSeek R2模型人工智能

19天前
DeepSeek-R1联网搜索能力首测：腾讯元宝第一

国产大模型DeepSeek-R1爆火后，许多第三方平台陆续接入了该模型，比如腾讯、阶跃星辰、蚂蚁集团、百度、字节跳动等等。中文大模型测评基准SuperCLUE发布DeepSeek-R1联网搜索能力首测，公布了10家第三方平台测评结果。所有平台在分析推理能力上平均耗时都明显高于基础检索能力。

国产大模型 DeepSeek-R1 联网搜索能力

19天前
荐字节和DeepSeek争抢“天才少年”

当年轻人还在想着怎么靠AI赚钱时，AI已经开始帮助老板提升身家了。近期胡润研究院发布的《2025胡润全球富豪榜》显示，字节跳动创始人张一鸣取代“瓶装水大王”钟睒睒，成为中国新首富。对当下的字节和张一鸣言，如果靠砸钱就能解决大模型的技术突破难题，那无疑将是一笔划算的投资。

AI赚钱年轻人首富争夺战

1天前
马化腾：和梁文锋有交流非常敬佩DeepSeek

在腾讯年报沟通会中，腾讯CEO马化腾谈到了人工智能这一热门话题，分享了诸多独到见解。马化腾表示，我们业界和梁文锋都有交流，很敬佩市场上出现独立、开源的产品，我们非常尊重。从2月到3月期间，元宝的日活跃用户增长了惊人的20倍，成为中国日活排名第三的AI原生移动应用。

腾讯人工智能马化腾

11天前

热文

3 天
7天

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R1

荐DeepSeek V3“小版本更新”背后，V3和R1正在融合成一个模型

老显卡也能用！美团开源首发INT8无损满血版DeepSeek R1

荐寻找DeepSeek梁文锋

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

荐我用扣子Coze搭建了一个超频版DeepSeek-R1

DeepSeek官方辟谣：R2发布为假消息

DeepSeek-R1联网搜索能力首测：腾讯元宝第一

荐字节和DeepSeek争抢“天才少年”

马化腾：和梁文锋有交流非常敬佩DeepSeek

热文

网易云音乐听劝了：优化了歌单界面歌名一目了然1.71万热度

所有AI预测彩票中奖号码都是骗局！专家：几乎不可能中大奖1.60万热度

微软谜之操作！移除bypassnro：强制安装Win11时登录账户1.14万热度

刘慈欣谈DeepSeek：完全有可能替代科幻小说作家0.98万热度

10年赚5.6亿！美的回应清仓小米股票系正常操作0.98万热度

雷军：预计今年研发投入超300亿元海量投入才能做好技术和产品0.85万热度

抖音安全与信任中心上线推荐算法原理公开0.84万热度

持股近10年美的彻底清仓了小米：合计套现约20亿元0.78万热度

微信视频号达人带货橱窗将逐步升级为「微信小店带货者」0.54万热度

苹果前首席工程师孔龙加盟复旦大学微电子学院44.10万热度

谢霆锋抖音开店卖烤肠：4年销售额达15亿元连续三年销量第一3.27万热度

芒果TV下调新会员同时使用设备数：新会员降至1台2.38万热度

库克现身杭州，探访中国AI重镇并会晤浙大学子1.96万热度

苹果向浙大捐赠3000万：支持在华编程教育1.72万热度

网易云音乐听劝了：优化了歌单界面歌名一目了然1.72万热度

求职找零工找兼职！腾讯微信上线「附近的工作」小程序1.72万热度

所有AI预测彩票中奖号码都是骗局！专家：几乎不可能中大奖1.61万热度

微信聊天消息自动翻译功能上线支持18种语言1.58万热度

B站网红大祥哥回应被骗1249万：争取一两年还清债务1.23万热度

库克与网易CEO丁磊见面出席《燕云十六声》线下活动121.10万热度

站长商机