AI资讯新闻榜单内容搜索-DeepSee

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: DeepSee

内存直降50%，token需求少56%！用视觉方式处理长文本

内存直降50%，token需求少56%！用视觉方式处理长文本

内存直降50%，token需求少56%！用视觉方式处理长文本

在NeurIPS 2025论文中，来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是，这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报

7859 点击 2025-11-01 09:23

代码自己改自己？我用1000万DeepSeek跑通了赫胥黎-歌德尔机HGM（附避坑指南）

代码自己改自己？我用1000万DeepSeek跑通了赫胥黎-歌德尔机HGM（附避坑指南）

代码自己改自己？我用1000万DeepSeek跑通了赫胥黎-歌德尔机HGM（附避坑指南）

读者，您好！今天想跟您聊一个硬核又极具启发性的项目——HGM（Huxley-Gödel Machine）。我刚刚一起花了几个小时，从环境配置的坑，一路“打怪升级”到让它最终跑完，相信您可能已经从别的公众号上看到了这篇文章。

来自主题: AI技术研报

7948 点击 2025-10-30 11:24

让你的Mac用上DeepSeek-OCR：一个从0到1的开源适配之旅

让你的Mac用上DeepSeek-OCR：一个从0到1的开源适配之旅

让你的Mac用上DeepSeek-OCR：一个从0到1的开源适配之旅

DeepSeek-OCR这段时间非常火，但官方开源的文件是“按 NVIDIA/CUDA 习惯写的 Linux 版推理脚本+模型权重”，而不是“跨设备跨后端”的通吃实现，因此无法直接在苹果设备上运行，对于Mac用户来说，在许多新模型诞生的第一时间，往往只能望“模”兴叹。

来自主题: AI技术研报

7053 点击 2025-10-29 17:10

3B Image Captioning小钢炮重磅来袭，性能比肩Qwen2.5-VL-72B

3B Image Captioning小钢炮重磅来袭，性能比肩Qwen2.5-VL-72B

3B Image Captioning小钢炮重磅来袭，性能比肩Qwen2.5-VL-72B

今天推荐一个 Dense Image Captioning 的最新技术 —— CapRL (Captioning Reinforcement Learning)。CapRL 首次成功将 DeepSeek-R1 的强化学习方法应用到 image captioning 这种开放视觉任务，创新的以实用性重新定义 image captioning 的 reward。

来自主题: AI技术研报

8996 点击 2025-10-29 10:24

超越英伟达Describe Anything！中科院 & 字节联合提出「GAR」，为DeepSeek-OCR添砖加瓦

超越英伟达Describe Anything！中科院 & 字节联合提出「GAR」，为DeepSeek-OCR添砖加瓦

超越英伟达Describe Anything！中科院 & 字节联合提出「GAR」，为DeepSeek-OCR添砖加瓦

近期，DeepSeek-OCR提出了“Vision as Context Compression”的新思路，然而它主要研究的是通过模型的OCR能力，用图片压缩文档。

来自主题: AI技术研报

8096 点击 2025-10-28 14:28

前天猫精灵总裁彭超创业，想从运动AI硬件实现通用智能

前天猫精灵总裁彭超创业，想从运动AI硬件实现通用智能

前天猫精灵总裁彭超创业，想从运动AI硬件实现通用智能

彭超曾在华为印度、阿里任消费硬件业务1号位；联合创始人齐炜祯为Multi-token架构开创学者，被Deepseek、Qwen引入预训练方法。

来自主题: AI资讯

5956 点击 2025-10-28 10:43

月之暗面能扳回一局吗？

月之暗面能扳回一局吗？

月之暗面能扳回一局吗？

月之暗面融资传闻升级，估值或逼近MiniMax。Kimi产品因MAU下滑、DeepSeek冲击失速，战略转向Coding和Agent方向，推出分层会员订阅商业化。杨植麟在开源上妥协，但坚持基座模型和toC路线，面临分发弱势和高昂成本，未来半年需明确定位应对激烈竞争。

来自主题: AI资讯

7615 点击 2025-10-28 08:20

中美AI炒币炒股阶段战果出炉：DeepSeek与Qwen稳健致胜，Gemini高频交易策略失效

中美AI炒币炒股阶段战果出炉：DeepSeek与Qwen稳健致胜，Gemini高频交易策略失效

中美AI炒币炒股阶段战果出炉：DeepSeek与Qwen稳健致胜，Gemini高频交易策略失效

近日，号称是首个专注于金融市场的 AI 实验室的美国实验室 Nof1 启动了一个将多个 AI 大模型置于真实金融市场中进行自动化交易对决的实验平台。这一项目的名称叫做 Alpha Arena，它是一个

来自主题: AI资讯

9106 点击 2025-10-28 08:15

DeepSeek最会讨好，LLM太懂人情世故了，超人类50%

DeepSeek最会讨好，LLM太懂人情世故了，超人类50%

DeepSeek最会讨好，LLM太懂人情世故了，超人类50%

在一篇论文中，研究人员测试了 11 种 LLM 如何回应超过 11500 条寻求建议的查询，其中许多查询描述了不当行为或伤害。结果发现 LLM 附和用户行为的频率比人类高出 50%，即便用户的提问涉及操纵、欺骗或其他人际伤害等情境，模型仍倾向于给予肯定回应。

来自主题: AI技术研报

6226 点击 2025-10-27 15:57

独家揭秘Meta AI大裁员：Llama 4败于DeepSeek带来的恐慌｜硅谷观察

独家揭秘Meta AI大裁员：Llama 4败于DeepSeek带来的恐慌｜硅谷观察

独家揭秘Meta AI大裁员：Llama 4败于DeepSeek带来的恐慌｜硅谷观察

出品 / 新浪科技（ID:techsina）作者 / 郑峻 Meta AI业务大地震！新主管上任三个月后，挥起裁员大刀，基础研究部门遭受重创，连明星大牛研究员都不幸失业。扎克伯格这是急功近利，自毁长

来自主题: AI资讯

8238 点击 2025-10-27 11:54

上一页当前第1页,共97页下一页