北大团队改造DeepSeek注意力,速度快四倍还不丢精度
北大团队改造DeepSeek注意力,速度快四倍还不丢精度就在大家都急头白脸地等待DeepSeek-V4的时候,冷不丁一篇新论文引起了网友们的注意—— 提出新稀疏注意力机制HISA(分层索引稀疏注意力),突破64K上下文的索引瓶颈,相比DeepSeek正在用的DSA(DeepSeek Sparse Attention)提速2-4倍。
就在大家都急头白脸地等待DeepSeek-V4的时候,冷不丁一篇新论文引起了网友们的注意—— 提出新稀疏注意力机制HISA(分层索引稀疏注意力),突破64K上下文的索引瓶颈,相比DeepSeek正在用的DSA(DeepSeek Sparse Attention)提速2-4倍。
一段与ChatGPT的普通聊天,揭开韩国汽车旅馆连环谋杀案真相。
生成式模型当检索器大材小用效果还不好?
OpenAI 加快了迈向下一 AI 阶段的进程。
刚刚,Anthropic年收入首超OpenAI!同时就在今天,一份与谷歌、博通最新合作,将在2027年上线3.5 GW全新TPU集群。这批史诗级的算力,预计从2027年开始陆续上线。
通过一晚上的睡眠,AI 模型就能监控最多 130 种疾病。
OpenAI Codex 团队的产品规格文档只有 10 个要点。不是说每个功能的文档只有 10 个要点,而是整个产品的 spec 就这么多。设计师写的代码量超过了六个月前工程师写的。50 到 100 人的团队,直到最近才有了第二个产品经理。
《读佳》了解到,支付宝正在内测名为“aclaw”的AI产品,定位为“不懂代码,也能云养虾”。内嵌在支付宝APP中,这款新品的亮相,也让支付宝在 AI 领域的布局再添新动作。
老粉都知道,我们团队一直坚持“小而美”,满打满算也才九个人,所以腾不出多余的人手来负责美工工作。
许多长期与文字和代码打交道的创作者,应该对 Obsidian 这款软件并不陌生。作为目前全球最具影响力的本地化 Markdown 笔记应用之一,它凭借独树一帜的知识图谱和开源生态,在知名度与用户忠诚度上,已然能与 Notion 分庭抗礼。
大模型技术正在经历一场从 “对话助手” 向 “自主智能体(Agent)” 的深刻演进。智能体不再局限于被动地理解与生成,而是具备了多步规划、工具调用、长期记忆与管理物理 / 数字世界的能力,正逐步深度嵌入企业侧的核心业务流程。这意味着,AI 的边界已从虚拟屏幕的对话框,正式延伸到了真实的生产系统中。
绝了,真的绝了。 Copilot 开始自作主张,在 GitHub 代码仓库里加广告了……
最近,飞书、钉钉、企业微信接连推出 CLI,智能体生态战役再次打响。
Harness 应由业务驱动。
人形机器人全身灵巧操作是通向通用具身智能的核心目标之一。在这一愿景下,机器人不仅需要双臂与高自由度多指灵巧手的精细协调,还需要与全身位姿(如行走、弯腰)进行动态配合。
雷军和马云在具身智能赛道罕见"握手"。
Google 最新发布的 Gemma-4-31B 基础模型出现了越狱版本,安全限制被完全移除。这个名为"Gemma-4-31B-JANG_4M-CRACK"的模型已经公开发布在 Hugging Face 上,任何人都可以下载使用。
一个 X 用户的帖子被围观数十万次。他在帖子里放了一个视频,讲述自己如何在 iPhone 上本地运行 Gemma 4,包括处理图片、音频、控制手电筒开关。他表示,Gemma 4 速度快得惊人,感觉像魔法一样。
昨天,AI 圈最雷霆的新闻就是:Anthropic 正式宣布封禁 OpenClaw。 OpenClaw 的创始人 Peter 一脸懵逼,说 Anthropic 抄了他们的功能,转手又把他们给封了。
想抢在A家之前上市的OpenAI,刚一回头却发现:一边是高层出现剧烈人事动荡——COO转任特别项目,多位核心高管离职或休假;另一边,主导IPO的CEO与掌管钱袋子的CFO,却因时间表分歧曝出失和。
如果你是 Kimi Code 会员,现在就可以去控制台申请抢先体验——据说能提前体验新模型。消息虽非官方,但足以让开发者兴奋。毕竟,Kimi K2.5 接入 Kimi Code 才过去不到两个月。
先人用你烧的 token 跑完了推理,生成了一段回复,可以通过托梦返回给你。 今天是清明节。 每年这个时候,我都会想同一个问题:纸钱这玩意儿得有多毛啊? 这么多年,全国十几亿人往那边烧纸钱,面额还越来
来自复旦大学、上海创智学院的研究人员提出 LifeSim,一个面向个性化助手评测的长程用户生活模拟框架。LifeSim 同时建模用户内部认知过程与外部物理环境,生成连贯的生活轨迹、事件序列与多轮交互行为;在此基础上,研究团队进一步构建了 LifeSim-Eval,用于系统评测模型在长期个性化交互中的能力边界。
Agent 时代,我们需要正确的计费和工程设计哲学,这是 Xiaomi MiMo 大模型负责人罗福莉刚刚在 X 上发表的观点。前两天,我们报道了一则消息 ——Anthropic 宣布,即日起,Claude Pro 和 Max 订阅用户,不得再将订阅额度用于 OpenClaw 等第三方 Agent 框架。想继续用?那就必须切换到按用量付费的 API。
全球最安全系统,被AI攻破了!Claude 4小时攻破了全球最安全OS内核,从零写出国家级攻击程序,彻底跨越卢比孔河。人类防御60天,AI只要4小时,所有旧秩序,都在加速崩盘。
AI正在把漏洞发现的速度推到一个新量级,Linux内核安全团队从每周2-3份报告,暴涨到每天5-10份,而且几乎全是「真货」。旧时代的安全规则,正在被AI逐条撕碎。
具身智能独角兽Generalist,刚刚推出了最新的研究成果——新模型Gen-1。在包装手机和折叠纸箱这些精细活儿上,它把机器人的成功率从64%硬生生拉到了99%,几乎告别了手残职业病。
近日,国内旅游AI企业视旅科技正式上线旅游行业专属AI智能工具——VtripClaw(旅游版“龙虾”)。和OpenClaw类似,这款旅游版“龙虾”具备极强的任务拆解与自动化执行能力,并且更加适配旅游场景。
过去 3 年多时间里,从能云录制生成纪要,AI小助手做纪要总结,到元宝纪要再到 AI 托管,它一直在往会议流程里加入 AI 能力。近日,腾讯会议智能录制再次做了一次全面升级。我们深度体验后,和大家分享一手的体验和观察。
Karpathy 表示,大多数人使用 LLM 处理文档的方式,基本都类似于 RAG:你上传一组文件,模型在查询时检索相关片段,然后生成答案。这种方式是有效的,但问题在于每一次提问,模型都在从零重新发现知识。没有积累。