不用额外缓存!英伟达开源大模型记忆压缩方案,128K上下文提速2.7倍
不用额外缓存!英伟达开源大模型记忆压缩方案,128K上下文提速2.7倍提高大模型记忆这块儿,美国大模型开源王者——英伟达也出招了。
提高大模型记忆这块儿,美国大模型开源王者——英伟达也出招了。
在 AI 辅助 Coding 技术快速发展的背景下,大语言模型(LLMs)虽显著提升了软件开发效率,但开源的 LLMs 生成的代码依旧存在运行时错误,增加了开发者调试成本。
站在 2026 年的开端回望,LLM 的架构之争似乎进入了一个新的微妙阶段。过去几年,Transformer 架构以绝对的统治力横扫了人工智能领域,但随着算力成本的博弈和对推理效率的极致追求,挑战者们从未停止过脚步。
无论你是否身处AI行业,近期总能频繁刷到关于中国AI新物种的新闻。在美国拉斯维加斯会展中心举办的CES大会上,来自中国的AI产品遍布各个展馆,成为全场关注的焦点,这也恰如其分地印证了2025年中国AI应用落地的蓬勃发展态势。
我结合AI做了一次A股、美股、港股所有AI概念公司的分析总结,践行“用AI扫描AI板块”。今天分享一部分内容:股价涨幅、估值水平、盈利能力、三个市场投资人有哪些共识点。
今天,首个在国产芯片上完成全程训练的SOTA(最佳水平)多模态模型开源。这是智谱联合华为开源的图像生成模型GLM-Image。从数据到训练的全流程,该模型完全基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成构建。
Claude Cowork的横空出世,不仅是用10天自建系统的技术奇迹,更是对人类职业价值的一次残酷拷问:当AI两小时能干完两个月的工作,我们是该庆幸解放,还是该恐惧被替代?
今日,深圳AI初创公司DeepWisdom正式完成A轮及A+轮融资,累计金额达3100万美元(约合人民币2.1亿元)。据公开信息,DeepWisdom的累计融资规模位居国内同领域第一。
DeepWisdom 旗下产品 MetaGPT(现更名为Atoms)今年2月上线后,以0成本推广首月狂揽百万美元 ARR,全球注册用户迅速超过五十万,连续四周霸榜 Product Hunt 全球榜首。
如果说 2024 年我们还在惊叹于 AI 能写代码、能画图,那么 2025 年的关键词一定是:Agent(智能体)。