
Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重
Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重Sakana AI发布了Transformer²新方法,通过奇异值微调和权重自适应策略,提高了LLM的泛化和自适应能力。新方法在文本任务上优于LoRA;即便是从未见过的任务,比如MATH、HumanEval和ARC-Challenge等,性能也都取得了提升。
Sakana AI发布了Transformer²新方法,通过奇异值微调和权重自适应策略,提高了LLM的泛化和自适应能力。新方法在文本任务上优于LoRA;即便是从未见过的任务,比如MATH、HumanEval和ARC-Challenge等,性能也都取得了提升。
近期,OpenAI CEO Sam Altman 宣布,2025 年将推出名为 “Operator” 的虚拟员工计划,AI 代理将能够自主执行任务,如写代码、预订旅行等,成为企业中的 “数字同事”。
随着语言大模型的成功,视觉 - 语言多模态大模型 (Vision-Language Multimodal Models, 简写为 VLMs) 发展迅速,但在长上下文场景下表现却不尽如人意,这一问题严重制约了多模态模型在实际应用中的潜力。
「2025 年,我们可能会看到第一批 AI Agent 加入劳动力大军,并对公司的生产力产生实质性的影响。」——OpenAI CEO Sam Altman
工作日的早晨,公交、地铁上不乏频频看时间的上班族,错过一班地铁、路况比往常拥堵,都会造成大家的焦虑。到站弹射、疾走或狂奔,成功打卡,成为上班族“最后一公里”的可控艺术。而路况或者意外情况的发生,则在不可控范围内。
Sealos让应用可以在云操作系统中以智能的方式快速诞生。
“欧洲版 OpenAI” Mistral 的代码模型 CodeStral,又上新了! 而且与 DeepSeek V2.5 和 Claude 3.5 平起平坐,共同位列 Copilot 竞技场第一名。
新学期压力山大?让AI来帮你轻松应对!Z Potentials独家合作AI搜索独角兽Perplexity为学生们推荐一款学习神器——Perplexity Spaces!这个AI学习助手将彻底改变你的学习方式。
1 月 13 日晚,OpenAI 官方发布了 16 页《OpenAI’s Economic Blueprint》经济蓝图报告,描绘了美国如何最大限度的发挥 AI 优势、加强国家安全以及推动经济增长的政策建议(公众号后台回复【OpenAI】获得完整报告)。
OpenAI 接连发布 o1 和 o3 模型,大模型的高阶推理能力正在迎来爆发式增强。在预训练 Scaling law “撞墙” 的背景下,探寻新的 Scaling law 成为业界关注的热点。高阶推理能力有望开启新的 Scaling law,为大模型的发展注入新的活力。