AI资讯新闻榜单内容搜索-Multi

Prompt、Context engineering 又向前进化了，3个关键维度+5个具体杠杆｜谷歌

我们正处在一个AI Agent（智能体）爆发的时代。从简单的ReAct循环到复杂的Multi-Agent Swarm（多智能体蜂群），新的架构层出不穷。但在这些眼花缭乱的名词背后，开发者的工作往往更像是一门“玄学”，我们凭直觉调整提示词，凭经验增加Agent的数量，却很难说清楚为什么某个架构在特定任务上表现更好。

来自主题: AI技术研报

9352 点击 2025-12-16 09:59

Jina-VLM：可在笔记本上跑的多语言视觉小模型

今天我们正式发布 Jina-VLM，这是一款 2.4B 参数量的视觉语言模型（VLM），在同等规模下达到了多语言视觉问答（Multilingual VQA）任务上的 SOTA 基准。Jina-VLM 对硬件需求较低，可在普通消费级显卡或 Macbook 上流畅运行。

来自主题: AI资讯

9371 点击 2025-12-09 14:48

字节前技术负责人创业，联手清华姚班校友，编程智能体世界登顶

来自中国的初创团队词元无限给出了自己的答案。由清华姚班校友带队设计开发的编码智能体 InfCode，在 SWE-Bench Verified 和 Multi-SWE-bench-CPP 两项非常权威的 AI Coding 基准中双双登顶，力压一众编程智能体。

来自主题: AI资讯

11239 点击 2025-12-05 14:51

拆解Gemini 3：Scaling Law的极致执行与“全模态”的威力

毫无疑问，Google最新推出的Gemini 3再次搅动了硅谷的AI格局。在OpenAI与Anthropic激战正酣之时，谷歌凭借其深厚的基建底蕴与全模态（Native Multimodal）路线，如今已从“追赶者”变成了“领跑者”。

来自主题: AI资讯

10560 点击 2025-11-24 15:26

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

长期以来，多模态代码生成（Multimodal Code Generation）的训练严重依赖于特定任务的监督微调（SFT）。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功，但其 “狭隘的训练范围” 从根本上限制了模型的泛化能力，阻碍了通用视觉代码智能（Generalized VIsioN Code Intelligence）的发展。

来自主题: AI技术研报

10258 点击 2025-11-17 14:32

刚刚，智源悟界·Emu3.5重塑世界模型格局，原生具备世界建模能力

今天，北京智源人工智能研究院（BAAI）重磅发布了其多模态系列模型的最新力作 —— 悟界・Emu3.5。这不仅仅是一次常规的模型迭代，Emu3.5 被定义为一个 “多模态世界大模型”（Multimodal World Foudation Model）。

来自主题: AI资讯

10264 点击 2025-10-30 18:07

中移动九天团队MultiPL-MoE：全新Hybrid-MoE架构用于增强通用大模型低资源代码能力

大语言模型（LLM）虽已展现出卓越的代码生成潜力，却依然面临着一道艰巨的挑战：如何在有限的计算资源约束下，同步提升对多种编程语言的理解与生成能力，同时不损害其在主流语言上的性能？

来自主题: AI技术研报

9240 点击 2025-10-30 16:23

前天猫精灵总裁彭超创业，想从运动AI硬件实现通用智能

彭超曾在华为印度、阿里任消费硬件业务1号位；联合创始人齐炜祯为Multi-token架构开创学者，被Deepseek、Qwen引入预训练方法。

来自主题: AI资讯

7821 点击 2025-10-28 10:43

不再靠「猜坐标」！颜水成团队等联合发布PaDT多模态大模型：实现真正的多模态表征输出

近年来，多模态大语言模型（Multimodal Large Language Models, MLLMs）在图文理解、视觉问答等任务上取得了令人瞩目的进展。然而，当面对需要精细空间感知的任务 —— 比如目标检测、实例分割或指代表达理解时，现有模型却常常「力不从心」。

来自主题: AI技术研报

10830 点击 2025-10-16 12:31

速递｜AI演示工具Prezen，完成3000万美元融资，合并Prezentium部署“演示工程师”推动AI定制

Prezent 是一家为企业提供人工智能演示文稿制作工具的初创公司，今日宣布完成 3000 万美元融资。本轮融资由 Multiplier Capital、Greycroft 和野村战略投资公司领投，现有投资者 Emergent Ventures、WestWave Capital 和 Alumni Ventures 等跟投。

来自主题: AI资讯

8026 点击 2025-10-11 12:05

AI资讯新闻榜单内容搜索-Multi

Prompt、Context engineering 又向前进化了，3个关键维度+5个具体杠杆 ｜谷歌

Jina-VLM：可在笔记本上跑的多语言视觉小模型

字节前技术负责人创业，联手清华姚班校友，编程智能体世界登顶

拆解Gemini 3：Scaling Law的极致执行与“全模态”的威力

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

刚刚，智源悟界·Emu3.5重塑世界模型格局，原生具备世界建模能力

中移动九天团队MultiPL-MoE：全新Hybrid-MoE架构用于增强通用大模型低资源代码能力

前天猫精灵总裁彭超创业，想从运动AI硬件实现通用智能

不再靠「猜坐标」！颜水成团队等联合发布PaDT多模态大模型：实现真正的多模态表征输出

速递｜AI演示工具Prezen，完成3000万美元融资，合并Prezentium部署“演示工程师”推动AI定制

Prompt、Context engineering 又向前进化了，3个关键维度+5个具体杠杆｜谷歌