AI资讯新闻榜单内容搜索-训练

单向VLM变双向！人大斯坦福等提出MoCa框架：双向多模态编码器

MoCa框架把单向视觉语言模型转化为双向多模态嵌入模型，通过持续预训练和异构对比微调，提升模型性能和泛化能力，在多模态基准测试中表现优异，尤其小规模模型性能突出。

来自主题: AI技术研报

8106 点击 2025-07-11 10:09

你有没有想过，为什么 Cursor、v0、Perplexity、Lovable、Bold 这些服务数百万用户的顶级 AI agent 产品，竟然都有一个惊人的共同点？它们全部都不是基于任何 AI 框架构建的。

来自主题: AI资讯

7968 点击 2025-07-10 13:20

「Tokenization（分词）是 Transformer 模型为弥补自身缺陷不得不戴上的枷锁。」

来自主题: AI技术研报

4727 点击 2025-07-10 13:16

LLM用得越久，速度越快！Emory大学提出SpeedupLLM框架，利用动态计算资源分配和记忆机制，使LLM在处理相似任务时推理成本降低56%，准确率提升，为AI模型发展提供新思路。

来自主题: AI技术研报

4583 点击 2025-07-10 12:30

自适应语言模型框架SEAL，让大模型通过生成自己的微调数据和更新指令来适应新任务。SEAL在少样本学习和知识整合任务上表现优异，显著提升了模型的适应性和性能，为大模型的自主学习和优化提供了新的思路。

来自主题: AI技术研报

6451 点击 2025-07-10 11:33

编者按：vibe coding不是编程的终点，而是Context Engineering驱动的协作智能的起点。那些能够最早理解并应用这种整合视角的人，将在下一轮技术变革中获得决定性优势。

来自主题: AI技术研报

5487 点击 2025-07-10 11:21

在 AI 领域，我们对模型的期待总是既要、又要、还要：模型要强，速度要快，成本还要低。但实际应用时，高质量的向量表征往往意味着庞大的数据体积，既拖慢检索速度，也推高存储和内存消耗。

来自主题: AI技术研报

8970 点击 2025-07-10 11:05

现在的世界模型，值得批判。我们知道，大语言模型（LLM）是通过预测对话的下一个单词的形式产生输出的。由此产生的对话、推理甚至创作能力已经接近人类智力水平。

来自主题: AI技术研报

5755 点击 2025-07-10 10:57

Mamba一作最新大发长文！主题只有一个，即探讨两种主流序列模型——状态空间模型（SSMs）和Transformer模型的权衡之术。

来自主题: AI技术研报

5721 点击 2025-07-10 10:56

总部位于洛杉矶的人工智能视频生成初创公司Moonvalley 团队认为，仅靠文本提示无法完成电影制作。

来自主题: AI资讯

8181 点击 2025-07-10 10:42