AI资讯新闻榜单内容搜索-语言模型

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报

10008 点击 2024-08-21 14:20

清华联合智谱AI重磅发布：中文10000字长文写作模型和提示词技术，或将改变行业

虽然大语言模型(LLM)的能力不断突破，但在长文生成方面却一直存在瓶颈。近日，清华大学和智谱AI联合发布的最新研究成果，为解决这一难题提供了创新方案。这项名为"LongWriter"的技术，成功将AI模型的长文生成能力从约2000字提升至10000字以上，同时保持了高质量输出。这一成果通过创新的数据构建方法、模型训练策略和评估基准，为AI长文创作开辟了新天地。

来自主题: AI资讯

7545 点击 2024-08-20 15:05

从头设计抗体，腾讯、北大团队预训练大语言模型登Nature子刊

AI 技术在辅助抗体设计方面取得了巨大进步。然而，抗体设计仍然严重依赖于从血清中分离抗原特异性抗体，这是一个资源密集且耗时的过程。

来自主题: AI资讯

8369 点击 2024-08-18 17:31

上线“魔力工作室”功能，Canva将AI融入到视觉设计中丨最前线

在未来，从大语言模型的角度，「Canva可画」会向着更加垂直、更加深耕的方向来发展。

来自主题: AI资讯

5178 点击 2024-08-17 11:19

没有等来OpenAI开源GPT-4o，等来了开源版VITA

大语言模型 (LLM) 经历了重大的演变，最近，我们也目睹了多模态大语言模型 (MLLM) 的蓬勃发展，它们表现出令人惊讶的多模态能力。特别是，GPT-4o 的出现显著推动了 MLLM 领域的发展。然而，与这些模型相对应的开源模型却明显不足。开源社区迫切需要进一步促进该领域的发展，这一点怎么强调也不为过。

来自主题: AI资讯

8508 点击 2024-08-14 17:38

CPU反超NPU，llama.cpp生成速度翻5倍！LLM端侧部署新范式T-MAC开源

T-MAC是一种创新的基于查找表（LUT）的方法，专为在CPU上高效执行低比特大型语言模型（LLMs）推理而设计，无需权重反量化，支持混合精度矩阵乘法（mpGEMM），显著降低了推理开销并提升了计算速度。

来自主题: AI资讯

6276 点击 2024-08-13 17:42

2B多模态新SOTA！华科、华南理工发布Mini-Monkey，专治「切分增大分辨率」后遗症

Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩，证明了其在多模态理解和文档智能领域的潜力。

来自主题: AI技术研报

5035 点击 2024-08-12 17:18

ACL 2024 Oral｜我们离真正的多模态思维链推理还有多远？

在过去的几年中，大型语言模型（Large Language Models, LLMs）在自然语言处理（NLP）领域取得了突破性的进展。这些模型不仅能够理解复杂的语境，还能够生成连贯且逻辑严谨的文本。

来自主题: AI技术研报

9634 点击 2024-08-11 13:25

21.5万张X光，78万个问题！德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA

多模态大语言模型 (Multimodal Large Language Moodel, MLLM) 以其强大的语言理解能力和生成能力，在各个领域取得了巨大成功。

来自主题: AI资讯

7099 点击 2024-08-10 12:03

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思考边证明，登顶新SOTA

LLM数学水平不及小学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。

来自主题: AI技术研报

7066 点击 2024-08-10 11:45