AI TNT— 让一部分先用AI实现商业化

LLM推理性能受输出格式影响，JSON最严重

输出格式不同，竟然还能影响大模型发挥？！

来自主题: AI资讯

8973 点击 2024-08-16 21:15

让AI管理大型代码库，开发者福音来了 | 阿里/新加坡国立/西安交大联合出品

代码生成和补全任务做不完了？！

来自主题: AI资讯

8088 点击 2024-08-11 17:18

ACL 2024 Oral｜我们离真正的多模态思维链推理还有多远？

在过去的几年中，大型语言模型（Large Language Models, LLMs）在自然语言处理（NLP）领域取得了突破性的进展。这些模型不仅能够理解复杂的语境，还能够生成连贯且逻辑严谨的文本。

来自主题: AI技术研报

8089 点击 2024-08-11 13:25

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 | ICML 2024

音视频大语言模型在处理视频内容时，往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新：音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。

来自主题: AI技术研报

5713 点击 2024-07-31 15:05

FBI-LLM低比特基础大语言模型来了，首个完全从头训练的二值化语言模型

自回归训练方式已经成为了大语言模型（LLMs）训练的标准模式，今天介绍一篇来自阿联酋世界第一所人工智能大学MBZUAI的VILA实验室和CMU计算机系合作的论文，题为《FBI-LLM: Scaling Up Fully Binarized LLMs from Scratch via Autoregressive Distillation》

来自主题: AI技术研报

5691 点击 2024-07-28 23:25

ACL 2024 | 对25个开闭源模型数学评测，GPT-3.5-Turbo才勉强及格

大型语言模型（LLMs）在解决问题方面的非凡能力日益显现。最近，一个值得关注的现象是，这些模型在多项数学推理的基准测试中获得了惊人的成绩。以 GPT-4 为例，在高难度小学应用题测试集 GSM8K [1] 中表现优异，准确率高达 90% 以上。同时，许多开源模型也展现出了不俗的实力，准确率超过 80%。

来自主题: AI资讯

6551 点击 2024-07-18 16:57