AI资讯新闻榜单内容搜索-语言模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 语言模型

豆包大模型团队发布全新Detail Image Caption评估基准，提升VLM Caption评测可靠性

豆包大模型团队发布全新Detail Image Caption评估基准，提升VLM Caption评测可靠性

豆包大模型团队发布全新Detail Image Caption评估基准，提升VLM Caption评测可靠性

当前的视觉语言模型（VLM）主要通过 QA 问答形式进行性能评测，而缺乏对模型基础理解能力的评测，例如 detail image caption 性能的可靠评测手段。

来自主题: AI技术研报

11911 点击 2024-07-13 20:01

OpenAI Lilian Weng万字长文解读LLM幻觉：从理解到克服

OpenAI Lilian Weng万字长文解读LLM幻觉：从理解到克服

OpenAI Lilian Weng万字长文解读LLM幻觉：从理解到克服

人会有幻觉，大型语言模型也会有幻觉。近日，OpenAI 安全系统团队负责人 Lilian Weng 更新了博客，介绍了近年来在理解、检测和克服 LLM 幻觉方面的诸多研究成果。

来自主题: AI资讯

6409 点击 2024-07-13 19:46

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

最近，新加坡国立大学联合南洋理工大学和哈工深的研究人员共同提出了一个全新的视频推理框架，这也是首次大模型推理社区提出的面向视频的思维链框架（Video-of-Thought， VoT）。视频思维链VoT让视频多模态大语言模型在复杂视频的理解和推理性能上大幅提升。该工作已被ICML 2024录用为Oral paper。

来自主题: AI技术研报

11885 点击 2024-07-12 17:54

深度解析RAG大模型知识冲突，清华西湖大学港中文联合发布

深度解析RAG大模型知识冲突，清华西湖大学港中文联合发布

深度解析RAG大模型知识冲突，清华西湖大学港中文联合发布

随着人工智能和大型模型技术的迅猛发展，检索增强生成（Retrieval-Augmented Generation, RAG）已成为大型语言模型生成文本的一种主要范式。

来自主题: AI技术研报

11781 点击 2024-07-10 18:43

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer

超越Transformer和Mamba的新架构，刚刚诞生了。斯坦福UCSD等机构研究者提出的TTT方法，直接替代了注意力机制，语言模型方法从此或将彻底改变。

来自主题: AI技术研报

7692 点击 2024-07-09 15:41

新架构RNN反超Transformer：每个隐藏状态都是一个模型，一作：从根本上改变语言模型

新架构RNN反超Transformer：每个隐藏状态都是一个模型，一作：从根本上改变语言模型

新架构RNN反超Transformer：每个隐藏状态都是一个模型，一作：从根本上改变语言模型

新架构，再次向Transformer发起挑战！

来自主题: AI技术研报

7476 点击 2024-07-09 15:11

开源视频版GPT-4o？快速记忆，实时问答，拿下CVPR'24长视频问答竞赛冠军

开源视频版GPT-4o？快速记忆，实时问答，拿下CVPR'24长视频问答竞赛冠军

开源视频版GPT-4o？快速记忆，实时问答，拿下CVPR'24长视频问答竞赛冠军

基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型（Large Language Models，LLMs）的强大理解、生成和推理能力

来自主题: AI技术研报

12039 点击 2024-07-07 16:35

Adam有了mini版：内存占用少一半，吞吐量提升50%

Adam有了mini版：内存占用少一半，吞吐量提升50%

Adam有了mini版：内存占用少一半，吞吐量提升50%

在训练大型语言模型（LLM）时，Adam(W) 基本上已经成为了人们默认使用的优化器。

来自主题: AI技术研报

10074 点击 2024-07-06 19:01

避免黑产使用大模型推断用户隐私已迫在眉睫

避免黑产使用大模型推断用户隐私已迫在眉睫

避免黑产使用大模型推断用户隐私已迫在眉睫

瑞士苏黎世联邦理工学院的研究者发现，为ChatGPT等聊天机器人提供支持的大型语言模型可以从看似无害的对话中，准确推断出数量惊人的用户个人信息，包括他们的种族、位置、职业等。

来自主题: AI资讯

8538 点击 2024-07-06 15:52

谷歌DeepMind全新ToT基准：全面评估LLM时间推理能力

谷歌DeepMind全新ToT基准：全面评估LLM时间推理能力

谷歌DeepMind全新ToT基准：全面评估LLM时间推理能力

近日，来自谷歌DeepMind的研究人员，推出了专门用于评估大语言模型时间推理能力的基准测试——Test of Time（ToT），从两个独立的维度分别考察了LLM的时间理解和算术能力。

来自主题: AI技术研报

10514 点击 2024-07-05 16:35

上一页当前第85页,共110页下一页