AI资讯新闻榜单内容搜索-LLM

让AI管理大型代码库，开发者福音来了 | 阿里/新加坡国立/西安交大联合出品

代码生成和补全任务做不完了？！

来自主题: AI资讯

9945 点击 2024-08-11 17:18

ACL 2024 Oral｜我们离真正的多模态思维链推理还有多远？

在过去的几年中，大型语言模型（Large Language Models, LLMs）在自然语言处理（NLP）领域取得了突破性的进展。这些模型不仅能够理解复杂的语境，还能够生成连贯且逻辑严谨的文本。

来自主题: AI技术研报

9969 点击 2024-08-11 13:25

21.5万张X光，78万个问题！德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA

多模态大语言模型 (Multimodal Large Language Moodel, MLLM) 以其强大的语言理解能力和生成能力，在各个领域取得了巨大成功。

来自主题: AI资讯

7490 点击 2024-08-10 12:03

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思考边证明，登顶新SOTA

LLM数学水平不及小学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。

来自主题: AI技术研报

7367 点击 2024-08-10 11:45

ChatGPT「秘方」竟在拖LLM后腿？Karpathy、LeCun联手开怼RLHF！

RLHF到底是不是强化学习？最近，AI大佬圈因为这个讨论炸锅了。和LeCun同为质疑派的Karpathy表示：比起那种让AlphaGo在围棋中击败人类的强化学习，RLHF还差得远呢。

来自主题: AI资讯

7616 点击 2024-08-10 10:32

LLM智能「参差不齐」！AI大牛Karpathy用表情包解释「9.9<9.11」

前段时间冲上热搜的问题「9.11比9.9大吗？」，让几乎所有LLM集体翻车。看似热度已过，但AI界大佬Andrej Karpathy却从中看出了当前大模型技术的本质缺陷，以及未来的潜在改进方向。

来自主题: AI技术研报

9639 点击 2024-08-09 14:38

吴恩达亲自授课，LLM当「助教」，适合初学者的Python编程课程上线

吴恩达教授开新课了，还是亲自授课！

来自主题: AI资讯

8670 点击 2024-08-08 18:55

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构建多模态基准

LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。

来自主题: AI技术研报

9861 点击 2024-08-08 14:41

a16z前合伙人：大模型从技术突破到产品颠覆，还需最后一跃

数以亿计的人体验过ChatGPT，但许多人尝试过后便未再回头。每家大型企业也都曾尝试过相关试点项目，但真正投入应用的却寥寥无几。这其中部分原因可能只是时间问题。然而，大型语言模型（LLMs）可能也存在陷阱：它们看似是产品，给人以神奇之感，但实际上并非如此。或许，我们终究需要经历寻找产品与市场契合点的漫长而单调的探索过程。

来自主题: AI资讯

6040 点击 2024-08-08 09:32

三「模」联盟，谷歌DeepMind缔造终身学习智能体！

打造终身学习智能体，是研究界以来一直追求的目标。最近，帝国理工联手谷歌DeepMind打造了创新联合框架扩散增强智能体（DAAG），利用LLM+VLM+DM三大模型，让AI完成迁移学习、高效探索。

来自主题: AI资讯

4012 点击 2024-08-07 19:06