AI TNT— 让一部分先用AI实现商业化

o1完整思维链成OpenAI头号禁忌！问多了等着封号吧

警告！不要在ChatGPT里问最新o1模型是怎么思考的——只要尝试几次，OpenAI就会发邮件威胁撤销你的使用资格。

来自主题: AI资讯

2707 点击 2024-09-14 14:53

你写提示词应该更直白一点，把Top-k直接写进Prompt，无需提示的思维链推理 | DeepMind

高端的食材，往往只需要最朴素的烹饪方式；高端的提示词也一样，把Top-K写进来，一个专属于你的CoT-decoding解码策略应运而生！丝毫不要怀疑LLM的推理能力，在这个维度上，它比我们懂！

来自主题: AI资讯

6751 点击 2024-09-10 10:48

北大李戈团队提出大模型单测生成新方法，显著提升代码测试覆盖率

单元测试是软件开发流程中的一个关键环节，主要用于验证软件中的最小可测试单元，函数或模块是否按预期工作。单元测试的目标是确保每个独立的代码片段都能正确执行其功能，对于提高软件质量和开发效率具有重要意义。

来自主题: AI技术研报

4627 点击 2024-09-03 16:22

LLM推理性能受输出格式影响，JSON最严重

输出格式不同，竟然还能影响大模型发挥？！

来自主题: AI资讯

8973 点击 2024-08-16 21:15

ACL 2024 Oral｜我们离真正的多模态思维链推理还有多远？

在过去的几年中，大型语言模型（Large Language Models, LLMs）在自然语言处理（NLP）领域取得了突破性的进展。这些模型不仅能够理解复杂的语境，还能够生成连贯且逻辑严谨的文本。

来自主题: AI技术研报

8089 点击 2024-08-11 13:25

你真的了解CoT？普林斯顿大学解密影响CoT效率的因素，引用5875次的CoT讲了啥

2022年，Google研究团队发表了名为《思路链提示引发大型语言模型的推理》的开创性论文，引入了思维链(Chain of Thought， CoT)prompting技术。

来自主题: AI资讯

3238 点击 2024-07-15 14:18

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

最近，新加坡国立大学联合南洋理工大学和哈工深的研究人员共同提出了一个全新的视频推理框架，这也是首次大模型推理社区提出的面向视频的思维链框架（Video-of-Thought， VoT）。视频思维链VoT让视频多模态大语言模型在复杂视频的理解和推理性能上大幅提升。该工作已被ICML 2024录用为Oral paper。

来自主题: AI技术研报

9088 点击 2024-07-12 17:54

多模态CoT思维链架构来了，现已开源｜来自厦大&腾讯优图

多模态大模型，也有自己的CoT思维链了！厦门大学&腾讯优图团队提出一种名为“领唱员（Cantor）”的决策感知多模态思维链架构，无需额外训练，性能大幅提升。

来自主题: AI技术研报

9448 点击 2024-05-28 20:56

AI黑盒研究的突破性进展：Anthropic详解大模型的「思维」特征

一直以来 AI 都是一个黑盒子（black box），其内部运作机制是不可见的。人们输入数据并得到结果，但无法检查输出结果的逻辑或者系统的代码。而就在刚刚，Anthropic 宣布在理解人工智能模型内部运作机制方面取得重大进展。

来自主题: AI技术研报

5459 点击 2024-05-25 17:21

从80个模型中构建Scaling Law：华人博士生新作，思维链提出者力荐

在 AI 领域，扩展定律（Scaling laws）是理解 LM 扩展趋势的强大工具，其为广大研究者提供了一个准则，该定律在理解语言模型的性能如何随规模变化提供了一个重要指导。

来自主题: AI技术研报

3895 点击 2024-05-24 20:52