AI资讯新闻榜单内容搜索-prompt

AI能自主出“竞赛题”了！港大&蚂蚁让大模型学会生成难题，水平已接近AIME

大模型架构研究进展太快，数据却快要不够用了，其中问题数据又尤其缺乏。

来自主题: AI技术研报

9718 点击 2025-03-15 15:39

CVPR 2025：长Prompt对齐问题也能评估了！当前最大AIGC评估数据集，模型评分超越当前SOTA

今年，CVPR共有13008份有效投稿并进入评审流程，其中2878篇被录用，最终录用率为22.1%。

来自主题: AI技术研报

8961 点击 2025-03-15 14:50

Claude 3.7 核心提示词曝光｜最懂提示词的大模型公司，现在怎么写 Prompt？

Anthropic 昨晚发布了他们最新的 Claude 3.7 Sonnet 混合推理模型，并在官网同步更新了 Claude 3.7 的系统提示词。

来自主题: AI技术研报

7053 点击 2025-03-13 11:54

轻松拿捏高等数学，LLM平均得分90+！GPT-4o、Mistral几乎没错

在32道高等数学测试中，LLM表现出色，平均能得分90.4(按百分制计算)。GPT-4o和Mistral AI更是几乎没错！向量计算、几何分析、积分计算、优化问题等，高等AI模型轻松拿捏。研究发现，再提示（Re-Prompting）对提升准确率至关重要。

来自主题: AI技术研报

10587 点击 2025-03-11 18:38

a16z：从Prompt到Product，AI驱动的网页应用搭建工具正在兴起

从本质上讲，LLM会根据用户从UI的输入生成代码示例。然后，生成的代码会通过中间件逻辑进行处理，根据逻辑跟踪文件、代码更改和第三方API调用。

来自主题: AI技术研报

10204 点击 2025-03-02 14:16

任意Prompt就能给大模型实时排名，竞技场新玩法，还能自动找最佳AI来作答

单个模型的优缺点也能分析

来自主题: AI技术研报

10767 点击 2025-02-28 10:52

如何完美解锁DeepSeek-R1的结构化输出能力（基于LangChain）？

DeepSeek-R1这样的推理模型有着强大的深度思考能力，但也有着一些不同于通用模型的特点与用法，比如不支持函数调用，不支持结构化输出，o1甚至不支持系统提示(System Prompt)等。尽管这和它们的使用场景有关，但有时也会带来不便。今天我们就来说说结构化输出这个常见的问题。

来自主题: AI技术研报

11627 点击 2025-02-21 15:03

别再学那破提示词技巧了！

一直以来，学术与实际产品的 Prompt 完全脱节，真实场景下，很多产品都聚焦情感陪伴，文案生成等开放任务里。而学术上这些任务没有明确的指标，无法量化也就没办法被比较，于是绝大部分的 Prompt 优化工作都聚焦在“刷榜”，例如怎么提升一个模型的代码/数学能力。我们今天跑的项目叫 SPO，具体什么意思并不重要，重要的是它把之前的所有问题全部解决了。

来自主题: AI资讯

11051 点击 2025-02-17 09:39

回家过年，长辈不催婚，反向我“安利AI”

2024年春节，我其实已经尝试过用AI的介入，来完成一些原本长辈需要我才能完成、但实际上并没有什么难度的问题。例如帮助长辈学习如何用提示词（Prompt），使用类似“什么问题+细节描述+发生场景+附加需求”这样的结构来获得更准确的回复，或是发掘一些AI App中自带的例如一键P图等功能。

来自主题: AI资讯

9376 点击 2025-02-05 14:52

无需微调，只靠Prompt，搞定LLM持续学习CL新范式，COLING2025（附提示词）

未来，掌握持续提示工程技术的开发者，将主导下一代智能系统的进化方向。

来自主题: AI技术研报

10824 点击 2025-01-24 14:33