AI资讯新闻榜单内容搜索-LLM

中国信通院联合淘天集团发布全球首个中文安全领域事实性基准评测集，仅三个大模型达及格线

在当今迅速发展的人工智能时代，大语言模型（LLMs）在各种应用中发挥着至关重要的作用。然而，随着其应用的广泛化，模型的安全性问题也引起了广泛关注。

来自主题: AI资讯

7404 点击 2024-12-27 10:08

最近，类 o1 模型的出现，验证了长思维链 (CoT) 在数学和编码等推理任务中的有效性。在长思考（long thought）的帮助下，LLM 倾向于探索、反思和自我改进推理过程，以获得更准确的答案。

来自主题: AI技术研报

7348 点击 2024-12-27 10:03

2024年，AI Agent称得上最火热的概念。一方面，大模型赛道降温，并呈现出赢家通吃的局面；另一方面，AI Agent则是大模型应用落地的最佳形式，其能够解决LLMs在具体应用场景中的局限性。

来自主题: AI技术研报

7594 点击 2024-12-26 09:15

近年来，基于大型语言模型（LLMs）的多智能体系统（MAS）已成为人工智能领域的研究热点。

来自主题: AI技术研报

6511 点击 2024-12-25 14:06

PromptWizard (PW) 旨在自动化和简化提示优化。它将 LLM 的迭代反馈与高效的探索和改进技术相结合，在几分钟内创建高效的prompts。

来自主题: AI技术研报

8646 点击 2024-12-25 09:09

Hippocratic AI 的使命是打造首个以安全性为核心的医疗领域大语言模型（LLM）。

来自主题: AI资讯

7187 点击 2024-12-24 17:39

目前关于 RLHF 的 scaling（扩展）潜力研究仍然相对缺乏，尤其是在模型大小、数据组成和推理预算等关键因素上的影响尚未被系统性探索。针对这一问题，来自清华大学与智谱的研究团队对 RLHF 在 LLM 中的 scaling 性能进行了全面研究，并提出了优化策略。

来自主题: AI技术研报

8801 点击 2024-12-24 14:56

在大语言模型（LLM）的发展历程中，思维链（Chain of Thought，CoT）推理无疑是一个重要的里程碑。

来自主题: AI技术研报

8105 点击 2024-12-24 09:51

李飞飞、谢赛宁团队又有重磅发现了：多模态LLM能够记住和回忆空间，甚至内部已经形成了局部世界模型，表现了空间意识！李飞飞兴奋表示，在2025年，空间智能的界限很可能会再次突破。

来自主题: AI技术研报

7887 点击 2024-12-23 16:22

在过去的一年里，Anthropic 在构建 LLM 和 agents 这件事情上，与多个行业的数十个团队有过合作。

来自主题: AI资讯

8112 点击 2024-12-23 15:37