AI资讯新闻榜单内容搜索-中文大模型

华为盘古718B模型最新成绩：开源第二

就在最新一期的SuperCLUE中文大模型通用基准测评中，各个AI大模型玩家的成绩新鲜出炉。DeepSeek-V3.1-Terminus-Thinking openPangu-Ultra-MoE-718B Qwen3-235B-A22B-Thinking-2507

来自主题: AI资讯

9660 点击 2025-09-29 22:10

SuperCLUE-Fact是专门评估大语言模型在中文短问答中识别和应对事实性幻觉的测试基准。测评任务包括知识、常识、对抗性和上下文幻觉。

来自主题: AI资讯

14688 点击 2025-04-15 17:04

OpenAI长期霸榜的SuperCLUE（中文大模型测评基准），终于被国产大模型反将一军。

来自主题: AI资讯

9654 点击 2024-05-22 18:17

ChatGPT 等通用大模型支持的功能成百上千，但是对于普通日常用户来说，智能写作一定是最常见的，也是大模型最能真正帮上忙的使用场景之一。

来自主题: AI技术研报

6959 点击 2024-02-04 13:56

就在最近，百川智能正式发布Baichuan 2系列开源大模型。作为开源领域性能最好的中文模型，在国内，Baichuan 2是要妥妥替代Llama 2了。

来自主题: AI技术研报

5921 点击 2023-09-15 14:49