中文大模型幻觉测评系列:事实性幻觉测评结果发布!
中文大模型幻觉测评系列:事实性幻觉测评结果发布!SuperCLUE-Fact是专门评估大语言模型在中文短问答中识别和应对事实性幻觉的测试基准。测评任务包括知识、常识、对抗性和上下文幻觉。
SuperCLUE-Fact是专门评估大语言模型在中文短问答中识别和应对事实性幻觉的测试基准。测评任务包括知识、常识、对抗性和上下文幻觉。
什么?! 现在随便一个完全不懂编程的人,都可以开发完整网站了???
AI智能体如何更好连接现实世界,正成为不少人关心的命题。
国内大模型赛道出现了第一家启动 IPO 的创业公司。
英伟达宣布了一项开创性计划,在美国制造AI超级计算机,通过与台积电、富士康等巨头合作,打造价值5000亿美元的AI基础设施。
国内最大MCP中文社区上线了,支付宝、MiniMax明星服务在魔搭MCP广场独家首发,还有近1500款MCP服务全领域覆盖,再次降低AI开发门槛。
超过150多个国家及地区参与的大阪世博会于近日正式开园,中国馆作为面积最大的外国自建馆成为人气焦点。
大家好,我是袋鼠帝上个月底,智谱发布了一个非常牛逼的产品AutoGLM沉思版(国内首个免费使用的DeepResearch),它既能推理,又能动手,还能接管你的浏览器帮你干活儿。
前段时间,GPT-4o 火出了圈,其断崖式提升的生图、改图能力让每个人都想尝试一下。虽然 OpenAI 后来宣布免费用户也可以用,但出图慢、次数受限仍然困扰着没有订阅 ChatGPT 的普通人。
在 Sora 之前,就已经受到全世界用户的认可的生成式视频工具是什么?——可灵 AI。无需折腾剪辑软件,几分钟,就能拿到自然如实拍,画面质感如电影的动态视频。