AI资讯新闻榜单内容搜索-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 2
微软和麻省理工权威发布:Prompt格式显著影响LLM性能,JSON比Markdown准确性高42%

微软和麻省理工权威发布:Prompt格式显著影响LLM性能,JSON比Markdown准确性高42%

微软和麻省理工权威发布:Prompt格式显著影响LLM性能,JSON比Markdown准确性高42%

朋友们,想了解为什么同一模型会带来大量结果的不一致性吗?今天,我们来一起深入分析一下来自微软和麻省理工学院的一项重大发现——不同的Prompt格式如何显著影响LLM的输出精度。这些研究结果对于应用Prompt优化设计具有非常重要的应用价值。

来自主题: AI技术研报
10040 点击    2024-11-20 09:19
LiveBench 最新榜单:阶跃星辰位列中国大模型第一

LiveBench 最新榜单:阶跃星辰位列中国大模型第一

LiveBench 最新榜单:阶跃星辰位列中国大模型第一

国际权威榜单 LiveBench 官网发布最新的榜单成绩显示,阶跃星辰自研的万亿参数语言大模型 Step-2 在榜单中位列国产基座大模型第一

来自主题: AI资讯
9429 点击    2024-11-19 22:20
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

北大等出品,首个多模态版o1开源模型来了—— 代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。 在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。

来自主题: AI技术研报
7210 点击    2024-11-19 21:01
高通的自研架构芯片,正在整合生成式AI世界

高通的自研架构芯片,正在整合生成式AI世界

高通的自研架构芯片,正在整合生成式AI世界

生成式 AI 的驱动力,就在这块「至尊」芯片上? 身处 2024 年末的我们,已经能感觉到大模型就在身边。 新一代的旗舰手机上,动态壁纸、AI 画图、语音通话总结等功能一字排开,常用功能也有了新技术加持。

来自主题: AI资讯
6140 点击    2024-11-19 17:29
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开

多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开

多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开

以开源极客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。

来自主题: AI技术研报
7153 点击    2024-11-19 17:15
可以实现零代码开发的OPPO智能体平台,到底强在哪?

可以实现零代码开发的OPPO智能体平台,到底强在哪?

可以实现零代码开发的OPPO智能体平台,到底强在哪?

11 月 16 日,由 OPPO 与浙江大学联合承办的第三届(2024 年)中国高校计算机大赛 —— 智能交互创新赛在浙江省杭州市举行了全国总决赛及颁奖典礼。本届竞赛以 “交互无界,创意无限” 为主题,聚焦人机交互技术,深度挖掘 AI 智能体的应用潜力,推动智能产业的升级和发展。

来自主题: AI资讯
7047 点击    2024-11-18 16:20
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K

扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K

扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K

DIAMOND是一种新型的强化学习智能体,在一个由扩散模型构建的虚拟世界中进行训练,能够以更高效率学习和掌握各种任务。在Atari 100k基准测试中,DIAMOND的平均得分超越了人类玩家,证明了其在模拟复杂环境中处理细节和进行决策的能力。

来自主题: AI技术研报
6935 点击    2024-11-18 15:24