AI资讯新闻榜单内容搜索-GPT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT
ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格

ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格

ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格

大型语言模型(LLMs)在解决问题方面的非凡能力日益显现。最近,一个值得关注的现象是,这些模型在多项数学推理的基准测试中获得了惊人的成绩。以 GPT-4 为例,在高难度小学应用题测试集 GSM8K [1] 中表现优异,准确率高达 90% 以上。同时,许多开源模型也展现出了不俗的实力,准确率超过 80%。

来自主题: AI资讯
7255 点击    2024-07-18 16:57
GitHub星标超16万,爆火AutoGPT进阶版来了:定制节点、多智能体协同

GitHub星标超16万,爆火AutoGPT进阶版来了:定制节点、多智能体协同

GitHub星标超16万,爆火AutoGPT进阶版来了:定制节点、多智能体协同

还记得去年 AI 大牛 Andrej Karpathy 大力宣传的「AutoGPT」项目吗?它是一个由 GPT-4 驱动的实验性开源应用程序,可以自主实现用户设定的任何目标,展现出了自主 AI 的发展趋势。

来自主题: AI资讯
4522 点击    2024-07-18 16:42
OpenAI超级对齐团队再发「绝唱」!首提「证明者-验证者」博弈,训练GPT说人话

OpenAI超级对齐团队再发「绝唱」!首提「证明者-验证者」博弈,训练GPT说人话

OpenAI超级对齐团队再发「绝唱」!首提「证明者-验证者」博弈,训练GPT说人话

当我们不停在CoT等领域大下苦功、试图提升LLM推理准确性的同时,OpenAI的对齐团队从另一个角度发现了华点——除了准确性,生成答案的清晰度、可读性和可验证性也同样重要。

来自主题: AI技术研报
4926 点击    2024-07-18 16:19
能参与尖端科研的ChatGPT,怎么才刚过高考一本线?

能参与尖端科研的ChatGPT,怎么才刚过高考一本线?

能参与尖端科研的ChatGPT,怎么才刚过高考一本线?

这几天你还在等录取通知书吗?每次高考完,总有一些人特别招人烦。要么是高考博主分享人生感悟,也有复读班常客带你估分,最讨厌的就属一群中年人,在那里看着作文题高谈阔论找存在感。

来自主题: AI资讯
9750 点击    2024-07-18 13:29
一年创收34亿美元,OpenAI营收拆解

一年创收34亿美元,OpenAI营收拆解

一年创收34亿美元,OpenAI营收拆解

本文揭示了OpenAI一年创收34亿美元的收入构成,主要来自ChatGPT付费用户,API收入仅占15%。

来自主题: AI资讯
8996 点击    2024-07-17 14:43
大模型集体失智!9.11和9.9哪个大,几乎全翻车了

大模型集体失智!9.11和9.9哪个大,几乎全翻车了

大模型集体失智!9.11和9.9哪个大,几乎全翻车了

没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??

来自主题: AI资讯
9851 点击    2024-07-16 20:05
VLM集体「失明」?视力测试惨败,GPT-4o、Claude 3.5全都不及格

VLM集体「失明」?视力测试惨败,GPT-4o、Claude 3.5全都不及格

VLM集体「失明」?视力测试惨败,GPT-4o、Claude 3.5全都不及格

视觉大语言模型在最基础的视觉任务上集体「翻车」,即便是简单的图形识别都能难倒一片,或许这些最先进的VLM还没有发展出真正的视觉能力?

来自主题: AI技术研报
8780 点击    2024-07-16 19:43