AI资讯新闻榜单内容搜索-GPT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT
GPT-5得分不到0.4!法律+金融最大规模基准:1.9万+专家评估准则

GPT-5得分不到0.4!法律+金融最大规模基准:1.9万+专家评估准则

GPT-5得分不到0.4!法律+金融最大规模基准:1.9万+专家评估准则

最新PRBench基准可以测试AI在金融和法律领域的表现。结果显示,即使是顶尖大模型在处理复杂任务时也表现不佳,尤其在涉及重大经济后果的任务中。PRBench通过模拟真实场景和多轮对话,揭示了AI在专业领域的不足,强调开发更可靠AI系统的重要性。

来自主题: AI技术研报
7309 点击    2025-11-22 11:33
AI模型大战:Gemini 3 Pro、GPT-5.1-Codex-Max与Claude Sonnet 4.5如何选择?

AI模型大战:Gemini 3 Pro、GPT-5.1-Codex-Max与Claude Sonnet 4.5如何选择?

AI模型大战:Gemini 3 Pro、GPT-5.1-Codex-Max与Claude Sonnet 4.5如何选择?

前沿AI竞赛在2025年11月达到高潮。48小时内,谷歌推出Gemini 3 Pro宣称在主要推理基准测试中领先,而OpenAI立即用GPT-5.1-Codex-Max反击,这是一款专门训练用于通过创新"压缩"(compaction)技术自主工作超过24小时的专业编码模型[43]。加上Claude Sonnet 4.5已确立的编码统治地位和激进的安全过滤器,开发者面临前所未有的选择:

来自主题: AI技术研报
9913 点击    2025-11-21 17:09
狙击Gemini 3!OpenAI发布GPT-5.1-Codex-Max

狙击Gemini 3!OpenAI发布GPT-5.1-Codex-Max

狙击Gemini 3!OpenAI发布GPT-5.1-Codex-Max

Gemini 3力压全场,OpenAI坐不住了。发布Codex新版本——GPT-5.1-Codex-Max,突破上下文窗口限制,实现跨越数百万token的长时间连续工作,最长超过24小时的那种。

来自主题: AI资讯
8732 点击    2025-11-20 20:29
OpenAI深夜双王炸!GPT-5.1 Pro紧急发布,降维打击Gemini 3

OpenAI深夜双王炸!GPT-5.1 Pro紧急发布,降维打击Gemini 3

OpenAI深夜双王炸!GPT-5.1 Pro紧急发布,降维打击Gemini 3

AI圈一日一更的频率,真的是有点跟不住了....前两天,先是Grok 4.1、Gemini 3 Pro发布,今天OpenAI GPT-5.1 Pro也静默登场了! 众所周知,GPT-5.1主打「情商智商」双强,Pro无疑将这两大优势推向更高层次。

来自主题: AI资讯
9023 点击    2025-11-20 11:40
速递|成立一年的开源编程Agent初创OpenHands,完成1880万美元融资

速递|成立一年的开源编程Agent初创OpenHands,完成1880万美元融资

速递|成立一年的开源编程Agent初创OpenHands,完成1880万美元融资

在我们探讨今日关于Gemini 的新闻之前,需要提及今晨微软与英伟达宣布,将投资 Anthropic。该公司承诺在未明确时限内投入至少 300 亿美元租赁微软 Azure 云平台上配备英伟达芯片的服务器。至此,三大云服务商均已注资这家 OpenAI 的竞品,再次释放微软已从 ChatGPT 制造商分散投资的信号。

来自主题: AI资讯
8542 点击    2025-11-20 10:06
终于不用为GPU算力发愁了,10块钱训练一个GPT!

终于不用为GPU算力发愁了,10块钱训练一个GPT!

终于不用为GPU算力发愁了,10块钱训练一个GPT!

前不久写了一期卡神做的 nanochat ,听朋友说咱们国产早就有类似的开源项目了:miniMind 。

来自主题: AI技术研报
8034 点击    2025-11-19 17:14
谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺

谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺

谷歌Gemini 3夜袭全球,暴击GPT-5.1!奥特曼罕见祝贺

凌晨,谷歌终极杀器Gemini 3重磅来袭,一出手就是Pro顶配版,号称「史上最强推理+多模态+氛围编程」三合一AI战神!基准测试横扫全场,就连GPT-5.1也被斩于马下,AI的下一个时代开启。而且,一上来就是顶配的Gemini 3 Pro——迄今推理最强,多模态理解最强,以及「智能体」+「氛围编程」最强的模型!

来自主题: AI资讯
9116 点击    2025-11-19 10:14