AI资讯新闻榜单内容搜索-Gemin

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Gemin
全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四

全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四

全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四

最近,Ai2耶鲁NYU联合推出了一个科研版「Chatbot Arena」——SciArena。全球23款顶尖大模型火拼真实科研任务,OpenAI o3领跑全场,DeepSeek紧追Gemini挤入前四!不过从结果来看,要猜中科研人的偏好,自动评估系统远未及格。

来自主题: AI技术研报
6644 点击    2025-07-11 17:12
使用最强大语言模型做生物信息怎么样

使用最强大语言模型做生物信息怎么样

使用最强大语言模型做生物信息怎么样

最近一直在测试大模型来做生物信息,效果还可以,主要使用gemini cli,由于一直还有机会用上claude code,所以只能通过cursor来使用claude 4,这次内容我们来测试一下claud4的生物信息能力。

来自主题: AI资讯
5572 点击    2025-07-10 12:29
2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025 年已经过半, 文本生成大模型是否已经进入下半场了? OpenAI 完全不重视 API 市场? Grok3 根本没人用? 「大模型战」未来的走向如何?

来自主题: AI资讯
7550 点击    2025-07-09 15:30
OAI/谷歌/DeepSeek首次合体「AI梦之队」!战力飙升30%,碾压一切单模型

OAI/谷歌/DeepSeek首次合体「AI梦之队」!战力飙升30%,碾压一切单模型

OAI/谷歌/DeepSeek首次合体「AI梦之队」!战力飙升30%,碾压一切单模型

三个前沿AI能融合成AGI吗?Sakana AI提出Multi-LLM AB-MCTS方法,整合o4-mini、Gemini-2.5-Pro与DeepSeek-R1-0528模型,在推理过程中动态协作,通过试错优化生成过程,有效融合群体AI智慧。

来自主题: AI技术研报
7020 点击    2025-07-06 13:06
刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信

刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信

刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信

刚刚,Grok 4 和 Grok 4 Code 的基准测试结果疑似泄露。X 博主 @legit_api 发帖称,Grok 4 在 HLE(Humanities Last Exam,人类最后考试)上的标准得分是 35%,使用推理技术后提高到 45%;在 GPQA 上的得分是 87-88%;而Grok 4 Code 在 SWE Bench 上的得分则达到 72-75%。

来自主题: AI资讯
8105 点击    2025-07-05 11:38
Gemini负责人爆料!多模态统一token表示,视觉至关重要

Gemini负责人爆料!多模态统一token表示,视觉至关重要

Gemini负责人爆料!多模态统一token表示,视觉至关重要

一次性揭秘Gemini多模态技术!就在刚刚,Gemini模型行为产品负责人Ani Baddepudi在谷歌自家的开发者频道开启了爆料模式。

来自主题: AI资讯
6021 点击    2025-07-03 18:22
普通人用Gemini CLI提效的 1 万种方法!藏师傅保姆级教程

普通人用Gemini CLI提效的 1 万种方法!藏师傅保姆级教程

普通人用Gemini CLI提效的 1 万种方法!藏师傅保姆级教程

大家好,这里是歸藏(guizang),分享一下 Gemini CLI 不写代码能有多好用! 前几天最近随着 Claude Code 这个命令行 AI 代码工具的火爆,谷歌也耐不住寂寞推出了自己的同类产品 Gemini CLI,而且完全免费,非常顶。

来自主题: AI技术研报
6980 点击    2025-07-03 10:22
o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

UCSD等推出Lmgame Bench标准框架,结合多款经典游戏,分模块测评模型的感知、记忆与推理表现。结果显示,不同模型在各游戏中表现迥异,凸显游戏作为AI评估工具的独特价值。

来自主题: AI资讯
5623 点击    2025-07-01 16:15