AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus

Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus

Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus

三天不开源,Qwen团队手就痒。 昨天深夜再次放出两个端侧模型: Qwen3-4B-Instruct-2507:非推理模型,大幅提升通用能力 Qwen3-4B-Thinking-2507:高级推理模型,专为专家级任务设计

来自主题: AI资讯
8318 点击    2025-08-07 12:12
爆冷!首届大模型争霸,Grok 4下出「神之一手」?DeepSeek、Kimi惨遭淘汰

爆冷!首届大模型争霸,Grok 4下出「神之一手」?DeepSeek、Kimi惨遭淘汰

爆冷!首届大模型争霸,Grok 4下出「神之一手」?DeepSeek、Kimi惨遭淘汰

AI国际象棋对抗?这次玩真的!谷歌Kaggle推出首届全球AI象棋争霸赛,八款顶级语言模型正面对抗,胜负只在一步之间!

来自主题: AI资讯
8886 点击    2025-08-07 12:05
a16z重磅预测:Vibe coding赢者通吃?错了,垂直专业化才是未来

a16z重磅预测:Vibe coding赢者通吃?错了,垂直专业化才是未来

a16z重磅预测:Vibe coding赢者通吃?错了,垂直专业化才是未来

你有没有发现,AI 应用生成平台们正在走向一条与大家预期完全不同的路?很多人原本以为这会是一场血腥的零和游戏,大家会在价格战中厮杀到底,最终只剩一家独大。但现实却让人意外:这些平台不但没有互相厮杀,反而开始各自寻找差异化的定位,在不同的细分市场中共存共荣。这让我想起了大语言模型市场的发展轨迹,同样出人意料,同样充满启发。

来自主题: AI资讯
7837 点击    2025-08-07 11:48
AI地图,“填坑”才能走得更远

AI地图,“填坑”才能走得更远

AI地图,“填坑”才能走得更远

拒绝“隐形陷阱”。 在互联网行业,尽管“一亏亏几十亿、一做做十几年”,可依赖于智慧交通、自动驾驶和本地生活的考量,地图,大厂一直都在“砸钱”。

来自主题: AI资讯
7253 点击    2025-08-07 11:09
腾讯AI Lab开源即王炸:GAIA同级最强Agent框架

腾讯AI Lab开源即王炸:GAIA同级最强Agent框架

腾讯AI Lab开源即王炸:GAIA同级最强Agent框架

当AI智能体(Agent)开发的浪潮涌来,很多一线工程师却发现自己站在一个尴尬的十字路口:左边是谷歌、OpenAI等巨头深不可测的“技术黑盒”,右边是看似开放却暗藏“付费墙”的开源社区。大家空有场景和想法,却缺少一把能打开未来的钥匙。

来自主题: AI资讯
7257 点击    2025-08-07 11:04
Flux.1 Krea Dev超大杯实测:开源模型能否撼动Midjourney V7 ?

Flux.1 Krea Dev超大杯实测:开源模型能否撼动Midjourney V7 ?

Flux.1 Krea Dev超大杯实测:开源模型能否撼动Midjourney V7 ?

7月底 Black Forest Labs 和 Krea 合作开发的高级文本到图像生成模型 Flux.1 Krea Dev,最近终于有时间进行测评了。Flux.1 Krea Dev 是基于FLUX.1 dev 模型进行蒸馏的,参数规模12B,专注于提升图像的美学和真实感,避免了常见的 AI 生成痕迹(过度饱和或不自然高光等等),更倾向于追求自然细节、照片级真实感和多样性。

来自主题: AI资讯
8427 点击    2025-08-07 10:54
AI竞技场,归根到底只是一门生意

AI竞技场,归根到底只是一门生意

AI竞技场,归根到底只是一门生意

AI模型排行榜分两类:以高考式标准化测试衡量特定能力的客观基准测试(如AAII、MMLU-Pro),以及用户匿名盲测、根据偏好对答案投票排名的人类偏好竞技场(如LMArena)。两者各有优劣和局限性,且排行榜本质是门生意。用户应基于实际需求而非榜单名次选择模型,实用性至上。

来自主题: AI资讯
10146 点击    2025-08-07 10:45
战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2被喊冤

战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2被喊冤

战报:马斯克Grok4笑傲AI象棋大赛,DeepSeek没干过o4-mini,Kimi K2被喊冤

最新战报最新战报:首届AI国际象棋对战……马斯克家的Grok 4“遥遥领先”了。 是的,谷歌给大模型整了个国际象棋比赛:Kaggle AI象棋竞赛。

来自主题: AI资讯
7316 点击    2025-08-07 10:42
连日本市场都拿不下的AI社交,注定“没戏”

连日本市场都拿不下的AI社交,注定“没戏”

连日本市场都拿不下的AI社交,注定“没戏”

AI社交产品在全球市场表现下滑,如百度月匣被减少投入,字节猫箱等下载量暴跌。日本孤独经济本应推动增长,但Character.AI等产品水土不服;原因包括大模型情感连接缺陷、角色同质化、缺乏创新。行业融资降温、商业变现困难、监管风险凸显;情感需求真实,但产品无法满足,需待技术变革。

来自主题: AI资讯
10738 点击    2025-08-07 10:27
一手实测OpenAI新开源的GPT OSS,o1和GPT-4o都要过气了。

一手实测OpenAI新开源的GPT OSS,o1和GPT-4o都要过气了。

一手实测OpenAI新开源的GPT OSS,o1和GPT-4o都要过气了。

gpt-oss-120b 和 gpt-oss-20b OpenAI终于把开源的模型放出来了。 gpt-oss系列也是自GPT2以来,OpenAI首次开源的大语言模型。

来自主题: AI产品测评
9745 点击    2025-08-06 17:08