AI产品测评-这里有最详细的人工智能工具测评解析

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
实测 GLM-5.2 :Claude 5 关停后,它真能稳稳接住这波用户

实测 GLM-5.2 :Claude 5 关停后,它真能稳稳接住这波用户

实测 GLM-5.2 :Claude 5 关停后,它真能稳稳接住这波用户

前几天 Fable 5 对海外用户关停的时候,智谱突然宣布向 GLM Coding Plan 全量用户开放了 GLM-5.2,并表示「前沿智能不应只属于少数人,也不应被少数规则随手收回。」

来自主题: AI产品测评
6262 点击    2026-06-17 14:28
字节最便宜视频模型Seedance 2.0 Mini来了!1.6毛/秒,比Fast快,实测让黄仁勋和豆包一起踢球

字节最便宜视频模型Seedance 2.0 Mini来了!1.6毛/秒,比Fast快,实测让黄仁勋和豆包一起踢球

字节最便宜视频模型Seedance 2.0 Mini来了!1.6毛/秒,比Fast快,实测让黄仁勋和豆包一起踢球

昨晚,字节新模型Seedance 2.0 Mini深夜来袭,该模型主打性价比,侧重于提供更低的价格以及更快的生成速度。Seedance 2.0 Mini虽然定价更低,但保留了核心能力参考生成,用户可以通过融合提示词与最多12个多种模态的参考素材(包括6张图片、3段音频、3段视频)来锁定人物一致性、精细化控制运动轨迹、卡准剧情节奏。

来自主题: AI产品测评
8277 点击    2026-06-16 14:41
最近的流量焦虑,被这两个开源Skill解决了。

最近的流量焦虑,被这两个开源Skill解决了。

最近的流量焦虑,被这两个开源Skill解决了。

大家好,我是袋鼠帝 前两天一个朋友问我,怎么边工作,边把自媒体持续做下去,还能做得好。

来自主题: AI产品测评
5683 点击    2026-06-16 14:17
实测 OiiOii 2.0:让AI视频创作者少折腾一点

实测 OiiOii 2.0:让AI视频创作者少折腾一点

实测 OiiOii 2.0:让AI视频创作者少折腾一点

Agent + 无限画布带来的想象力。

来自主题: AI产品测评
7158 点击    2026-06-16 13:58
实测GLM-5.2,国产Coding模型的又一座新高峰。

实测GLM-5.2,国产Coding模型的又一座新高峰。

实测GLM-5.2,国产Coding模型的又一座新高峰。

最近整个世界的魔幻程度,真的让人唏嘘。 今天早上,Anthropic收到了美国商务部的一封信。 信的内容很简单,以国家安全为由,要求Anthropic立刻暂停所有外国公民对Fable 5和Mythos

来自主题: AI产品测评
8679 点击    2026-06-13 22:54
实测小米最快1T大模型:吞吐量每秒1000+ Tokens,Vibe Coding七秒交付

实测小米最快1T大模型:吞吐量每秒1000+ Tokens,Vibe Coding七秒交付

实测小米最快1T大模型:吞吐量每秒1000+ Tokens,Vibe Coding七秒交付

全球大模型的军备竞赛,正在“智商”之外开辟新的战场—— 推理速度。

来自主题: AI产品测评
5533 点击    2026-06-11 09:58
实测Claude史上最强模型Fable 5,普通人慎用

实测Claude史上最强模型Fable 5,普通人慎用

实测Claude史上最强模型Fable 5,普通人慎用

对普通人最坏的消息要来了。

来自主题: AI产品测评
6208 点击    2026-06-10 10:32
实测CodeX 3大更新,OpenAI"准超级应用”"杀死比赛?

实测CodeX 3大更新,OpenAI"准超级应用”"杀死比赛?

实测CodeX 3大更新,OpenAI"准超级应用”"杀死比赛?

在ChatGPT拥有10亿用户后,AI问答这一定位,显然已经难以撑起其下一阶段的增长。另一方面,Codex每周活跃用户已超500万。很多人囿于名字,以为这是Coding产品。。。。限制了其在编程圈外的增长。

来自主题: AI产品测评
9893 点击    2026-06-05 09:26
扣子3.0实测:手机就能远程遥控你电脑里的Agent

扣子3.0实测:手机就能远程遥控你电脑里的Agent

扣子3.0实测:手机就能远程遥控你电脑里的Agent

扣子,来了个大版本的升级——3.0正式发布!

来自主题: AI产品测评
6040 点击    2026-06-03 15:02
实测阶跃 Step 3.7 Flash:更稳、更快、更省的 Agent 大脑

实测阶跃 Step 3.7 Flash:更稳、更快、更省的 Agent 大脑

实测阶跃 Step 3.7 Flash:更稳、更快、更省的 Agent 大脑

很难想象,企业使用 AI 的成本已经远远超过了雇佣员工的成本。

来自主题: AI产品测评
10162 点击    2026-06-03 15:01
MiniMax 低调发布 M3 和 MiniMax Code,我们测完后有几点感受

MiniMax 低调发布 M3 和 MiniMax Code,我们测完后有几点感受

MiniMax 低调发布 M3 和 MiniMax Code,我们测完后有几点感受

前沿的 Coding 能力、1M 的上下文窗口,还有原生的多模态

来自主题: AI产品测评
7899 点击    2026-06-02 11:58
横评 Opus 4.8、Gemini 3.5 Flash、GPT-5.5、Qwen3.7-Max,谁更强?

横评 Opus 4.8、Gemini 3.5 Flash、GPT-5.5、Qwen3.7-Max,谁更强?

横评 Opus 4.8、Gemini 3.5 Flash、GPT-5.5、Qwen3.7-Max,谁更强?

普通人看排行榜估计越看越疑惑,写文章该用哪个?数据分析该用哪个?写代码、审 PR、拆任务又该用哪个?我挑了四款最近讨论度很高的模型:Claude Opus 4.8、Gemini 3.5 Flash、GPT-5.5、Qwen3.7-Max,做一次横评,看看它们在真实任务里的交付表现。

来自主题: AI产品测评
9240 点击    2026-05-30 15:26
我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!

我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!

我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!

收到面壁智能的内测邀请,我翻了翻产品逻辑,发现它想解决的问题和我当时的处境一模一样。AI 能不能不只是回消息,而是做项目。AI 能不能记住规则,能在你睡觉的时候继续干活,能自己发现你漏了什么。

来自主题: AI产品测评
8975 点击    2026-05-28 17:52
DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro,阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名,仅次于 Claude Opus 4.7。除了真实场景的用户选择,在传统的大模型固定评测榜单上,像是终端能力 Terminal Bench、编程能力 SWE Bench 等,Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评
9490 点击    2026-05-28 12:06
实测AI购物:推荐不精准、价格不符、跨平台壁垒

实测AI购物:推荐不精准、价格不符、跨平台壁垒

实测AI购物:推荐不精准、价格不符、跨平台壁垒

迈入今年618大促周期,各大电商平台纷纷加码AI购物,智能选购成为各家角逐的新焦点。

来自主题: AI产品测评
8782 点击    2026-05-28 10:20
实测最近爆火的「Pixmax」,是真有东西啊!

实测最近爆火的「Pixmax」,是真有东西啊!

实测最近爆火的「Pixmax」,是真有东西啊!

AI 短剧发展到今天,过去那种靠单打独斗的小作坊模式正在被淘汰。现在复盘榜单上排名靠前的AI短剧内容团队,你会发现里面基本都是几个人、甚至十几人的工作室在共同推进项目。

来自主题: AI产品测评
10124 点击    2026-05-26 16:05
实测 OmniWork:搞调研、做动画、造游戏,用 AI 攒一个「全干班子」是什么体验?

实测 OmniWork:搞调研、做动画、造游戏,用 AI 攒一个「全干班子」是什么体验?

实测 OmniWork:搞调研、做动画、造游戏,用 AI 攒一个「全干班子」是什么体验?

下一代创作软件比的不是模型能力,而是谁能把完整的创作流程跑通。 能让 Agent 从接到目标开始,一路协作推进到交付成品的系统,才是真正的竞争力。 OmniWork 是我们最近看到的明确在朝这个方向走的产品。它给自己的定位是「The Agent OS for Creative Work」,面向创作工作的 Agent 操作系统。

来自主题: AI产品测评
8411 点击    2026-05-25 15:05
中国用户的Cowork首选,不再是Claude!阿里QoderWork震撼上新

中国用户的Cowork首选,不再是Claude!阿里QoderWork震撼上新

中国用户的Cowork首选,不再是Claude!阿里QoderWork震撼上新

AI办公彻底变天了!阿里QoderWork重磅发布全球首个AI Native自定义工作台,推出设计、PPT、写作三大领域模式。AI办公正式从「对话驱动」走向「领域驱动」。

来自主题: AI产品测评
10490 点击    2026-05-22 09:57
Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

昨天,想必大家都被 Google IO 大会刷屏了。

来自主题: AI产品测评
9604 点击    2026-05-22 09:56
体验完阿里首款Design Agent,我开始替UI/前端焦虑了..

体验完阿里首款Design Agent,我开始替UI/前端焦虑了..

体验完阿里首款Design Agent,我开始替UI/前端焦虑了..

大家好,我是袋鼠帝 作为一名后端程序员,我略懂前端,但是对于UI设计是一窍不通。

来自主题: AI产品测评
8076 点击    2026-05-21 16:10
全网实测Gemini Omni!一句话改视频,草图变大片

全网实测Gemini Omni!一句话改视频,草图变大片

全网实测Gemini Omni!一句话改视频,草图变大片

过去AI视频是「生成内容」,Omni直接升级成「生成世界」。它懂动能、重力、因果,还能把复杂概念瞬间可视化。人类距离「言出法随」的梦想,还剩几个Gemini Omni的距离?

来自主题: AI产品测评
8717 点击    2026-05-21 09:48
腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

近日,腾讯开始内测一款名为Marvis(马维斯)的操作系统层个人AI助手。这一AI助手通过多个Agent的协作完成App操作、EXE操作、电脑操作、文件管理、文档生成以及各种复杂任务,24小时持续在线,并支持跨端操作。

来自主题: AI产品测评
10424 点击    2026-05-16 11:08
一手实测:MiniMax 全新发布 Mavis,是什么?

一手实测:MiniMax 全新发布 Mavis,是什么?

一手实测:MiniMax 全新发布 Mavis,是什么?

把 Agent 从单体,组成一支可以协作的 Agent Teams。

来自主题: AI产品测评
12876 点击    2026-05-14 14:27
实测 Alice:人人都能免费使用的活人感 Agent

实测 Alice:人人都能免费使用的活人感 Agent

实测 Alice:人人都能免费使用的活人感 Agent

我看到洛小山做的 Alice,在「观猹」上取得了高分 8.2 的成绩。这是一个免费的 AI 个人助理(接入词元跳动注册即送免费算力):她有完整的人设,26 岁澳门女生,会在凌晨提醒你早睡,还会私下「小声蛐蛐」对你的观察。

来自主题: AI产品测评
8868 点击    2026-05-10 22:14