AI产品测评-这里有最详细的人工智能工具测评解析

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谁是最强编程大模型?横向对比GPT-5、GPT-5 Codex、Claude Sonnet 4.5、Gemini 2.5 Pro

谁是最强编程大模型?横向对比GPT-5、GPT-5 Codex、Claude Sonnet 4.5、Gemini 2.5 Pro

谁是最强编程大模型?横向对比GPT-5、GPT-5 Codex、Claude Sonnet 4.5、Gemini 2.5 Pro

模型众多,该如何选择? GPT-5:OpenAI的最新旗舰模型,统一智能系统,GPT-5 集成了多个模型,自动根据任务复杂度选择最适合的模型进行处理,多模态首选。 GPT-5 Thinking:GPT

来自主题: AI产品测评
11214 点击    2025-10-15 12:29
当Sora2遇上国产 Vidu Q2,国产参考生真的更香了!一手亲测

当Sora2遇上国产 Vidu Q2,国产参考生真的更香了!一手亲测

当Sora2遇上国产 Vidu Q2,国产参考生真的更香了!一手亲测

国庆假期Sora 2的横空出世那叫一个吸睛,尤其是客串(Cameo)功能,直接把Sora拉到了“AI版抖音”的高度。

来自主题: AI产品测评
8685 点击    2025-10-13 11:36
实测 MGX|让一群Agent联手coding,比“模型即Agent” 更接近AGI?

实测 MGX|让一群Agent联手coding,比“模型即Agent” 更接近AGI?

实测 MGX|让一群Agent联手coding,比“模型即Agent” 更接近AGI?

MGX,全称 MetaGPT X,是 DeepWisdom 推出的多智能体平台,定位是“24/7 的 AI 开发团队”。它的特别之处在于,你只需要输入需求,系统就会自动生成一支虚拟团队。

来自主题: AI产品测评
8533 点击    2025-10-10 13:07
面对 Agent 红海,依旧有惊喜|Kimi OK Computer 实测

面对 Agent 红海,依旧有惊喜|Kimi OK Computer 实测

面对 Agent 红海,依旧有惊喜|Kimi OK Computer 实测

近日 Kimi 也开始小规模内测一个 Agent 新品,名称在一众 Agent 友商中,很有人文味与自信, 叫做:「OK Computer」。 阅尽千帆,本文仍想通过一系列典型 Agent 任务实测,为你解析 Kimi OK Computer 的真实水平。

来自主题: AI产品测评
10589 点击    2025-10-06 19:14
GLM-4.6 首发实测:和 Claude 4.5 比怎么样?

GLM-4.6 首发实测:和 Claude 4.5 比怎么样?

GLM-4.6 首发实测:和 Claude 4.5 比怎么样?

核心速递: GLM-4.6 发布,榜单排名提升,价格不变 实测效果对齐 Claude 4,超越其他国产模型 GLM 开发者包月套餐升级,1/7 价格取得 Claude 4 9/10 的效果,值得使用

来自主题: AI产品测评
9105 点击    2025-10-01 17:12
一手实测全新的Sora 2 - AI视频的ChatGPT时刻到来了。

一手实测全新的Sora 2 - AI视频的ChatGPT时刻到来了。

一手实测全新的Sora 2 - AI视频的ChatGPT时刻到来了。

Sora 2,用OpenAI的原话描述就是:“With Sora 2, we are jumping straight to what we think may be the GPT‑3.5 moment for video。”AI视频的ChatGPT时刻,正式来了。

来自主题: AI产品测评
9110 点击    2025-10-01 11:41
Flowith 发布新版,专治 AI “上下文腐烂”

Flowith 发布新版,专治 AI “上下文腐烂”

Flowith 发布新版,专治 AI “上下文腐烂”

9 月 26 日,Flowith 再次迎来了大更新,这一次,它的核心所指,正是「上下文腐烂」以及更加「自由的创作」。接下来,我们分享全面实测体验。从我的实际体验来看,这次的 Flowith 更新,终于让上下文「活」起来了。

来自主题: AI产品测评
7614 点击    2025-09-28 09:57
小孩子才做选择,成年人 All in AI | 剪映最新 AI 全家桶,第一时间评测

小孩子才做选择,成年人 All in AI | 剪映最新 AI 全家桶,第一时间评测

小孩子才做选择,成年人 All in AI | 剪映最新 AI 全家桶,第一时间评测

当「剪映」全面注入 AI,这个已经很成熟的创作工具又将发生什么新变化?我们先来试一试全新的「AI 剪映」的流程,再来理解创作者大会上的交流,会更加贴切一点。可以这么说,剪映的全面 AI 化,并非遥不可及的技术炫技,而是精准地切入了当下内容团队最真实、最高频的场景需求

来自主题: AI产品测评
6226 点击    2025-09-28 09:48
实测Kimi全新Agent模型「OK Computer」,很OK

实测Kimi全新Agent模型「OK Computer」,很OK

实测Kimi全新Agent模型「OK Computer」,很OK

Kimi发布全新Agent模型OK Computer !这个新Agent名字好像还有点儿来头啊……别的先不说,OK Computer到底OK不OK?实测一下!

来自主题: AI产品测评
8663 点击    2025-09-27 10:43
可灵2.5Turbo实测|顶尖AI视频模型,真能打平CG吗?

可灵2.5Turbo实测|顶尖AI视频模型,真能打平CG吗?

可灵2.5Turbo实测|顶尖AI视频模型,真能打平CG吗?

可灵正式发布了他们的 2.5 Turbo (app.klingai.com)版本视频模型,作为超创提前试了一下,这次的进步真的很大。

来自主题: AI产品测评
8335 点击    2025-09-24 10:07
实测可灵AI的新视频模型,它生成的动作戏酷到封神。

实测可灵AI的新视频模型,它生成的动作戏酷到封神。

实测可灵AI的新视频模型,它生成的动作戏酷到封神。

可灵2.5,来了。 不仅已经对可灵的超级创作者们正式进行灰度内测,还在这个周末,登上了釜山国际电影节。

来自主题: AI产品测评
6556 点击    2025-09-23 14:52
体验完 Meta 最新的 AI 眼镜,我想把买 iPhone 17 的预算留给它

体验完 Meta 最新的 AI 眼镜,我想把买 iPhone 17 的预算留给它

体验完 Meta 最新的 AI 眼镜,我想把买 iPhone 17 的预算留给它

这是我戴上 Meta Ray-Ban Display 的第一反应。说实话,从看到去年 Meta Orion 样机的表现之后,我的期待值原本没有特别高,但真的把 Display 戴在头上,我突然觉得这个行业有戏。

来自主题: AI产品测评
7259 点击    2025-09-20 15:19
最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!

最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!

最新实测GPT-5-Codex:前端能力碾压,复杂项目轻松搞定,Claude可以扔了!

昨天OpenAI正式发布了GPT-5-Codex,一个专门为Codex编码智能体研发的GPT-5版本。在看了全球网友实测效果后,基本结论就是可以告别Claude Code,放下Cursor,直接来拥抱Codex了!为了验证网友们的说法和GPT-5-Codex的真实能力,我们全面的测评了一下。

来自主题: AI产品测评
8887 点击    2025-09-17 19:27
GPT-5-Codex 一手实测

GPT-5-Codex 一手实测

GPT-5-Codex 一手实测

OpenAI 刚刚推出了新的编程模型 GPT-5 Codex,见前文:刚刚,OpenAI 发布 GPT‑5-Codex 新模型,专为编程而生

来自主题: AI产品测评
7194 点击    2025-09-16 12:30
谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上

谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上

谷歌的香蕉和字节的梦,相逢在 Lovart 的无限画布上

谷歌这只「香蕉」火得有些疯狂:Nano Banana(即 Gemini 2.5 Flash Image)自 8 月底上线以来,仅用几周就吸引了超过 1,000 万新用户,并在 Gemini 应用中完成了 2 亿次图像编辑请求

来自主题: AI产品测评
7102 点击    2025-09-16 09:58
值得庆祝的进步!即梦图片4.0超全测评来了。

值得庆祝的进步!即梦图片4.0超全测评来了。

值得庆祝的进步!即梦图片4.0超全测评来了。

很惊喜,真没想到 Nano Banana 刚体验几天,咱们即梦4.0火速跟上了。不是赶鸭子上架那种,是真的很强的猛猛大货上新。 先说小结论:总体效果还是很不错的,进步很大也很方便。有的地方有些小的不足,后续在图片和文字中我会有提到。

来自主题: AI产品测评
8390 点击    2025-09-08 16:12
安利5个我觉得超酷的AI学习大法。

安利5个我觉得超酷的AI学习大法。

安利5个我觉得超酷的AI学习大法。

在我前两天写过一篇AI自习室爆掉之后,很多粉丝在聊,有哪些好用的AI学习方法。

来自主题: AI产品测评
7284 点击    2025-09-08 15:33
深度长文AI一键生成:实测字节扣子空间新功能

深度长文AI一键生成:实测字节扣子空间新功能

深度长文AI一键生成:实测字节扣子空间新功能

事到如今,学会使用AI辅助工作已经成为重要的技能之一,对创作也是如此。

来自主题: AI产品测评
9881 点击    2025-09-08 10:30
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此

拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此

拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此

总参数达到1万亿,阿里迄今为止最大的模型来了! 没错,就是前几日大家期待已久的Qwen3-Max-Preview (Instruct)。

来自主题: AI产品测评
8162 点击    2025-09-07 12:30
一款让人欲罢不能的AI硬件

一款让人欲罢不能的AI硬件

一款让人欲罢不能的AI硬件

大家好,我是袋鼠帝。最近我感觉又好起来了,居然受到了阿里爸爸的关照。前几天,收到了一个阿里旗下钉钉新发布的AI硬件:DingTalk A1。

来自主题: AI产品测评
8350 点击    2025-08-28 14:17
全网最全实测,谷歌正式发布Nano-Banana!

全网最全实测,谷歌正式发布Nano-Banana!

全网最全实测,谷歌正式发布Nano-Banana!

还记得上周提到的那个爆火的神秘 AI 生图模型 nano banana 吗?在万众瞩目中它终于来了!

来自主题: AI产品测评
7781 点击    2025-08-28 14:09
谷歌偷偷搞了个神秘模型Nano-Banana?实测:强到离谱,但有3大硬伤

谷歌偷偷搞了个神秘模型Nano-Banana?实测:强到离谱,但有3大硬伤

谷歌偷偷搞了个神秘模型Nano-Banana?实测:强到离谱,但有3大硬伤

神秘AI模型Nano-Banana火了,冒出一堆假网站,李鬼和李逵傻傻分不清。 最近,AI 社区又冒出一个神秘的图像生成和编辑模型,名叫 Nano-Banana。

来自主题: AI产品测评
8271 点击    2025-08-26 19:17
AI视频生成新品实测:这怎么不算影院级呢?

AI视频生成新品实测:这怎么不算影院级呢?

AI视频生成新品实测:这怎么不算影院级呢?

百度最新视频生成模型蒸汽机2.0(MuseSteamer 2.0),好像真的有点东西。

来自主题: AI产品测评
6949 点击    2025-08-26 18:52
AutoGLM 2.0 深度解析:云端智能体的技术跃进与现实挑战

AutoGLM 2.0 深度解析:云端智能体的技术跃进与现实挑战

AutoGLM 2.0 深度解析:云端智能体的技术跃进与现实挑战

进入 2025 年,GUI Agent 赛道热度逐渐抬升 —— OpenAI 推出 Operator 并发布了 ChatGPT Agent,字节则发布了 UI-TARS-1.5 定位 GUI 开源方案。但大多数产品依然依赖本地执行,难以 24h 稳定运行。

来自主题: AI产品测评
7899 点击    2025-08-21 14:29
实测DeepSeek V3.1,不止拓展上下文长度

实测DeepSeek V3.1,不止拓展上下文长度

实测DeepSeek V3.1,不止拓展上下文长度

DeepSeek V3.1和V3相比,到底有什么不同?官方说的模模糊糊,就提到了上下文长度拓展至128K和支持多种张量格式,但别急,我们已经上手实测,为你奉上更多新鲜信息。

来自主题: AI产品测评
9297 点击    2025-08-21 10:49
主观评测五大AI助手识图能力,奇葩卫生间标识识别大PK

主观评测五大AI助手识图能力,奇葩卫生间标识识别大PK

主观评测五大AI助手识图能力,奇葩卫生间标识识别大PK

作者测试了智谱GLM-4.5V(开启/关闭推理)、豆包、Kimi、元宝和ChatGPT-5在识别十张奇葩卫生间标识上的表现。评测模拟紧急如厕场景,按识别正确性评分。结果智谱普通模式得分最高(86分),ChatGPT-5和智谱推理模式次之(78分),豆包和元宝70分,Kimi垫底(38分),揭示了各AI视觉能力的差异及局限性。

来自主题: AI产品测评
7664 点击    2025-08-18 10:44