第一手内测！智谱最新的「AI 视频通话」真实效果如何？

11099点击 2024-08-31 09:55

昨天，在 KDD 国际数据挖掘与知识发现大会上，智谱宣布「清言」App 迎来了重要更新，上线了「AI 视频对话功能」。

据报道，该功能还是国内首个面向 C 端开放的。

相信不少朋友的朋友圈被下面这条视频刷了屏。

看完了视频的我直呼离谱，智谱这是要将「对标 OpenAI」进行到底啊！

至于真实实力如何？到底像不像演示中的那么炸裂？

实践出真知，特工宇宙有幸拿到了内测资格，替大家体验测试一番。

先来个省流版：综合体验下来的主观感受是，屏幕那头的 AI 像是个 T 型人格的「淡人」，语气没有任何机械感，情绪稳定到泰山崩于前而面不改色，温柔文静又不失特工少女般的落落大方，那扑面而来的抑扬顿挫，就像那一朵水莲花不胜凉风的娇羞。

此外，多模态理解能力还是挺能打的，在部分场景上的识别和解答都表现不错，对话响应速度还是比较快的，大概在 1-2s 左右，并且支持插话打断。

除了在一些较复杂刁钻的问题上的表现稍有逊色之外，其余回答基本上都达到了预期。虽然效果没有非常惊艳，但是也足够让人眼前一亮，如此也确实配得上「国内首个」的名号。

这一次，智谱离「让机器像人一样思考」，更近了一步。

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

特工宇宙的小伙伴连夜录制了测试视频（虽然略显朴素，但是足够真实）。

让我们一起来看看。

第一个测试了下基础的多模态识别能力，可以看到 AI 较为准确地识别到了小猫以及它的一些样貌姿态（不知道为啥选这个 Case，可能是想晒下猫猫？

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

第二点就还蛮让人惊喜的，我看其他测评的没怎么提到，就是下一次唤起视频对话时，有概率 AI 会回顾之前的对话内容作为开场白。

比如视频中，我们再次打 Call 时，她还记得我们的小猫猫。

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

第三个，我们复刻了发布会中你画我猜的「画蛇添足」，结果也回答正确（不是哥们，画的稍微有点抽象了哈）

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

第四个，做了几个小学数学题也答对了（还挺有意思的是，她知道了答案但不直接告诉你，有点一步步引导你的感觉）

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

第五个，整了个复杂的，AI 正确的识别出一共有 20 款微缩玩具，英文也说的挺溜（没错咱们办公室确实有很多好玩的东西）

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

第六个做了个穿搭测试，什么衣服裤子配这顶帽子呢？回答的也不错。

不过把 ST.MORITZ（圣莫里茨，瑞士一度假小镇）中的 Z 识别成了 2，但也无可厚非，确实很容易看错。

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

此外，我们还挖掘了许多有趣的场景，由于篇幅有限便不再赘述，感兴趣的朋友可以在清言 APP ，或者登录 PC 端（chatglm.cn），申请内测。

除了 AI 视频通话功能以外，继 GLM-4-Flash 完全免费之后，在这次大会，智谱还推出了推出了新一代全自研基座大模型 GLM-4-Plus.

性能全面提升，拥有更强的长文本处理和多模态能力。

能力有提升多少呢？据官方表示，在语言文本能力方面，GLM-4-Plus 和 GPT-4o 及 Llama 3.1 405B 相当。

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

LCB: LiveCodeBench

NCB: NaturalCodeBench

此外，还有图像/视频理解模型 GLM-4V-Plus，和文生图模型 CogView-3-Plus.

前者或是国内首个通用视频理解模型 API，后者据说也能达到当前最优的 MJ-V6 和 FLUX 等模型的效果。

而这全新的三个模型，也都同步上线了智谱的 Bigmodel 开放平台，可以在线体验或直接调用 API 测试。

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

在这一点上，智谱就比 OpenAI 实诚多了，有啥好东西它是真的直接开放。

BTW，在测试的过程中我萌生了一个不怎么搭边的小问题。

就是咱这个形象为什么是个「大象」？

我突然想到 GLM 大模型的 Logo 好像就是一只大象。

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

我仔细盯着这 Logo 半天，似乎发现了里面的一些玄机。

白色区域原来是个 G 和 L，整只大象组成了个 M，由此代表了 GLM，然后为什么选择大象呢，我猜测是源自智谱的 Slogan，让机器「象」人一样思考。

起初的我不觉明厉，但顿悟的我拍案叫绝。

One more thing，OpenAI 这两天又在聊新的融资，市值最高的三家公司苹果、微软、英伟达正在洽谈参与投资，OpenAI 的估值将超过 1000 亿美元。

那么，祝愿全面对标 OpenAI 的智谱，也能蒸蒸日上。

文章来源“特工宇宙”，作者“特工十五、特工小鹏”

第一手内测！智谱最新的「AI 视频通话」真实效果如何？

关键词: AI视频通话 , 智谱清言 , openai , AI , AI工具

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址：https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装：https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体，能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址：https://github.com/hitsz-ids/airda

免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点，无需魔法付费，即可无限制使用GPT-4o等多个海外模型产品。
在线使用：https://ffa.chat/