ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
第一手内测!智谱最新的「AI 视频通话」真实效果如何?
7223点击    2024-08-31 09:55

昨天,在 KDD 国际数据挖掘与知识发现大会上,智谱宣布「清言」App 迎来了重要更新,上线了「AI 视频对话功能」。


据报道,该功能还是国内首个面向 C 端开放的。


相信不少朋友的朋友圈被下面这条视频刷了屏。



看完了视频的我直呼离谱,智谱这是要将「对标 OpenAI」进行到底啊!



至于真实实力如何?到底像不像演示中的那么炸裂?


实践出真知,特工宇宙有幸拿到了内测资格,替大家体验测试一番。


先来个省流版:综合体验下来的主观感受是,屏幕那头的 AI 像是个 T 型人格的「淡人」,语气没有任何机械感,情绪稳定到泰山崩于前而面不改色,温柔文静又不失特工少女般的落落大方,那扑面而来的抑扬顿挫,就像那一朵水莲花不胜凉风的娇羞。


此外,多模态理解能力还是挺能打的,在部分场景上的识别和解答都表现不错,对话响应速度还是比较快的,大概在 1-2s 左右,并且支持插话打断。


除了在一些较复杂刁钻的问题上的表现稍有逊色之外,其余回答基本上都达到了预期。虽然效果没有非常惊艳,但是也足够让人眼前一亮,如此也确实配得上「国内首个」的名号。


这一次,智谱离「让机器像人一样思考」,更近了一步。



特工宇宙的小伙伴连夜录制了测试视频(虽然略显朴素,但是足够真实)。


让我们一起来看看。


第一个测试了下基础的多模态识别能力,可以看到 AI 较为准确地识别到了小猫以及它的一些样貌姿态(不知道为啥选这个 Case,可能是想晒下猫猫?



第二点就还蛮让人惊喜的,我看其他测评的没怎么提到,就是下一次唤起视频对话时,有概率 AI 会回顾之前的对话内容作为开场白。


比如视频中,我们再次打 Call 时,她还记得我们的小猫猫。


00

第三个,我们复刻了发布会中你画我猜的「画蛇添足」,结果也回答正确(不是哥们,画的稍微有点抽象了哈)



第四个,做了几个小学数学题也答对了(还挺有意思的是,她知道了答案但不直接告诉你,有点一步步引导你的感觉)



第五个,整了个复杂的,AI 正确的识别出一共有 20 款微缩玩具,英文也说的挺溜(没错咱们办公室确实有很多好玩的东西)



第六个做了个穿搭测试,什么衣服裤子配这顶帽子呢?回答的也不错。


不过把 ST.MORITZ(圣莫里茨,瑞士一度假小镇)中的 Z 识别成了 2,但也无可厚非,确实很容易看错。



此外,我们还挖掘了许多有趣的场景,由于篇幅有限便不再赘述,感兴趣的朋友可以在清言 APP ,或者登录 PC 端(chatglm.cn),申请内测。


除了 AI 视频通话功能以外,继 GLM-4-Flash 完全免费之后,在这次大会,智谱还推出了推出了新一代全自研基座大模型 GLM-4-Plus.


性能全面提升,拥有更强的长文本处理和多模态能力。


能力有提升多少呢?据官方表示,在语言文本能力方面,GLM-4-Plus 和 GPT-4o 及 Llama 3.1 405B 相当。



LCB: LiveCodeBench

NCB: NaturalCodeBench


此外,还有图像/视频理解模型 GLM-4V-Plus,和文生图模型 CogView-3-Plus.


前者或是国内首个通用视频理解模型 API,后者据说也能达到当前最优的 MJ-V6 和 FLUX 等模型的效果。


而这全新的三个模型,也都同步上线了智谱的 Bigmodel 开放平台,可以在线体验或直接调用 API 测试。



在这一点上,智谱就比 OpenAI 实诚多了,有啥好东西它是真的直接开放。


BTW,在测试的过程中我萌生了一个不怎么搭边的小问题。


就是咱这个形象为什么是个「大象」?


我突然想到 GLM 大模型的 Logo 好像就是一只大象。



我仔细盯着这 Logo 半天,似乎发现了里面的一些玄机。


白色区域原来是个 G 和 L,整只大象组成了个 M,由此代表了 GLM,然后为什么选择大象呢,我猜测是源自智谱的 Slogan,让机器「象」人一样思考。


起初的我不觉明厉,但顿悟的我拍案叫绝。


One more thing,OpenAI 这两天又在聊新的融资,市值最高的三家公司苹果、微软、英伟达正在洽谈参与投资,OpenAI 的估值将超过 1000 亿美元。


那么,祝愿全面对标 OpenAI 的智谱,也能蒸蒸日上。


文章来源“特工宇宙”,作者“特工十五、特工小鹏”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/