5月刚刚大降价的智谱AI,这个月再给用户们全面上新。
6月5日,智谱AI Open Day正式举办。在现场,智谱AI发布了全新的开源大模型GLM-4系列、新API模型、MaaS 2.0大模型开放平台、智能体等等产品。
5月的大模型“大促月”还没结束,智谱也再度跟进降价。
比如,GLM-4-Flash轻量化版本,在企业优惠价下最低只需要6分钱/100万token。这意味着不到一毛钱就可以把四大名著如《红楼梦》写两遍。
而在企业V3版的价格下,用CogView-3文生图模型生成一张图只要6分钱。
智谱AI也公布了过去一年的产品、商业化进展:
当前,智谱AI的开放平台已服务30万企业级客户,日均调用量达400亿token,过去6个月API每日消费量增长了50倍以上。
智谱AI旗下的To C产品智谱清言App,当前已经有超过30万个智能体活跃在清言的智能体中心内,其中包括了思维导图、文档助手、日程安排等许多生产力工具。
新版的MaaS大模型开放平台,价格体系更加细分,让企业客户有多套餐可选。无需代码,客户以三步完成微调,用自有数据就可以部署私有模型。
值得注意的是,此次智谱开源了一个90亿参数的GLM-4-9B 模型,其综合能力相比 ChatGLM3-6B提升 40% ,全面超过 Llama-3-8B-Instruct。
而对比训练量更多的 Llama-3-8B 模型,GLM-4-49B在英文方面有小幅领先,中文学科能力提升 50%。
上下文窗口,也从 128K 扩展到了 1M token。这意味着模型能同时处理 200 万字的输入,大概相当于 2 本红楼梦或者 125 篇论文的长度。
GLM-4-9B模型也有自己调用外部工具的能力,即All Tools能力,能够调用外部工具(比如代码执行、联网浏览、画图、文件操作、数据库查询、API 调用等)来辅助回答问题或完成任务。
从模型体量上看,GLM-4-9B可以算是适用于非常多应用落地场景的一个小尺寸。智谱也表示,在开源模型上,智谱并未追求一味扩大模型参数。
“在模型规模方面,我们认为对于个人用户和开发者来说,显存更加珍贵,因此我们没有采用例如混合专家结构这种用显存来换性能的结构,而是略微将模型规模扩大到9B,用实际的计算量来追求性能。”智谱AI的技术团队表示。
在大模型的落地上,小模型(10B 以下的轻量化大模型)在应用落地上有独特的优势——参数小、占内存少、响应速度快、易于在端侧运行。训练大模型需要巨大算力资源和数据,而小模型所需数据更少,应用场景特定,商业化也更容易。
如今,各个大厂都有推出小模型系列产品——比如微软的SLM(小语言模型)Phi-3系列、苹果的“小模型”家族、谷歌的Gemma等等。
另外,智谱的MaaS大模型开放平台也发布了2.0版本。相比之下,今年1月智谱Dev Day强调更大参数模型GLM-4的硬核能力,在对话、代码、图片理解、文生图等全方位硬刚OpenAI,称GLM-4的英文能力达到GPT-4的九成,在中文表现上超越对方。
而新一代MaaS平台支持的一系列新模型更重视商业化应用,让企业根据不同需求有多套餐可选,差异化选择:
GLM-4性能最强大,不过也最贵(100元/100万token)
GLM-4-Air性能堪比规模更大的模型 GLM-4-0116、但有更性价比,GLM-4-Flash价格最优惠(0.1元/100万token)
而CogView-3文生图模型一张图只要一毛钱。
模型有套餐,企业VIP卡也上线了各种分级套餐。现在,智谱的MaaS平台有9折V0、8折V1、7折V2、6折V3的企业服务体系。比如,V3价格下,GLM-4-Flash下100万token只要6分钱,CogView-3生成一张图6分钱,主打量大便宜。
而针对企业用户的数据安全、对私有化模型的需求,智谱的MaaS大模型平台上线模型微调功能,在准备训练数据、创建微调任务、部署微调模型三个步骤后,就可以完成一个私有模型的训练。
AI圈内热议的“智能体”(Agent),现在和大模型的结合度,也越来越紧密。
如今,清言App推出的多智能体协作系统“清流”,可以在同一个对话框中,自由调用多种不同的智能体协同工作。
清言可以调用思维导图、流程图、数据分析等多个不同智能体,同时接入微博、飞书、日历等平台工具。
图源:智谱AI
智谱AI举了不少有趣的案例。
一位9岁的小男孩,与智谱清言合作,写出了一本关于火星生存的科幻小说。
他先问质谱清言,如何才能在火星上生存?智谱清言给出氧气、水、食物、能源等关键生存因素,再确立整本书的框架。
在用户和质谱清言的对话轮回中,填充文本,智谱清言还会查询科学数据来检查小说内容,修改文字错误。
智谱AI Open Day现场还展示了一个“赛博IP”——罗永浩智能体。
智谱AI智能体员工“AI老罗”
它有着跟罗永浩一样的广博的知识面、幽默的说话腔调,全天候24小时工作,还发挥老本行特色,现场为一套“奇葩”挖掘机形状的房屋户型图,来了一段罗永浩风格的直播推销:“你想象一下,你就打算在挖掘机的房子那得多酷,你住在里面每天都能感受到那种工程的力量和魅力......这个挖掘机户型把每个空间都挖掘得恰到好处,不像那些动辄几百平米的豪宅,看似气派,其实住起来空荡荡的,冷清得很。”
“AI老罗”解说的挖掘机户型
根据36氪的试用,现在清言APP的智能体中心,已经有多种对话场景。
比如,你可以在催生了人工智能革命的达特矛斯会议上与信息论始祖香农对话,在作家聊天群中与莫言、余华对话,在“无限流续写”中通过对话编织小说,向“专业选择引导师”智能体询问如何选高考专业。
智谱清言聊天界面
大模型降价已经成为趋势,现在许多大模型的小尺寸模型价格已经接近免费,这会持续多久?政务服务企业华信永道副总经理吴文表示,企业用户在意价格,但不是最在意价格,帮助企业增加利润率最重要,只要能帮助企业增加收入,即使贵,企业也愿意用。而爱设计CEO赵充在会上表示,降价的底线是电费,只要比电费高,就还有利润空间。
文章来源于“王沁”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales