# 热门搜索 #
搜索
北京9岁小学生,已经用AI出书了!罗永浩围观:有事找不到我找AI
9808点击    2024-06-05 23:07

一个年仅9岁的男孩,利用AI智能体,竟然出版了一本书!


他叫许萌萌,是来自北京市第二实验小学的一名三年级学生。


萌萌与AI智能体共创的书叫做《AI少年——火星生存大挑战》,是一本科普小说,讲述了发生在火星上的“密室逃脱”的故事。



而他所选用的AI,正是来自智谱AI智谱清言


至于这本书具体是如何跟AI共创的,萌萌也做了详细地介绍:


我先问了智谱清言如何才能在火星上生存,确定了氧气、水、食物和能源是最重要的问题,确定了这本书的章节框架。
然后我会分段落告诉智谱清言我脑子里的故事情节,有时候会请他整段帮我撰写,比如科技馆的外观,火星的地貌等,有时候我需要智谱清言帮我查询科学知识和做一些计算,比如栖息舱的火星经纬度,找到祝融号的时间等。
最后,我还请智谱清言帮我修饰文字和改正错误,后来编辑老师表扬我的稿件几乎没有语法错误,这其实是智谱清言的功劳。



这便是智谱AI在今天刚刚举行的Open Day活动中所展示的较为有趣的环节。


对此,智谱AI CEO张鹏在现场总结道:


现在是到了把大模型技术的想象力转化为全新生产力的时刻,唯有如此AI才具有真正的革命性的意义。


而纵观整场活动,我们发现作为国内大模型顶流之一的智谱AI,围绕AI智能体、张鹏的观点,又有了新的发布动作:


  • 清言flow(清流):一个“@”动作,就可以联动数个AI智能体协作,其中还有一个“罗永浩”的官方智能体教你卖货(彩蛋见文末)


  • MaaS开放平台2.0:能力上去了,价格又打下来了。


接下来,我们就来一同看下,最新的智谱清言能帮我们做些什么。


一个“@”联动AI智能体,每天速读100篇论文


首先就是这次活动的主角之一,清流,正如刚才我们所述,它的可以让用户在GLM-4主对话框或任意一个AI智能体内,只需使用“@”功能,就可以召唤不同的专用AI智能体继续执行任务。


这些AI智能体可以自由组合,形成个性化工作流,以此来提高工作效率。


那么对于天下苦久矣的“读AI论文”这件事,智谱清言的AI智能体是否能帮上忙呢?


毕竟谷歌AI负责人Jeff Dean早在数年前就做过统计,单是在ML领域,每天就会产生超过100篇新论文


平均三分钟速览一篇,一天也得看上个5个小时。


这个“产速”当年就已经超过了摩尔定律,再加上现在爆火的大模型……读不完,根本读不完!


而现在,有了智谱清言的AI智能体,就能开启“用魔法打败魔法”的模式。


例如我们可以@一下一个名叫“arXiv论文速读/精析(计算机)”的AI智能体:


推荐5篇视频大模型最新进展的论文。



“唰唰唰”,在arXiv上与视频大模型相关的最新五篇论文就整理好了,而且是题目、作者、摘要、日期、链接等一并奉上的那种。


(AI智能体:大郎~该喝药……读论文了)


如果想继续深挖某个论文,我们就可以继续用@的方式调用另一个AI智能体来帮忙,例如**“论文解读助手”:



再如下面这个名叫“论文推荐助手”的AI智能体,更是可以检索清华大学AMiner数据库中,近三年超过600万篇的优质论文。



这次我们提一个概括总结性的问题:


关于机器学习的最新研究有哪些突破?



这个AI智能体从今年的各大研究中精准提炼出了“多模态”“Agent”这两个概念,正是今年的大热门。


如此一来,有了AI智能体们的加持,一天速读100篇论文就不再是什么难事了。


除了读论文这件事,智谱AI在现场还展示了其它AI智能体联动的案例,主打的就是实现“跨部门协作”


例如“喂”给智谱清言一个5分钟的讲义PPT,让它先生成一个讲义大纲:



然后再@一下“复杂流程图”这个AI智能体,就能把讲义大纲一键转成流程图了:



再如搞个活动策划,现在有了清流,相当于给你配备了多个助理。


我们先向“PPT助手”这个AI智能体提出需求:


我要策划一个线下音乐节,帮我写一个策划方案,格式要方便阅读。



当然,即便是AI,方案一次性通过的概率也是不大,这时候我们可以继续在上面这个AI智能体对话框中,@一下另一位AI智能体“活动方案策划达人”来交叉验证一下:


你觉得这个方案有什么问题吗?



可以看到,“活动方案策划达人”在第一版的基础之上又做了进一步的优化工作。


最后,我们就可以要求“PPT助手”基于优化的版本,来生成PPT了:


根据上述内容生成一个方案PPT。



不过有一说一,我们现在所熟知的多数AI聊天机器人,依旧是以prompt为驱动,也就是用户问一句,AI就会答一句。


而AI智能体的运作方式则是更具自主性,我们只需给出一个任务目标,它就能一步一步去完成工作。


但现实中的问题往往错综复杂,即便AI智能体能够胜任某个单一的工作,但若对于解决“复合型问题”来说依然存在挑战。


这也正是智谱AI的清流功能要啃下的硬骨头。


Andrej Karpathy就不止一次的在公开演讲中表达过这个观点,并且他还认为:


AGI在形式上将具备AI Agents的某些特性;这不仅仅是一个AI智能体的事情,而是需要很多的AI智能体共同联动。


OpenDay上,智谱清言还介绍了一个新的功能。知识库,还是可以构建“挂载”超大知识库的AI智能体功能——足足可以hold住100000000(1亿)个字的那种。


我们现在就不妨在亲测一下效果。例如我们上传100篇存在本地的文件(一次可上传50个)



从上传到解析完毕,也就是不到1分钟的事。



并且基于此,我们就可以提一些更有针对性、更符合自己需求的问题,例如:


今天的LLM论文中有哪些关于开源方面的内容?



不仅如此,“上传URL”和“上传文件”,还可以一起联动。


在调试到自己满意为止之后,点击页面右上角“发布智能体”,就可以上架到智谱清言的智能体广场了。


而除了应用上的更新之外,智谱AI在这次的Open Day中在模型层上同样也有新动作。


第四代开源模型GLM-4-9B


GLM-4-9B,正是智谱AI此次带来的最新开源大模型,亮点如下:


  • 更强的基础能力
  • 更长的上下文
  • 有更精准的函数调用和All Tools能力
  • 首次拥有多模态能力


有多强?我们不妨先来看下榜单性能。


整体来看,GLM-4-9B的中英文综合性能相比ChatGLM3-6B足足提升了40%!


对比训练量更多的Llama-3-8B模型,可以说是做到了全面超越,中文学科方面更是有着高达50%的提升。



不仅如此,从多语言能力、函数调用、多模态能力的评测上来看,GLM-4-9B也有不小的提升。


尤其是在多模态方面,是已经可以比肩GPT-4V了!



而且在长文本上下文窗口上,GLM-4-9B更是从128K扩展到了1M之多。


什么概念?相当于一口气可以消化2本红楼梦和125篇论文的文字量!


同样的,通过测试表明,GLM-4V-9B在1M大海捞针任务中取得了全绿的佳绩。



接下来,我们看实测效果。


例如“喂”给它一个公式印花的T恤,即便有褶皱这样的“阻力”,GLM-4V-9B也可以精准识别出是麦克斯韦方程组



再如把《三体》前三部(约90万字)内容丢进去,GLM-4-9B可以轻松基于此给出第四部的合理提纲。



而除了模型本身之外,智谱AI开放平台也有了新的升级——MaaS开放平台步入2.0时代



在模型方面,智谱AI主打的就是“发布即上线”,包括刚才新发布的GLM-4-9B等,全部都已经集成到了平台当中。


并且GLM-4全系列都是无需代码,三步完成微调的那种(支持LoRA微调和全参微调),操作上也是相当的简单。


但最为吸睛的,还应当是价格上的调整,来感受一下这个feel:



以GLM-4-Air为例,目前只需1%的价格,在性能上就可以比肩GLM-4了!


不得不说,智谱AI又一次把大模型“多快好省”的用起来这件事狠狠地push了一把。


而这也是整场活动看下来后最为直观的感受。


并且据智谱AI CEO张鹏介绍:


自从新一代基座大模型GLM-4问世以来,已经有超过30万个智能体活跃在清言APP的智能体中心上,其中包括了许多出色的生产力工具,比如思维导图、文档助手、日程安排等等。


One More Thing


其实在这场活动中,除了我们最开始提到的萌萌小朋友用AI进行了创作之外,现场还展示了众多的画作:



这些画作同样是小朋友们用智谱清言APP创作而来,并且他们岁数最小的只有1岁半,最大的也不超过12岁。


这代表了一种大模型应用普惠的趋势,也意味着大模型带来的人类能力增强,年龄下探、能力门槛几乎为0、人机交互也不必再专门学习相应的计算机语言。


学习AI,比之前所有其他科目和技能的学习,都更重要。


最后的最后,就是揭秘罗永浩彩蛋的时候了,AI老罗成为其清言平台的首位数字员工,工号001,并在智谱清言上向公众开放。罗永浩说自己也在玩。


他在录制的视频中也给予了智谱清言高度的肯定:


知识面渊博,说话中肯,找不到我的时候,找它也是可以的!



除此之外,刘慈欣也和智能体来了个梦回联动。


嗯,这次智谱AI的Open Day是有点fancy在身上的。


文章来源于:微信公众号量子位,作者:金磊


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0