"1985 年,Windows 1.0 的发布开创了个人计算的新纪元。
它解决了一个根本性问题:让普通人能够轻松使用计算机。
统一的图形界面、直观的操作方式、标准化的开发环境,
Windows 构建了第一个真正意义上的软件生态系统。
然而,这是一个相对封闭和单一的世界。
软件需要安装,更新要手动,使用场景局限于办公桌前。
它就像一座固定的城堡,坚固但缺乏灵活性。
"2008 年,当乔布斯发布 App Store 时,你是否意识到这是一场革命?
还记得第一次用手机下载应用的感觉吗?
一键安装,即点即用。App Store 让软件走出城堡,变成了口袋里的百宝箱。
朋友圈、外卖、打车、支付...每个 App 都是一个精致的工具。
但是,你是否也经常为手机里塞满了各种 App 而困扰?
为什么要在不同 App 之间来回切换?
为什么它们不能像我们的大脑一样,自然地协同工作?"
近日,我参加了火山引擎 Force 冬季大会
在 COZE 1.5 的演讲,
我看到 AI 时代 AI 应用平台,
下一代 APP Store 新范式。
字节对扣子的描述是:新一代 AI 应用开发平台
但我觉得,字节的野心不止是应用开发平台,
因为,我倔强认为,
未来,人人都是 AI 创作者,
亦是 AI 的协作者。
包括,演讲者开篇举例几岁开始用
COZE 实现了自己的 AI 应用的封装。
所以,就有以下更新。
扣子上现在可以开发和发布拥有完整前后端的 AI 应用,本期支持发布为 API、扣子商店、模板,未来开发 API、Web SDK 可以期待更多发布渠道的上线。
未来你可以把你设计 AI 工作流封装到你的应用,包括硬件终端。
以一个具体场景展现:
我打开笔记本,登入扣子平台。她的眼前是一个干净的开发界面。
# 前端界面:一个简单的AI写作助手
@app.route('/')
def index():
return render_template('index.html')
# 后端逻辑:处理用户输入并调用AI
@app.route('/generate', methods=['POST'])
def generate_text():
user_input = request.json['prompt']
response = ai.generate(user_input)
return jsonify({'result': response})
完成后,她看着部署选项:
点击部署,几秒钟后系统提示:"部署成功!"
我打开扣子商店,自己的应用已经安静地躺在那里,等待被发现和使用。
未来,接口进一步开拓。
扣子开发工具中增加了 UI Builder,一口气更新了 17 个 UI 组件,终于不再只有一来一回的对话式交互了!可以期待一波移动端适配的组件!
比如:
就是我们设计的 AI 工作流产品可以更可视化,人性化了
可直接搭建 H5/小程序类移动端页面,并直接托管发布到微信小程序和抖音小程序
扣子工作流中增加了知识库写入能力、SQL 查询数据库能力、知识库查询时的查询改写和结果重排开关。
这些场景可以更好地实现了:
丰富的多模态模型,今天新发布的豆包·视觉理解模型、豆包文生图 2.1 和 豆包音乐模型,在扣子都能通过插件的方式第一时间体验到,期待接下来会有一大批有意思的多模态 AI 应用在扣子诞生!
优势点:
信息输入输出增加了图片信息和声音信息,
声音可以是你的克隆声音
这时候,各种老师,家长们有福了
💡
一个场景:未来 2025 年深圳某智能硬件展区。
小王正在演示他们的新产品:一个小巧的办公桌面音箱,顶部有个呼吸灯在柔和地闪烁。
"看这里,"他指着音箱背面的接口,"Type-C 供电,3.5mm 音频输出,还有这个..."
他手指点了点一个带有特殊标识的端口:"扣子硬件认证接口。任何通过认证的 AI 模块都能即插即用。"
展台上,几个不同形状的 AI 模块整齐排列:
离线语音识别模块
实时翻译模块
本地大语言模型模块
"插上去就能用,"他拿起一个模块,"不需要联网,也不用担心数据安全。企业可以根据需求随时更换。"
旁边的显示屏正播放着演示:一位员工对着音箱说:"帮我总结下午会议的要点。"呼吸灯闪了闪,音箱开始用自然的语气复述会议内容。
"未来这个端口会成为标准配置,"小王说,"就像 USB 一样普及。"
他打开手机里的扣子硬件开发平台,上面显示着最新的模块认证指南。
平台,用户,交互端,交互方式,创造方式,分发模式
平台,用户,交互端,交互方式,创造方式,分发模式
不是软件吞噬硬件,
也不是硬件吞噬软件,
是一个
从软硬协同到 AI 流程,
从编码到提示工程,
从下载到即时使用。
早上醒来,你说:'帮我规划今天的行程。'
这个简单的请求会触发什么?
过去:
你需要打开日历 App 查看安排
打开地图 App 查看路线
打开天气 App 查看预报
打开邮件 App 确认会议...
现在:
AI 助手直接整合所有信息
理解你的习惯和偏好
主动提供完整的建议
随时根据变化调整方案
也许有一天:
我们不再区分什么是应用,什么是平台
不再关心某个功能在哪里,
只需要表达我们想要什么,
然后看着它自然地实现,
"这个愿景可能看起来很理想化,
但技术的发展往往比我们想象的更快。
这是正在发生的改变。
文章来自于微信公众号“纵所周知101”,作者“纵所周知101”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales