ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

10704点击 2025-01-21 22:57

ShowMeAI周刊 No.15

1. 自由画布类 AIGC 工具：从近期新品（更新）窥见发展趋势——自律才能给我自由

2. 图像 & 视频多主体一致功能：模型上下文能力的重要体现，未来各家模型的标配

3. 指定 AI 生图里的文字，我找到了 9 种解决方案，其中有 2 种快过时了

4. AI for Science 最近高频出现在公众视野：是时候回顾一下 Biotech 顶级公司的成长路径

5. Minimax 转向开源，零一万物在开源折戟：回顾两家创始人的重要采访，复盘各自发展轨迹

6. 如果比尔·盖茨没有撒谎：GPT-4 已经到达了生成式 AI 能力的天花板？

自由画布类 AIGC 工具：从近期新品（更新）窥见发展趋势——自律才能给我自由

自由画布，是一类 AIGC 创作工具的统称：它们都有一个高度自由的创作平台，允许上传/拖拽/组合等自由的创作方式，整体上基于 AI 构建 WorkFlow 并生成内容（图文、音乐、设计、虚拟世界、运行程序等）。

ChatGPT 问世之后，人类与 LLM 的交互长时间被约束在一维的、线性的文本对话框里，直到「自由画布」工具的出现让我们眼前一亮。

ShowMeAI 周刊整理了近期发布（更新）的一批「自由画布」类创作工具，并从中感受到了全球开发团队的敏锐嗅觉。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Refly

Refly 是一款国产应用，集成了「知识库 + 自由画布 + AI搜索 + 内容编辑」等功能，可以覆盖主题搜索、思维拓展、在线文档、文本优化等完整创作链条的每一个环节。

而且，画布中的每个内容节点，都有丰富的编辑功能，比如复制、添加为上下文、问答、节点选中功能等等。而且，节点内容可以一键复制到右侧的在线文档里，并支持继续进行编辑和文本优化。这都是 Refly 显著差异化之处。

也就是说，Refly 是一个全站式的文本创作工具。

平时，借助 AI 写点东西，需要在多款工具之间来回切换，比如用「秘塔」搜索、用「Kimi」优化，最后复制到「飞书」文档里。而现在，Refly 这一个工具就同时满足了所有需求。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

flowith 2.0

flowith 是一款出海应用，上周发布了最新的 flowith 2.0 版本，并彰显了更大的野心——成为订阅制 AI 知识社区。这就使得 flowith 在具备 Refly 几乎所有功能的基础上，还有很多「别出心裁」的设计：

✦ 知识库（Knowledge Garden）允许自行上传制作并发布，还可以自由添加（或购买）他人已经发布的知识库。这是 AI 付费订阅知识社区最基本的雏形。

✦ 内容编辑器（AI Composers）有 Markdown、图片编辑器、代码编辑器、实时语音聊天等几种不同的模式。

✦ 继承并优化了 flowith 1.0 版本的交互设计，尤其是 Agent 功能设计（包括 Project 功能、Oracle 模式、Agent Community等）得到了强化，以及依旧流畅酷炫的对话模式（包括插件模式、比较模式、图片/视频生成模式等）。

✦ 团队协作允许邀请外部协作者评论、共同编辑当前 Flow。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

FunBlocks AIFlow

FunBlocks 是一个效率工具集成平台，集成了 AI Graphics（绘图）、AI Mindmap（思维导图）、AI Slides（演示文稿）、AI Youtube Summarizer（视频总结）等等多款 AI 应用。

FunBlocks AIFlow 是平台内一款自由画布类工具，近期更新后变得更加好用了！

输入探索主题后，AI 会将其自动拆解成不同模块，并支持每个节点的深度编辑（包括外观设置、节点组合、内容编辑、内容可视化、生成文章等）。而且！FunBlocks AIFlow 还支持自由节点上传链接、图片、视频、笔记、任务列表等多种内容形式，对于多模态交互需求非常友好~

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

百度文库 ● 自由画布

2024 年 11 月，李彦宏在「百度世界大会」上宣布了「自由画布」这款产品，直到近期才陆续放开内测申请，等了将近两个月

与其他自由画布类工具对比，这款产品最显著的特点就是，打通了「百度网盘」和「百度文库」这两款产品：网盘可以作为资料的输入与输出接口，文库则支持多样的内容生成样式（图片、文本、PPT、脑图、报告等等）。

U1S1，百度文库（https://wenku.baidu.com）最近推出的几款 AI 产品，包括 AI 全网搜、智能 PPT 等，的确表现还可以（不是顶尖但有亮点）。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Midjourney Patchwork

Patchwork 是一款集成了语言模型、图像生成和无限画布功能的创意协作平台，简单说就是帮助小说、游戏、艺术创作者们快速创建一个虚拟世界。

得益于 Midjourney 出色的文生图能力，Patchwork 能快速构建出逼真的故事背景 & 角色设定。登录进入大厅（lobby）后，看到的各个沙盒（sandbox）就是众多虚拟世界的传送门；或点击左侧工具栏 portal 则可以创建自己的虚拟世界，目前编辑能力已经非常丰富且完整。

Midjourney Patchwork 是我（目前）见过最好的无限画布类 AI 应用：场景明确、功能完整、工具丰富、交互酷炫。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Eapy

Eapy 把自由画布形式与 AI Music 进行了结合，可以把用户上传的图片、音频、视频、文本等素材，生成为音乐片段（包括和弦、人声旋律、乐器伴奏等），支持 MIDI 和 WAV 文件，并且已经支持多人协作。

测试下来，Eapy 的音乐生成能力目前介于开源模型和 Suno 之间，更适合作为一款灵感收集和记录工具，方便后续进行深度创作。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

ResearchFlow

ResearchFlow 则把自由画布与学术研究进行了结合，可以基于用户输入的主题进行 AI 学术搜索、生成文本介绍并附上参考文献。

与其他学术类 AI 搜索工具不同的是，ResearchFlow 在右侧生成了完整的思维导图。用户可以与每个内容节点继续深度交互（问答、编辑等），还可以打开论文并进行 AI 辅助阅读、截图问答等操作。最终，所有的交互结果，都可以导出成 PDF 等格式的文档。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

tldraw Computer

tldraw computer 支持用户在无限画布上通过连接组件来构建复杂的数据流&执行逻辑。

用户只需要将组件拖拽到画布上，再使用自然语言提示词来配置组件，就能控制工作流的运行顺序和逻辑；tldraw computer 则借助 Gemini 大模型理解用户的提示词并执行工作流。

实际操作非常实用&有趣，可以先通过 这篇教程 了解一下！

资料链接 ✦✦

Refly

网站 → https://refly.ai
教程 → https://docs.refly.ai/zh
发布 → https://x.com/tuturetom/status/1868585642529284566

flowith 2.0

网站 → https://flowith.io
发布 → https://x.com/DerekNee/status/1880111494702199260

FunBlocks AIFlow

网站 → https://app.funblocks.net
介绍 → https://www.funblocks.net/aiflow.html

百度文库 ● 自由画布

网站 → https://wenku.baidu.com/pcactivity/freeBoard

Midjourney Patchwork

网站 → https://patchwork.midjourney.com
教程 → https://updates.midjourney.com/patchwork-user-guide

Eapy

网站 → https://home.eapy.io

ResearchFlow

网站 → https://rflow.ai/zh
发布 → https://x.com/RFlowAI/status/1831963371769622937

tldraw Computer

网站 → https://computer.tldraw.com
发布 → https://x.com/tldraw/status/1869401069849379109

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Figma Jambot

2023 年 8 月，Figma 推出了一款由 ChatGPT 驱动的小组件 Jambot，旨在打破聊天框的限制，把 LLM 能力与可视化工具进行结合，让交互更自由和直接

这款诞生于 Figma 内部 Hackathon 的创意产品，成为今后自由画布类 AIGC 交互工具的滥觞。

Figma Jambot 的 Ideate、Quick question、Summarize、Give me 等功能设置，以及节点自由组合的交互形式，都深刻影响了后续产品的形态。

资料链接 ✦✦

Figma Jambot

网站 → https://www.figma.com
插件 → https://www.figma.com/community/widget/1274481464484630971/jambot

讨论交流 ✦✦

如果你是自由画布类 AIGC 产品的尝鲜用户，那么两三个月以前，用着 flowith、FunBlocks 的时候，你一定也感受到了同样的认知负担：

🙅‍♂ 思维发散出去很容易，但想收束回来就很难，找资料不是创造的瓶颈。发散思维时非常嗨，但是一旦到输出的时候，很难抓到自己想要表达的逻辑架构；如果已经被 AI 表达的内容定型了，就更难写了。就像挠痒痒一样，痒点到处跑，抓不住。

👨‍🎓 画布类产品，难的是在产品设计上降低认知负担。20 年前，我们就在用 onenote，那时的画布工具好用，是因为内容都是自己贴上去的，量不会超载。现在的画布一下子哐哐哐出现海量内容，而且还是多线程的。理想中很美，实际体验很受不了。

最近更新或发布的这几款产品，其实已经在实现上述提到的「降低认知负担」这个目标，主要方式有两种：① 明确使用场景（比如 Midjourney Patchwork - 创作、Eapy - 音乐、ResearchFlow - 学术），② 构建完整的 WorkFlow（比如 Refly、flowith 2.0、FunBlocks AIFlow）。

使用场景 & 工作流，就像「自由画布」空白区域上的两条平行线，帮助创作者划定了基本方向，有效减少了漫无目的的信息爆炸带来的认知负担。

你可以带着这个观察，回看上方几款产品，可以感受到这股集中且明显的产品演进趋势。全球的开发者们都很敏锐，也很聪明，找到了更好的实现方案。

图像 & 视频多主体一致功能：模型上下文能力的重要体现，未来各家模型的标配

主体一致，是指在生成图像或视频时，主要对象/场景/主题等与给定的参考图片保持一致。

视频主体一致功能，由 Vidu 于 2024 年 9 月全球首发，随后 Pika 在 2024 年 12月跟上，Minimax 海螺前几天也宣布了同类型功能上线。图像主体一致功能，目前完成度最高的是 Google Whisk。

ShowMeAI 周刊简要介绍这几款产品 / 模型。未来一段时间，我们应该会看到各家陆续上线同类型功能。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Vidu

2024 年 9 月发布时，还只支持单主体一致（只能上传一张图片）。目前，官网已经支持多主体一致（可以上传三张图片），即可以指定生成图片中的人物、物体、场景等。官网称之为「参考生视频」功能

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Pika 2.0

Pika 2.0 支持多主体一致，Scene Ingredient（场景元素）系统能将多个输入图像（如场景、人物、物品）智能整合为连贯的动态场景。此外，模型也具备多图像融合能力，可实现复杂交互场景的视频合成，如两人在视频中实现合影或拥抱。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Minimax 海螺

MiniMax S2V-01 视频模型目前支持单主体一致，上传一张图片（人物图像），即可根据提示词生成细节精确的视频

相较于 LoRA方案，主体参考既降低了用户的输入成本，也把计算成本降低到百分之一以下，等待时间也大幅减少，使用体验翻倍提升。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Google Whisk

Whisk 是一款图片生成工具，支持多主体一致，包括主题（subject）、场景（scene）和风格（style）等元素。

用户上传多张图片后，Gemini 模型会自动为图片生成详细的描述，并将其输入到最新版本的 Imagen 3 模型中。生成的图片在遵循提示词的同时，与给定的多个主体能保持一致。

资料链接 ✦✦

Vidu

网站 → https://www.vidu.cn
教程 → https://pkocx4o26p.feishu.cn/docx/Mb77dt8VxoskqvxgFiMcfwwsnNe

Pika Labs

网站 → https://pika.art
发布 → https://x.com/pika_labs/status/1867651381840040304

Minimax 海螺

国内 → https://hailuoai.com/video/create
海外 → https://hailuoai.video/create

Google Whisk

网站 → https://labs.google/fx/tools/whisk
发布 → https://blog.google/technology/google-labs/whisk

讨论交流 ✦✦

生数科技的 CTO 鲍凡在接受极客公园采访时，对 Vidu 在主体一致性方面取得的进展进行了详细介绍。如果对模型层面的技术原理感兴趣，推荐看看访谈原文 ↓↓↓

👨‍🎓 一致性是「上下文能力」的一个重要体现。具体来说，模型能够灵活理解多张图片作为输入，可以将多个主体、多个特征之间的关系作为上下文进行记忆和关联。基于这些输入前提，模型能够个性化调整自己的表现，从而产生相应的视频生成能力。

随着上下文能力的增强，我们甚至可以支持音频模态，不仅能记录人物的外貌，还能保持声音特征的一致性，这些都可以自由指定。

视觉输入作为上下文，可以接收各种内容，从而影响视频生成的行为。我们内部也把它叫做多模态提示词，从纯文本的提示词，变成文本、视觉、音频，这些模态都可以作为提示词。

⋙ 极客公园 X 生数科技

指定 AI 生图里的文字，我找到了 9 种解决方案，其中有 2 种快过时了

ShowMeAI 社群里，最常被问到的需求之一，就是怎么把指定文字嵌入到 AI 生成的图片里。

本期周刊系统整理一下清单。有时间我们可以继续做个横评？看看各种场景下最靠前的工具选项。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Midjourney

Midjourney v6 版本开始支持文字效果。主要支持英文，中文支持有限

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Ideogram

Ideogram 以图片嵌入文字能力闻名，Ideogram 2.0 模型能力得到了进一步加强，支持复杂文本和多种艺术风格，并且文字与图像能够自然融合。支持英文（中文提示词可自动翻译为英文）。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Recraft

Recraft V3 开始支持文本渲染能力，是目前「唯一」能在图像中生成「长文本」的模型。支持精确的文本位置控制，支持图像编辑功能，支持矢量图生成。支持英文，中文渲染能力较弱。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Flux

FLUX.1 是一款高质量的开源图像生成模型，支持复杂指令，支持文本渲染，支持图像编辑，生成图像的质量很高。主要支持英文。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

即梦AI

2.1 模型一鸣惊人，对中文的支持非常优秀（也支持英文）！不仅可以指定生成图像里文字的字号、字体、颜色和位置，还可以指定画风，并进行图像编辑。

除了官网之外，即梦 AI App 和豆包 App 都可以使用

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

阶跃星辰

跃问 App 的实现方式有点特别，指定了几类「生成海报」的场景：文字封面、指定图文、词语新解、抽象文学、祝福模板。只需要输入主题，系统会自动生成图片和匹配的文字。

此外，阶跃近期发布的 Step-1X-Medium 模型，也宣布支持在图片中加入英文文字

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Text Behind Image

Text Behind Image 是前段时间小火一把的工具，可以在图片主体与背景之间加上文字，瞬间提升画面质感。文字的文本、字体、字号、颜色、位置等都可以调整。

官方网站有点难进（有时候加载不出来），我平时一般在「302.AI - AI 图片工具箱 - 添加背景文字」这里使用这项功能。链接统一放在下方了。

资料链接 ✦✦

Midjourney

网站 → https://www.midjourney.com

Ideogram

网站 → https://ideogram.ai
发布 → https://x.com/ideogram_ai/status/1826277550798278804

Recraft

网站 → https://www.recraft.ai
发布 → https://x.com/recraftai/status/1851757270599664013

Flux

网站 → https://blackforestlabs.ai
使用 → https://replicate.com/black-forest-labs , https://fal.ai/flux
使用 → https://www.krea.ai , https://302.ai

即梦AI

网站 → https://jimeng.jianying.com
App → 即梦AI / 豆包

阶跃星辰

网站 → https://platform.stepfun.com/docs/guide/image_generate
App → 跃问

Text Behind Image

官网 → https://textbehindimage.rexanwong.xyz
渠道 → https://302.ai/tools/pictool/

讨论交流 ✦✦

OpenAI DALL·E 也支持简单的英文，但是性能比较一般。

阿里云 AnyText 支持中文和英文，曾经还小火了一把。不过官方告知即将下架。

链接 → https://github.com/tyxsspa/AnyText

阿里云 → https://help.aliyun.com/zh/dashscope/developer-reference/tongyi-wanxiang-api-for-anytext

AI for Science 最近高频出现在公众视野：是时候回顾一下 Biotech 顶级公司的成长路径

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Google DeepMind

2024 年 11 月底，Google DeepMind 发布了一份长篇报告《A new golden age of discovery: Seizing the AI for Science Opportunity》，指出 AI 正在推动科学研究的革命性变革，将开启 AI for Science 的黄金时代。

Google DeepMind 在这份报告中强调了 AI 在五大领域的机遇，并详细分析了实现方式和潜在的风险：

Knowledge（知识）：改变科学家吸收和交流知识的方式
Data（数据）：生成、提取和标注大型科学数据集
Experiments（实验）：模拟、加速复杂实验并为其提供信息
Models（模型）：构建复杂系统的模型并分析其组件间的相互作用
Solutions（解决方案）：在广阔的搜索空间中寻找问题的新解法

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

Sam Altman

2025 年 1 月初，Sam Altman 在个人博客发文，回顾了 OpenAI 发展历程和关键事件，并明确指出：已经知道如何构建通用人工智能（AGI），相信 2025 年可能会看到首批 AI 智能体「加入劳动力市场」。

而关于科学研究的部分，Sam Altman 表示：OpenAI 开始将目标扩展到更远的地方，朝着真正意义上的超级智能迈进。超级智能工具将能够大幅加速科学发现和创新，远远超出我们单独的能力，从而极大地增加富裕和繁荣。

We are beginning to turn our aim beyond that, to superintelligence in the true sense of the word. .…… Superintelligent tools could massively accelerate scientific discovery and innovation well beyond what we are capable of doing on our own, and in turn massively increase abundance and prosperity.

资料链接 ✦✦

Sam Altman → https://blog.samaltman.com/reflections

⋙ 中文翻译版本

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

投资机构 Pear VC 在 2024 年 6 月份发布了一篇研究报告《Biotech Behemoths in Review》，研究了过去 15 年里 Top 50 的 Biotech 公司（北美和欧洲），详细分析了这些公司的产品分布、创始人背景、资本来源、核心驱动力、财务回报等。

如果你对最近高频出现的 AI for Science 感兴趣，或者想了解 Biotech（生命科学）领域顶级公司的发展路径，可以看看 Pear VC 这份报告。

资料链接 ✦✦

Biotech Behemoths in Review → https://pear.vc/biotech-behemoths-in-review/

⋙ 报告分析（中文翻译版本）

讨论交流 ✦✦

Anthropic 联合创始人兼 CEO Dario Amodei 在今年 10 月分享了他对 AI 如何显著改变人类社会的看法，其中他对生物学和神经科学领域的发展潜力最为期待。

他预测，Powerful AI 支持的生物学、神经学研究将大幅加速，未来 50-100 年的进展可能被压缩到 5-10 年内完成。

👨‍💻 我们处于「压缩的 21 世纪」：“随着 Powerful AI 的出现，我们或将在几年内实现原本需要整个 21 世纪才能达到的生物学和医学突破”。

⋙ Dario Amodei 访谈（中文翻译版本）

Minimax 转向开源，零一万物在开源折戟：回顾两家创始人的重要采访，复盘各自发展轨迹

2025 年 1 月，阿里云与零一万物成立联合实验室，零一万物大部分训练和 AI infra 团队加入该实验室，成为阿里员工。零一万物不再进行超大模型预训练。

这是中国第一起大模型创业独角兽被大厂「收编」的案例。李开复也是第一位公开表示「不再追求 AGI」的独角兽创业者。

这件事在国内 AI 圈引起了不小的震荡。

虽然最近几个月，各种传闻不绝于耳。但是，真的听到一位富有经验的创业者在采访中承认一切，还是感到深深的震撼，以及更深的迷茫。

也是有感于此，我批注完成了这篇 ⋙ 朱啸虎叫板，大模型落泪｜批注在变局之下，尝试在 2024 年已经发生的事里，找一找关于未来的答案。

但是未来没有答案。

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

写文整理资料的过程中，回顾了李开复老师近期的所有访谈。放在一起看，能有很多有意思的发现，比如：

✦ 李开复集中出现在媒体报道里的时间点，基本都是零一万物关键大模型的发布前后，可谓兢兢业业「带货」。

✦ 对于尖锐话题，李开复和零一万物一般都会直接回应，给公众一个明确的解释，这点很拉好感。

✦ 对于某家公司的判断、某项决策的利弊分析、某项技术的原理解释，李开复的发言非常值得一听 👍

以下是重要访谈的发文时间与阅读链接（时间倒序） ↓↓↓

零一万物大部分训练和 AI infra 团队被阿里收编

零一万物发布 Yi-34B和Yi-6B

零一万物发布 Yi-Lightning

零一万物发布 Yi-Large

讨论交流 ✦✦

零一万物比较「出圈」的负面消息有两条，一是所谓的「套壳」谣传，另一个是「刷榜」行为。

官方公众号都正式发文进行了回应，同时进行了详细的技术科普，而且科普内容质量很高。这种积极回应尖锐话题的态度，的确值得肯定和学习。

⋙ 零一万物对 Yi-34B 训练过程的说明

⋙ 关于大模型评测的 Yi 点思考｜Young Genius

⋙ 零一万物模型训练负责人黄文灏：Scaling Law 公式仍在指导模型训练，高质量数据不可或缺

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

上周，Minimax 宣布 ⋙ MiniMax-01 系列模型开源，并在晚点的采访中表示：如果重新选，第一天就应该开源。因为开源能加速技术进化。

他这次访谈，颠覆了曾经的认知和路线，非常直率和坦诚。中国最一线的大模型创业者的思考，绝对值得一读 ↓↓↓

2025.1 ⋙ 晚点对话 | 晚点对话 MiniMax 闫俊杰：创业没有天选之子

以下是其他重要访谈的发文时间与阅读链接（时间倒序） ↓↓↓

2025.1 ⋙ 云启资本 | 云启对话MiniMax闫俊杰：回望2024，AI创业的变与不变

如果比尔·盖茨没有撒谎：GPT-4 已经到达了生成式 AI 能力的天花板？

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

也是在筹备 ⋙ 朱啸虎叫板，大模型落泪｜批注在变局之下 这篇文章的过程中，我发现了一个非常有意思的观察视角：比尔·盖茨，微软的创始人和前掌门人，曾经的美国科技界领军人物，一直在参与 AI 话题讨论并发布在个人网站上。

如果他能获取到真实的信息，如果他没有撒谎，那么我们是否能从他过去两年的交谈里，发现一些曾经被忽略的「真相」呢？

比如，2023 年 10 月，Bill Gates（比尔·盖茨）在接受德国商业报纸 Handelsblatt 访谈时表示，GPT-4 已经到达了生成式 AI 能力的天花板。

There are "many good people" working at OpenAI who are convinced that GPT-5 will be significantly better than GPT-4, including OpenAI CEO Sam Altman, Gates says. But he believes that current generative AI has reached a ceiling - though he admits he could be wrong.

2023.10

Bill Gates does not expect GPT-5 to be much better than GPT-4 → https://the-decoder.com/bill-gates-does-not-expect-gpt-5-to-be-much-better-than-gpt-4

以下是比尔盖茨最近两年与 AI 有关的公开发言（时间倒叙），个人博客都有记录，官方公众号一般也都有翻译成中文 ↓↓↓

2024.1

My conversation with Sam Altman → https://www.gatesnotes.com/Unconfuse-Me-podcast-with-guest-Sam-Altman
⋙ 我与萨姆·奥尔特曼的对话 | 盖茨播客

2023.11

Breaking down the science of AI with Yejin Choi → https://www.gatesnotes.com/meet-bill/my_podcasts/reader/
⋙ 与崔艺珍一起解读人工智能科学 | 盖茨播客

2023.11

AI is about to completely change how you use computers → https://www.gatesnotes.com/AI-agents
⋙ 人工智能将彻底改变你如何使用电脑 | 盖茨笔记

2023.8

Can AI help close the education gap? Sal Khan thinks so → https://www.gatesnotes.com/meet-bill/my_podcasts/reader
⋙ 人工智能能助力缩小教育差距吗？萨尔·可汗表示赞同 | 盖茨播客

2023.7

The risks of AI are real but manageable → https://www.gatesnotes.com/The-risks-of-AI-are-real-but-manageable
⋙ 人工智能的风险真实存在，但风险可控 | 盖茨笔记

2023.4

⋙ 一场涉及教育、技术和几乎所有领域的炉边谈话 | 盖茨笔记

2023.3

The Age of AI has begun → https://www.gatesnotes.com/the-age-of-ai-has-begun
⋙ 人工智能时代已经开始 | 盖茨笔记

2023.1

Climate change, AI, and more from my latest AMA → https://www.gatesnotes.com/2023-Reddit-AMA
⋙ 气候变化，人工智能以及更多“问我任何事” | 盖茨笔记

文章来自微信公众号 “ ShowMeAI研究中心 “，作者 ” 南乔River “

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题：自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

关键词: ShowMeAI , AI周报 , AI , AI新闻

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址：https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装：https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体，能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址：https://github.com/hitsz-ids/airda

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/

Flux

【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目，该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目，效果堪比midjourney。
项目地址：https://github.com/black-forest-labs/flux
在线使用：https://fluximg.com/zh

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales