他给普通人配了个 “AI 剧组”丨100 个 AI 创业者
他给普通人配了个 “AI 剧组”丨100 个 AI 创业者“帮助全世界 40 万人成为导演,这种成就感,比我自己拍一部电影要大得多。”
“帮助全世界 40 万人成为导演,这种成就感,比我自己拍一部电影要大得多。”
键盘作为人机交互的主要工具,实质上是一个巨大且不自然的「输入、输出瓶颈」。在「后键盘时代(post-keyboard future)」,语音或许才是最好地交互方式。
继今年5月提出MeanFlow (MF) 之后,何恺明团队于近日推出了最新的改进版本—— Improved MeanFlow (iMF),iMF成功解决了原始MF在训练稳定性、指导灵活性和架构效率上的三大核心问题。
如果不是这波大模型的爆发,没人会想到「输入法」这个早已被视为「基础设施」的赛道,会在 2025 年下半年突然变得性感起来。
国内领先的 AI 资产管理平台「无破科技」宣布完成数千万元 Pre-A和Pre-A+ 轮融资,分别由险峰长青和苏州国资投资,心流资本FlowCapital担任本轮和长期财务顾问 。融资资金将主要用于AI资产管理智能体的深化研发、产品迭代和市场拓展,真正实现企业资产的搜索、分析、处置的AI化,进一步巩固公司在债务重组与企业资产服务领域的核心竞争力。
前些天,一项「AI 传心术」的研究在技术圈炸开了锅:机器不用说话,直接抛过去一堆 Cache 就能交流。让人们直观感受到了「去语言化」的高效,也让机器之心那条相关推文狂揽 85 万浏览量。参阅报道《用「传心术」替代「对话」,清华大学联合无问芯穹、港中文等机构提出 Cache-to-Cache 模型通信新范式》。
最近半年,我阅读了业界关于 AI Agent 的工程实践:Anthropic 的 Context Engineering 论文、Manus 的工程分享、Cline 的 Memory Bank 设计等。同时自己也一直在做跟 AI Agent 相关的项目,如:Jta[1](开源的翻译 Agent,基于 Agentic Workflow)。
昨天测试了一款很拉跨的 AIGC 类产品,再也不用了。 我不清楚,为什么有些生成类的产品还在可劲强调生成能力,而不花心思做修改和编辑的体验。 一个项目做到九成,我们脑子里经常会冒出个错觉,好像离终点只
这不,Flowith最近也搞了个新东西:FlowithOS,全球首款专为AI Agent打造的操作系统,重点是Windows用户也能用,终于不是Mac专属了:它的最大特点是:虽然长得像浏览器,但干的却是执行的事儿,能让Agent自己动鼠标、跑流程、干活。
目前,GRPO 在图像和视频生成的流模型中取得了显著提升(如 FlowGRPO 和 DanceGRPO),已被证明在后训练阶段能够有效提升视觉生成式流模型的人类偏好对齐、文本渲染与指令遵循能力。