
速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频
速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型,该公司宣称这是市场上速度最快的模型,且效率高到足以在智能手机上运行。
AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型,该公司宣称这是市场上速度最快的模型,且效率高到足以在智能手机上运行。
在Google I/O(谷歌开发者大会)前夕,谷歌全球安卓团队的核心成员们,提前组织了一场全球媒体沟通会,剧透了安卓系统的未来新动向。科技行者TechWalker受邀参加了此次活动。
昨晚的文章里,我介绍了一个 12 人团队做的 AI 社交伴侣产品做到 3000 万美金 ARR,它主要通过 AI 的能力释放了年轻人的娱乐和创作体验《12 个人做的 AI 社交产品 ARR 破 3000 万美金,Perplexity 最新估值 140 亿美金》。
最近ContextGem很火。它既不是RAG也不是Agent,而是专注于"结构化提取"的框架,它像一个"文档理解层",通过文档中心设计和神经网络技术(SAT)将非结构化文档转化为精确的结构化数据。它可作为RAG的前置处理器、Agent的感知模块,也可独立使用。
OpenAI奥特曼:DALL·E先于ChatGPT,未来聚焦智能体与编程核心。
流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能,已成为图像生成(Stable Diffusion, Flux)和视频生成(可灵,WanX,Hunyuan)领域最先进模型的训练方法。然而,这些最先进的模型在处理包含多个物体、属性与关系的复杂场景,以及文本渲染任务时仍存在较大困难。
OpenAI发布新基准HealthBench,联手60个国家262名执业医生,树立新的「AGI标志性用例」。OpenAI o3碾压Grok 3和Gemini 2.5 Pro,成功登顶。而最强AI几乎达到了人类医生最佳水平!
当训练成本飙升、数据枯竭,如何继续激发大模型潜能?
帕兰泰尔(Palantir Technologies)向美国陆军交付首批AI驱动的战场情报车,标志着软件主导的军事技术进入新阶段。战术情报目标访问节点(TITAN)系统是价值1.78亿美元合同的成果,该移动式指挥单元旨在优化目标锁定与决策流程。
近年来,生成式人工智能(Generative AI)技术的突破性进展,特别是文本到图像 T2I 生成模型的快速发展,已经使 AI 系统能够根据用户输入的文本提示(prompt)生成高度逼真的图像。从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型,这一领域的技术迭代呈现出加速发展的态势。