前字节产品高管拿到数千万元 Pre-Seed 轮融资,锦秋、百度风投押注 Life Agent
前字节产品高管拿到数千万元 Pre-Seed 轮融资,锦秋、百度风投押注 Life Agent维塔流动宣布完成数千万元人民币 Pre-Seed 轮融资,由锦秋基金领投,百度风投跟投。所募资金将主要用于产品研发与市场推广。旗下产品 Jovida 定位面向 C 端用户的主动式 Life Agent,围绕个人生活场景,帮助用户完成从目标感知、路径规划到行动执行的闭环。
维塔流动宣布完成数千万元人民币 Pre-Seed 轮融资,由锦秋基金领投,百度风投跟投。所募资金将主要用于产品研发与市场推广。旗下产品 Jovida 定位面向 C 端用户的主动式 Life Agent,围绕个人生活场景,帮助用户完成从目标感知、路径规划到行动执行的闭环。
a16z Speedrun SR006里有60家公司,57%做B2B。只有一家做Audio。我们和它的创始人Artin聊了45分钟,发现它踩中的东西比看起来大得多。SUN — AI-native audio learning, built around youAI让音频内容的生成成本暴跌80倍,但没有人把这件事变成一个主动为你服务的消费级学习产品
做过 AI 视频的都懂,除了 Seedance 2.0 本身的高定价,废片所烧掉的 token 算力也是一笔不小的开支。但在 Topview 平台,直接把这笔最大试错成本给重新定义了!热门视频生成模型 Seedance 2.0,加上最新的图片生成模型 Image 2,订阅 Ultra Plan,可不限量使用。
哈尔滨工业大学(深圳)等机构的研究者提出了 ReBalance 方法,并首次系统性引入 Balanced Thinking 这一新视角。该工作的核心观点明确:高效推理的关键并非盲目压缩推理长度,而是在过度思考与思考不足之间维持动态平衡。
就在这两天,GitHub和Hugging Face社区上线了一枚医疗大模型领域的“核弹”。全球规模最大、性能最强的医疗视频理解大模型——uAI Nexus MedVLM(中文名:元智医疗视频理解大模型)开源!
从单幅图像恢复三维结构,到多视图场景建模、动态 4D 重建,再到机器人、自动驾驶、SLAM 与视频生成,如何让模型在不依赖逐场景优化的前提下,直接、高效地理解并重建三维世界,正在成为 3D 视觉领域的
弹性 AI 预训练已经推进到了下一个前沿!没有意外:来自谷歌。据介绍,他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术,能够利用全球各地的异构硬件进行训练,并且即使当硬件发生故障时,系统也不会停止运行!
就在今天,AI机器人初创Medra正式发布美国规模最大的AI全自动自主实验室ML001。这座实验室不到90天建成,占地3.8万平方英尺,配备数百台机器人,全天候不间断运行。
阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。该模型面向语音转写与长音频处理场景,在架构上引入Multi-Token Prediction(多Token预测)以提升推理效率,并通过扩展上下文窗口强化长内容识别能力。
在游戏 NPC、虚拟主播、在线客服等数字人对话场景中,倾听时的 “扑克脸” 问题一直是行业长期痛点 —— 虚拟人说话时口型可以做到精准同步,但倾听时却表情僵硬、毫无反应,严重影响对话的自然感和沉浸感。盛大 AI 研究院(东京)与东京大学联合提出 UniLS(Unified Listening and Speaking),首个仅凭双轨音频即可端到端同时驱动说话和倾听面部动作的统一框架。