深度丨"缅因猫"背后的AI-Native研发实验:10人00后团队,2个月交付22B流式音视频模型
深度丨"缅因猫"背后的AI-Native研发实验:10人00后团队,2个月交付22B流式音视频模型2026年的AI视频生成赛道,已经拥挤到连空气都变得稀薄。
搜索
2026年的AI视频生成赛道,已经拥挤到连空气都变得稀薄。
深度长文分析!对AI原生游戏的探索!超长文章超多古法手搓!!
我们最近在重新思考一件事:到底什么样的 Benchmark,才值得今天继续做?
当AI神话被账本照亮,最刺眼的真相终于浮出水面。退潮时刻,狂欢结束。探照灯打过来,谁在裸泳,一目了然。
AI智件独家获悉,智能硬件公司「炎途智能」于近期获得新一轮融资,投资方为阿尔法公社。与此同时,公司的业务也由此前的NAS设备延伸至近两年大热的AI影像,并推出了AI拍立得产品。
自从AI爆发以来,所有人都在追问同一个问题:AI时代的护城河到底是什么?
每月一两千,把数字员工用到起飞。
Claude Code之父删掉IDE,并表示以后只写循环,不再写提示词了:你苦练两年的提示词工程,真要被一夜干掉了吗?
具身智能领域的资本,正在涌向机器人的“大脑”。
公告显示,“妙时”(含AI奇遇)将于7月14日0时正式停止运营。目前,平台已停止新用户注册、充值及会员购买等服务。停运后,“妙时”将全面关闭所有功能。用户账号中剩余的妙时币、曲奇币、电波及会员费用,可于8月14日前通过邮件申请退款。
AI 教育创业里,最容易做成的产品,就是上传资料,生成笔记、题目和闪卡。这类产品很多,包括我们之前介绍过的 StudyFetch、NotebookLM、Quizlet、Knowt、Anki 的 AI 插件,都在解决类似问题。
GPT-5.6 Pro 泄露炸场:推理能力涨 25%、知识截止推至 2025 年 12 月、3D 生成碾压 Fable,一句话 48 分钟在聊天框里直接跑出完整《模拟人生》。
最近,一位Reddit老哥手搓了一个《魔兽世界》私服——里面活跃着1800个AI玩家,而且全都接入了DeepSeek API,能像真人一样聊天、组队、于是,暴风城的聊天频道突然变成了DeepSeek广场,画风大概是这样的:
就在最近,OpenAI扔出一篇重磅论文。他们发现,只教AI好好看病,它写代码居然也不作弊了。方法简单到离谱:拿5%的训练数据,教模型在回答健康问题时诚实、谨慎、知错能改。
刚刚, OpenAI、Google DeepMind、Anthropic三大AI巨头CEO与G7领导人在法国阿尔卑斯山共进工作午餐,历史首次。上一次这些领导人坐在一起,讨论的是二毛、中东、全球供应链这些问题。现在AI公司的CEO被请到了同一张桌子上。
硬氪获悉,AI厨房机器人品牌「栗上LISSOME」(以下简称“栗上”)近日完成数千万元人民币A轮融资。本轮融资由红杉中国、Brizan Ventures领投,老股东及HKX等机构跟投。此前,栗上已累计获得来自李泽湘教授的清水湾基金、高秉强教授、挑战者资本、高锋耐心资本、XbotPark宁波基地等机构的数千万元融资。
第一款AI原生健身硬件,究竟该长着一副怎样的面孔?!他试图向那些明知道该流汗、却总能找出一万个借口逃避的人出售一个名叫BodyPark的真人私教服务平台,以及一款叫做 ATOM的口袋AI私教机——BodyPark 刚推出的全新智能健身硬件。
OpenAI 的 tevfik 写了篇关于 loop engineering 的文章,开头那句我读完顿了一下。他说,他和 coding agent 协作,到现在大多还是同一个流程:我解释一个任务,等结果,审一遍,再发下一条指令。代码是 agent 写的,但我在后台还干着另一份活——我记着发生了什么、决定下一步做什么、判断这事到底完成没。
AI画图巨头突然杀入医疗圈!60秒泡个澡就能完成全身扫描,0.5毫米精度碾压CT和MRI,4PFlops的算力怪兽,让医疗行业今夜无眠。最惊人的是,Midjourney的终极目标竟是延长人类寿命,消灭全球30%的死亡。
斯坦福胡佛研究所追踪了 DeepSeek 七篇论文背后 356 名研究者的完整职业轨迹。美国培养出的最优秀 AI 人才正在大规模回流中国,而中国本土管道已经能独立产出前沿模型的核心贡献者。
据悉,AI 推理芯片公司上海淬思科技有限公司(Trace Intelligence,以下简称“淬思”)近日完成孵化轮融资,砺思资本(Monolith)与启盈同创基金联合领投。本轮资金将用于首款面向智能体(Agent)推理的专用芯片研发与流片,以及核心团队扩充。
网购的快递被人偷了,联系客服,客服系统显示,预计等待时间 25 分钟。 换作以前,这意味着我们要么盯着聊天窗口发呆,要么开着网页干别的事,同时隔几分钟切回来看看排到没有,不然一不小心退出去又要重新排队
近期,在 LangChain 举办的智能体大会 Interrupt 上,吴恩达与 LangChain 创始人 Harrison Chase 进行了一场关于 AI Agent 的对谈。整场交流的核心并不是简单讨论 Agent 有多强,而是围绕一个更现实的问题展开:当 AI Agent 让软件开发变快之后,真正的瓶颈会转移到哪里?
近年来,大语言模型(LLMs)在长篇视觉叙事中展现出卓越潜力,生产方式正迅速从单一模型生成转向面向生产的智能体系统。但长视频剪辑仍然是一个极难控制的长期任务。模型有时会在缺乏素材依据的情况下强行生成,甚至在面对明显断档的转场或人物不一致时依然“盲目拼接”。
据最新独家爆料,谷歌目前正在紧锣密鼓地对即将发布的重磅大语言模型Gemini 3.5 Pro进行高强度的激进迭代,在正式揭晓之前,内部预计还会测试更多的版本。
2026 年 6 月 19 日,John Jumper 在 X 上宣布,自己将离开工作近九年的 Google DeepMind,在短暂休整后加入 Anthropic。随后,DeepMind CEO Demis Hassabis 也公开回复,感谢 Jumper 对 AlphaFold 和 AI for Science 的贡献。
我们相信,常驻型 (always-on) AI 助理的下一次飞跃,不在于把某一个模型单点调得更聪明,而在于扩展智能体的上下文 (Scaling Agent Context)—— 不断拓宽助理能够持续 "感知 — 推理 — 执行" 的范围,作为生活连接器连接用户的信息孤岛,直到它能接管用户的整个数字世界。
最近,谷歌连失两员大将。短短三天内,先是 Transformer 论文共同作者 Noam Shazeer 离开谷歌加入 OpenAI;紧接着诺贝尔奖得主、AlphaFold 负责人 John Jumper 转投 Anthropic 麾下。
来自西湖大学和香港中文大学(深圳)的团队沿着这一思路提出 Drifting Preference Optimization(DrPO),把漂移场用于单步文生图模型的偏好后训练。在 DrPO 中,奖励只负责对候选图像排序,不参与反向传播。具体而言,针对同一个文本提示词,当前模型生成一组候选图像。高分样本在特征空间中产生吸引,低分样本产生排斥,并结合参考模型约束给出模型的更新方向。
如今,CameraSquad 的出现,让这种多视角一致的视频生成与 3D 世界状态构建成为现实。近日,中国科学院大学高林研究员团队联合卡迪夫大学、香港科技大学和快手可灵团队,提出了一种面向多轨迹并行生成的相机可控视频生成方法 CameraSquad [1],相关论文已被 ACM SIGGRAPH 2026 录用。