AI问答,直接「拍」给你看!来自快手可灵&香港城市大学
AI问答,直接「拍」给你看!来自快手可灵&香港城市大学今天,来自快手可灵团队和香港城市大学的研究者们,正在尝试打破这一界限。他们提出了一个全新的任务范式——「视频作为答案」,并发布了相应模型VANS。而这项工作则开创性地提出了Video-Next Event Prediction任务,要求模型直接生成一段动态视频作为回答。
今天,来自快手可灵团队和香港城市大学的研究者们,正在尝试打破这一界限。他们提出了一个全新的任务范式——「视频作为答案」,并发布了相应模型VANS。而这项工作则开创性地提出了Video-Next Event Prediction任务,要求模型直接生成一段动态视频作为回答。
就在一周前,全宇宙最火爆的推理框架 SGLang 官宣支持了 Diffusion 模型,好评如潮。团队成员将原本在大语言模型推理中表现突出的高性能调度与内核优化,扩展到图像与视频扩散模型上,相较于先前的视频和图像生成框架,速度提升最高可达 57%:
最新PRBench基准可以测试AI在金融和法律领域的表现。结果显示,即使是顶尖大模型在处理复杂任务时也表现不佳,尤其在涉及重大经济后果的任务中。PRBench通过模拟真实场景和多轮对话,揭示了AI在专业领域的不足,强调开发更可靠AI系统的重要性。
一只原本对同伴毫无兴趣的雄性果蝇,会不会突然开始疯狂地向其他雄性求爱。这看起来有点荒诞不羁的场景,发生在了北京大学校友、美国斯坦福大学骆利群课题组博士后、即将于 2026 年回国入职西湖大学的吕程的实
专注推理任务的 Large Reasoning Models 在数学基准上不断取得突破,但也带来了一个重要问题:越想越长、越长越错。本文解读由 JHU、UNC Charlotte 等机构团队的最新工作
“我曾经花了5个月,做了一款没人用的大模型。”去年4月,刘天强期待拿下美国一家快时尚零售公司的大单,为对方开发一款用AI生成产品上身图的B端产品。带着团队干了整整5个月,产品迭代的重要关头,刘天强没等来最后的签单通知,却等来了客户公司被并购、项目中止的消息。
11 月 21 日,AI 初创公司 Genspark 正式宣布完成 2.75 亿美元 B 轮融资。上线仅五个月,Genspark 年化收入已突破 5000 万美元,跻身行业增长最快的 AI 企业之一。
前沿AI竞赛在2025年11月达到高潮。48小时内,谷歌推出Gemini 3 Pro宣称在主要推理基准测试中领先,而OpenAI立即用GPT-5.1-Codex-Max反击,这是一款专门训练用于通过创新"压缩"(compaction)技术自主工作超过24小时的专业编码模型[43]。加上Claude Sonnet 4.5已确立的编码统治地位和激进的安全过滤器,开发者面临前所未有的选择:
想搭一个 AI 应用,就一定要走 Coding 这条路吗? 最近我干了件事:只用了一个飞书多维表格,把一堆 AI 效率产品的事给办了。起因是飞书多维表格全面上线了新功能,「应用模式」和「AI 工作流」。
由德克萨斯A&M大学、斯坦福大学、Snap公司、CU Boulder大学、德克萨斯大学奥斯汀分校、加州理工大学、Topaz Labs以及加州大学Merced分校的研究者联合提出的基于AI智能体的方法4KAgent针对不同类型的图像以及需求对图像进行智能修复并放大到4K分辨率,带来优秀的视觉感知效果。该工作已被NeurIPS 2025接收。
AI Everywhere。 我们正进入一个万物皆 AI 的世界。 从《钢铁侠》中无所不能的助理「贾维斯」(him),到电影《她》里善解人意的情感伴侣「萨曼莎」(her),这些一度只存在于科幻中的场景
昨天,具身智能的圈子“炸”了。不是因为某家公司发布了新产品,而是因为一场“具身武林大会”—— 2025智源具身智能Open Day。现场有多火爆?这么说吧,银河通用、智元、星海图、自变量、原力灵机、加速进化、北京人形、星源智、优必选、
2025 年 11 月 20 日,英伟达公布最新季度财报,2025 年 Q3 营收为 570.06 亿美元,较上年同期的 350.82 亿美元增长 62%;净利润为 319.10 亿美元,较上年同期的 193.09 亿美元增长 65%。英伟达强大的吸金能力再次超出所有人的预期,三年前英伟达的同期营收仅是现在的十分之一。
面对泛滥成灾的AI生成论文与注水评审,AI顶会ICLR终于祭出「核威慑」:除了惩罚未主动披露滥用AI的论文作者外,用AI敷衍的评审者,自己的论文也将面临拒稿。
一家名为 Poly 的 YC 孵化创业公司宣布完成了 800 万美元的种子轮融资,由 Felicis 领投。这本身并不特别,但让我深感震撼的是他们想要解决的问题:彻底重新发明文件系统本身。Poly 的创始人 Abhay Agarwal 说了一句让我印象深刻的话:"在 AI 优先的世界里,文件系统本身必须进化。
谷歌乘胜追击!Gemini 3 Pro好评如潮没两天,最强文生图模型Nano Banana也推出Pro版本。
11 月 3 日,全球知名游戏博主 PewDiePie 发布视频,展示其自建本地 AI 系统的全过程。该视频目前浏览量已经超过 300 万,视频标题则赫然写着双关梗 “STOP: Using AI Right now”。
近日,一家名为 CraftStory 的 AI 初创公司推出了 Model 2.0 视频生成系统,凭借可生成长达五分钟的富有表现力、可媲美专业水准、以人为中心的视频,破解了困扰 AI 视频生成行业长久以来的「视频时长」难题,引起热议,并被视为或将是 OpenAI 的 Sora 和 Google 的 Veo 的强有力竞争者。
别惊讶,下次给你卖课的健身教练,可能带了个「数字替身」
昨天,DeepSeek 在 GitHub 上线了一个新的代码库:LPLB。
当美国把H100送进轨道试图复制「太空数字霸权」时,中国创业团队的「天算计划」正以万卡级超算中心为剑,在真空与辐射的绝境中找到一条掌握人类数字命运的新路。
AI 洞见正在系统拆解全球增长最快、「估值超十亿美元」的 AI 企业,希望用真正跑通的商业模式,增强创业者进入 AI 的信心。
“护城河”正在消失,速度才是最重要的。
在最近的一年多时间里,中国“大模型六小虎”几乎无一不在经历着相似的阵痛:
近期,《Arc Raiders》宣布即将推出双人合作模式,以及类似《Helldivers 2》的社区任务活动——但在玩家还没来得及为新玩法兴奋之前,这款游戏的开发商 Embark Studios 却陷入了另一场更棘手的争议:再度被曝使用生成式 AI 进行游戏配音。
时隔两年后,AI PC的概念已经不再是一个小众的词汇。
AI视频用技术的快速迭代压缩时间,用不断涌现的作品和应用加速了「AI视频的商业化元年」的到来。
协作 AI,可能是 AI 助手的下一步?
如果说大多数初创公司是败在产品发布后的沉寂和无人问津,那么首形科技显然在这一阶段活了下来。
近日,AAAI 2026 公布了录用结果,该会议是是人工智能领域极具影响力的国际顶级学术会议之一。据悉本次会议共有 23680 篇投稿进入审稿阶段,最终 4167 篇论文被录用,录取率为 17.6%。