阿里最强“PS模型”开源!一手体验,0元P出氛围感合影
阿里最强“PS模型”开源!一手体验,0元P出氛围感合影热门LoRA首次内置,控光换镜头实测可用。
热门LoRA首次内置,控光换镜头实测可用。
视频生成模型总是「记性不好」?生成几秒钟后物体就变形、背景就穿帮?北大、中大等机构联合发布EgoLCD,借鉴人类「长短时记忆」机制,首创稀疏KV缓存+LoRA动态适应架构,彻底解决长视频「内容漂移」难题,在EgoVid-5M基准上刷新SOTA!让AI像人一样拥有连贯的第一人称视角记忆。
我们不会和 Meta 竞价,即便待遇远低于对方,核心人才仍愿意留在 OpenAI,只因大家坚信这里的发展潜力和 AGI 愿景。
首发 9988 元创始权益价,2026 年 1 月启动公测。
在代码大模型(Code LLMs)的预训练中,行业内长期存在一种惯性思维,即把所有编程语言的代码都视为同质化的文本数据,主要关注数据总量的堆叠。然而,现代软件开发本质上是多语言混合的,不同语言的语法特性、语料规模和应用场景差异巨大。
多模态大语言模型(MLLMs)已成为AI视觉理解的核心引擎,但其在真实世界视觉退化(模糊、噪声、遮挡等)下的性能崩溃,始终是制约产业落地的致命瓶颈。
你是否曾被AI视频生成的不连贯性所困扰?
AI视频玩法又进化了。最近这一周,小红书上和X上铺天盖地的都是AI片场探班的视频,点开视频一看,大家都在跟各路明星、角色合影,非常热闹。 我看到这个玩法之后,也立刻随手做了个小东西。
昨天看到 MiniMax 的上市招股书,一些往事涌上心头。 2024 年 4 月 1 日,我从工作了 500 天的 MiniMax 离职,也彻底终结了自己 15 年的产品经理生涯。 MiniMax 是我加入的第四家上市公司,也曾是我最喜欢的一家公司。
在全球资本市场对人工智能基础设施持续加码、而IPO窗口尚未完全恢复的背景下,Databricks选择继续通过私募市场扩充资本实力。 这家企业级数据智能公司近日完成了一轮规模达40亿美元的L轮融资,投后估值达到1340亿美元,较三个月前的1000亿美元估值上涨34%。