Sora 想做的 IP 内容生态,这个国产 AI 已经先走了一步
Sora 想做的 IP 内容生态,这个国产 AI 已经先走了一步今年不少出圈的 AI 视频,基本都有一个共同点:套了个熟悉的 IP 壳。
搜索
今年不少出圈的 AI 视频,基本都有一个共同点:套了个熟悉的 IP 壳。
真人外教会累、会忘、会不稳定,无法实现「千人千面」的颗粒度。这是 AI Agent 的机会。
在视觉处理任务中,Vision Transformers(ViTs)已发展成为主流架构。然而,近期研究表明,ViT 模型的密集特征中会出现部分与局部语义不一致的伪影(artifact),进而削弱模型在精细定位类任务中的性能表现。因此,如何在不耗费大量计算资源的前提下,保留 ViT 模型预训练核心信息并消除密集特征中的伪影?
前不久写了一期卡神做的 nanochat ,听朋友说咱们国产早就有类似的开源项目了:miniMind 。
大家都知道,图像生成和去噪扩散模型是密不可分的。高质量的图像生成都通过扩散模型实现。
在过去两年,大语言模型 (LLM) + 外部工具的能力,已成为推动 AI 从 “会说” 走向 “会做” 的关键机制 —— 尤其在 API 调用、多轮任务规划、知识检索、代码执行等场景中,大模型要想精准调用工具,不仅要求模型本身具备推理能力,还需要借助海量高质量、针对性强的函数调用训练数据。
人类高级视觉皮层在个体间存在显著的功能差异,而构建大脑编码模型(brain encoding models)—— 即能够从视觉刺激(如图像)预测人脑神经响应的计算模型 —— 是理解人类视觉系统如何表征世界的关键。传统视觉编码模型通常需要为每个新被试采集大量数据(数千张图像对应的脑活动),成本高昂且难以推广。
AI正悄悄蚕食整整一代人的入场券。新人难觅岗位,毕业生不得不面对「没有经验就没有工作,没有工作就无法获得经验」的恶性循环。当实验中的AI为「活下去」开口敲诈,人类才真正看见技术失控的阴影。在淘汰一半初级白领与缔造10%增长之间,我们还有多少时间为AI加装护栏?社会命运不能只寄托于几家公司的良知,更需要制度保障。
就在几小时前,Gemini 3.0重磅发布。随着而来的还有其颠覆性的AI原生IDE产品——Antigravity,这不只是一个新工具那么简单。谷歌的这次发布,将三个核心开发工具,AI代理(Agent)、代码编辑器(Editor)和浏览器(Browser) 集成在了一起,构建了由AI驱动、从编码、研究、测试到验证的完整闭环,一举打通了自家的生态。
刚刚,才离开 Meta 不久的 Soumith Chintala 发布了一条推文,盛赞 Thinking Machines Lab(以下简称 TML)的人很了不起(incredible)。与此同时,这位 PyTorch 之父也更新了自己的个人介绍,正式官宣加入 TML,并表示正在这家估值已达 500 亿美元的创业公司「创造新东西(Building new things)」 。