
喝点VC|a16z对话Meta CTO:应用已死?后手机时代的AI原生交互范式——“不是点开应用,而是表达意图”
喝点VC|a16z对话Meta CTO:应用已死?后手机时代的AI原生交互范式——“不是点开应用,而是表达意图”现在如果我想听音乐,我第一反应是:“我要用哪个服务?Spotify还是Tidal?”但这其实不是我真正的需求。我的真实意图是:“我想听这首歌。”我希望只要说出来,AI就能帮我搞定。
现在如果我想听音乐,我第一反应是:“我要用哪个服务?Spotify还是Tidal?”但这其实不是我真正的需求。我的真实意图是:“我想听这首歌。”我希望只要说出来,AI就能帮我搞定。
AI也会偷偷努力了?Letta和UC伯克利的研究者提出「睡眠时计算」技术,能让LLM在空闲时间提前思考,大幅提升推理效率。
颠覆LLM预训练认知:预训练token数越多,模型越难调!CMU、斯坦福、哈佛、普林斯顿等四大名校提出灾难性过度训练。
超越YOLOv3、Faster-RCNN,首个在COCO2017 val set上突破30AP的纯多模态开源LLM来啦!
企业内落地 Agent,三个关键点是模型、数据、场景。
技术在进化,验证码也该变得更有人情味一点。
扩散模型(Diffusion Models, DMs)如今已成为文本生成图像的核心引擎。凭借惊艳的图像生成能力,它们正悄然改变着艺术创作、广告设计、乃至社交媒体内容的生产方式。
从来没想过,AI 跑出来的语音,竟然可以摆脱「外国人说中文」,对味儿!Google 系的第一大爆款 NotebookLM 发布更新,现在(终于)支持多达五十种语言来生成播客——包括中文。
Midjourney v7上线后,配套的角色参考(cref)功能一直迟迟未公布。当时我就有个预感,也在评测文章里说过:这可能是个全新功能的伏笔。果然,今天Midjourney正式公布「Omni-Reference」,即「全向参考」,或翻译成「万能参考」,配合--oref、--ow两个参数使用,这不是Character Reference的v7升级版,而是一次全面的参考进化。
世界首个公开可用AI科学家天团,刚刚组团出道!FutureHouse发布了四个AI科学家Agent,科研能力直接超越o3,文献搜索已经超过人类博士。