AI Coding 产品的顶层思考与方法论:从范式革命到规约编程
AI Coding 产品的顶层思考与方法论:从范式革命到规约编程作为腾讯 CodeBuddy 的第一位产品经理和现任 T12 级技术产品专家,我想分享近期对于 AI Coding 产品的深度思考和趋势洞察。本次分享不仅限于 AI Coding 本身,更希望提供一套通用的方法论——当你拿到任何 AI 产品命题时,应该如何系统性地思考和推进。
搜索
作为腾讯 CodeBuddy 的第一位产品经理和现任 T12 级技术产品专家,我想分享近期对于 AI Coding 产品的深度思考和趋势洞察。本次分享不仅限于 AI Coding 本身,更希望提供一套通用的方法论——当你拿到任何 AI 产品命题时,应该如何系统性地思考和推进。
从“不用AI”到“离不开AI”,一家初创公司如何重塑专利律师的工作时钟?成立仅两年多,团队仅15人,零销售团队,却拿下了400多家顶级客户,今年ARR增长更是超过10倍,还完成了5500万美元融资——Solve Intelligence的故事,几乎违背了SaaS创业的常识。
最新报告探讨了生成式模型Nano Banana Pro在低层视觉任务中的表现,如去雾、超分等,传统上依赖PSNR/SSIM等像素级指标。研究发现,Nano Banana Pro在视觉效果上更佳,但传统指标表现欠佳,因生成式模型更追求语义合理而非像素对齐。
你是否经历过这样的至暗时刻: 明明实验数据已经跑通,核心逻辑也已梳理完毕,却在面对空白的 PPT 页面时陷入停滞; 明明脑海里有清晰的系统架构,却要在 Visio 或 Illustrator 里跟一根歪歪扭扭的线条较劲半小时; 好不容易用 AI 生成了一张精美的流程图,却发现上面的文字是乱码,或者为了改一个配色不得不重新生成几十次……
月前,Pollo.ai 拿下千万美元融资,而今日, ListenHub 也拿下了 200 万美元融资。两个产品都没有做自研模型,创始人也都不是典型的技术或者大厂出身,都是非典型的 AI 应用层创业,这个在 2024年“质疑”声很大的模式,在 2025 年却结出了不少的果实。
让静态3D模型「动起来」一直是图形学界的难题:物理模拟太慢,生成模型又不讲「物理基本法」。近日,北京大学团队提出DragMesh,通过「语义-几何解耦」范式与双四元数VAE,成功将核心生成模块的算力消耗降低至SOTA模型的1/10,同时将运动轴预测误差降低了10倍。
你有没有发现,你让AI读一篇长文章,结果它读着读着就忘了前面的内容? 你让它处理一份超长的文档,结果它给出来的答案,牛头不对马嘴? 这个现象,学术界有个专门的名词,叫做上下文腐化。 这也是目前AI的通病:大模型的记忆力太差了,文章越长,模型越傻!
你有没有想过,如果你和 AI 聊天,无意中把自己的生日、住址或照片告诉了它,这些信息会不会被它记住?以及我们是否可以像删除微信聊天记录一样,让 AI 忘记这些隐私?
VLA 模型正被越来越多地应用于端到端自动驾驶系统中。然而,VLA 模型中冗长的视觉 token 极大地增加了计算成本。但现有的视觉 token 剪枝方法都不是专为自动驾驶设计的,在自动驾驶场景中都具有局限性。
新年伊始,MIT CSAIL 的一纸论文在学术圈引发了不小的讨论。Alex L. Zhang 、 Tim Kraska 与 Omar Khattab 三位研究者在 arXiv 上发布了一篇题为《Recursive Language Models》的论文,提出了所谓“递归语言模型”(Recursive Language Models,简称 RLM)的推理策略。