8 年数字化积淀,星巴克中国技术团队开始用 Agentic AI 改变零售
8 年数字化积淀,星巴克中国技术团队开始用 Agentic AI 改变零售“星巴克内部正在计划,希望在三年内为所有员工配备一个‘数字员工助手’,可能不止一个。有了这样的助手,我们会有更多的时间思考和创新,这些是 AI 永远也给不了的。”
“星巴克内部正在计划,希望在三年内为所有员工配备一个‘数字员工助手’,可能不止一个。有了这样的助手,我们会有更多的时间思考和创新,这些是 AI 永远也给不了的。”
特朗普按下「创世纪」按钮之时,美国举国豪赌「AI曼哈顿计划」!白宫给它起名叫——美国创世纪计划(US Genesis Mission): 让AI直接参与提出科学假设、设计实验、分析数据,让「AI科学家」加速科研创新。
Gemini 3 发布之后这些日子里,我逐渐感到疑惑:为什么总让 AI 写网站写 PPT,Gemini 都发到第三代了,不能干点更有意思的事吗?
在软件开发领域,需求工程(Requirements Engineering, RE)一直是项目成功的关键环节。然而,传统 RE 方法面临着效率低下、需求变更频繁等挑战。根据 Standish Group 的报告,仅有 31% 的软件项目能在预算和时间内完成,而需求相关问题导致的项目失败率高达 37%。
基准测试(Benchmarks)在人工智能的发展进程中扮演着至关重要的角色,构成了评价生成式模型(Generative Models)性能的事实标准。对于从事模型训练与评估的AI研究者而言,GSM8K、MMLU等数据集的数据质量直接决定了评估结论的可靠性。
最近两周的模型竞赛非常热闹:OpenAI 在 11 月 12 日发布 GPT-5.1,引入更强的推理深度与更高效的对话体验;Google 在 11 月 18 日发布 Gemini 3,全面强化多模态理解与复杂推理能力;Anthropic 在 11 月 24 日又发布了 Claude Opus 4.5,模型在专业文档处理、代码生成与长流程 agent 方面有显著提升。
就在刚刚,DeepSeek 又悄咪咪在 Hugging Face 上传了一个新模型:DeepSeek-Math-V2。顾名思义,这是一个数学方面的模型。它的上一个版本 ——DeepSeek-Math-7b 还是一年多以前发的。当时,这个模型只用 7B 参数量,就达到了 GPT-4 和 Gemini-Ultra 性能相当的水平。相关论文还首次引入了 GRPO,显著提升了数学推理能力。
近期,一支来自美国哈佛大学和美国斯坦福大学等联合团队真的做到了——他们集成 40 余种衰老时钟模型开发了一个名为 ClockBase Agent 的平台,让 AI 在 200 万份人类和小鼠的分子组学数据里“挖宝”,并找出了超过 500 种可能让生物年龄倒退的干预措施。
当所有人都以为AI发展的剧本是「英伟达卖铲子,OpenAI挖金矿」时,谷歌用Gemini 3告诉世界:如果我自己造了一台全自动挖掘机,还需要买谁的铲子,谁能挖得过我?
对于硬件,对于AR,应该都不甚了解的某知名投资人朱啸虎,对自己出手的第一个AI硬件也是AI眼镜项目是如此评价:“Gyges Labs的DigiWindow技术相比其他等方案,有着一个非常重要的优势:它的显示模组隐形,能把内容投到眼睛,