
借着Kimi K2的小爆发,吐露一些近期对Model as Agent的小思考
借着Kimi K2的小爆发,吐露一些近期对Model as Agent的小思考上周五(711),月之暗面蛰伏半年,憋了个大的,正式发布Kimi K2模型,总参数1T,同步开源。具体模型效果就不过多赘述了,网上已经有很多实测。
上周五(711),月之暗面蛰伏半年,憋了个大的,正式发布Kimi K2模型,总参数1T,同步开源。具体模型效果就不过多赘述了,网上已经有很多实测。
7 月 1 日,国际顶级学术期刊《Nature》旗下子刊《Nature Communications》正式刊登了来自清华、面壁等研究团队联合研发的高效端侧多模态大模型MiniCPM-V 核心研究成果。
我们正经历一场前所未有的智能跃迁。人工智能带来的,远不止于技术革新,更是一场深刻重塑人类认知、教育与生存方式的范式转移。
你说:“帮我列下今天的会议日程。” 它迅速回复:“9 点产品部,11 点市场部,下午 2 点财务汇报。”——完美。
今天凌晨,马斯克突然通知大家:快来更新 Grok APP,出新功能了。新推出的功能名为「智能伴侣」,基于前几天刚推出的 Grok 4 大模型,可以和人们实现自然的交互。大家一看这个效果,讨论的热度比前几天新模型发布还大。
「造芯」不易,「用芯」更难。大模型加速落地,国产芯片需求日盛,但模型真正能在国产芯上「开箱即用」者寥寥无几——这关键的「最后一公里」,谁来铺路?
什么样的 AI,才配被称为「地球上最聪明」?Grok 4 的答案或许是,在敏感问题上,先查查老板说了什么。
AI技术门槛降低,催生新独立开发者浪潮:大厂产品经理、青年创业者等个体借力AI(如GPT、编程助手)快速实现创意、开发产品(如情绪应用、MBTI工具),通过自媒体/付费社群/产品营收实现自由职业,追求创造性生活。
多模态大模型通常是在大型预训练语言模型(LLM)的基础上扩展而来。尽管原始的 LLM 并不具备视觉理解能力,但经过多模态训练后,这些模型却能在各类视觉相关任务中展现出强大的表现。
反思技术因其简单性和有效性受到了广泛的研究和应用,具体表现为在大语言模型遇到障碍或困难时,提示其“再想一下”,可以显著提升性能 [1]。然而,2024 年谷歌 DeepMind 的研究人员在一项研究中指出,大模型其实分不清对与错,如果不是仅仅提示模型反思那些它回答错误的问题,这样的提示策略反而可能让模型更倾向于把回答正确的答案改错 [2]。