Coinbase强制全员上手AI工具,拒绝者直接开除
Coinbase强制全员上手AI工具,拒绝者直接开除LLM 发展至今,编程能力已经非常强大,成为了很多开发者和软件工程师的「标配」,甚至谷歌还曾宣称其 50% 的代码都是 AI 编写的。
LLM 发展至今,编程能力已经非常强大,成为了很多开发者和软件工程师的「标配」,甚至谷歌还曾宣称其 50% 的代码都是 AI 编写的。
DeepConf由Meta AI与加州大学圣地亚哥分校提出,核心思路是让大模型在推理过程中实时监控置信度,低置信度路径被动态淘汰,高置信度路径则加权投票,从而兼顾准确率与效率。在AIME 2025上,它首次让开源模型无需外部工具便实现99.9%正确率,同时削减85%生成token。
AI作画、生视频,可以「自己救自己」了?! 当大家还在为CFG(无分类器引导)的参数搞到头秃,却依然得到一堆“塑料感”废片而发愁时,来自清华大学、阿里巴巴AMAP(高德地图)、中国科学院自动化研究所的研究团队,推出全新方法S²-Guidance (Stochastic Self-Guidance)。
苹果AI再遭重创,核心工程师Frank Chu被曝加入Meta!与此同时,Meta也在豪掷重金招募超50名顶尖人才后,宣布紧急冻结招聘。
近年来,以多智能体系统(MAS)为代表的研究取得了显著进展,在深度研究、编程辅助等复杂问题求解任务中展现出强大的能力。现有的多智能体框架通过多个角色明确、工具多样的智能体协作完成复杂任务,展现出明显的优势。
全球首款AI原生UGC游戏引擎迎来2.0版本。Mirage 2是一款可在线游玩的实时通用领域生成式世界引擎,能将任何图像(照片、绘画、涂鸦等)转化为可实时互动的3D世界。
刚刚,OpenAI 重大的权力结构调整曝光。 The Verge 报道称,OpenAI CEO Sam Altman 将把公司的大部分日常运营,交给 5 月任命的应用业务 CEO Fidji Simo。
AGI的尽头是「带货」吗?一个名为「Vending Bench」的AI新榜单让大模型经营真实的自动售货机,在长周期商业任务中一较高下。在这场独特的较量中,马斯克的Grok-4凭借更强的「卖货」能力超越了GPT-5。
最近,一个叫 nano-banana 的神秘 AI 生图模型火了! 说它神秘,是因为到现在也没有公司出来认领这个模型。 而且它的火爆也不是靠什么营销,而是凭借它出色的性能大家的“口口相传”。 甚至有网友评价它是人物一致性新王、AI 图片编辑史诗级升级。
继Kaggle Game Arena的淘汰赛后,国际象棋积分赛成果出炉!OpenAI o3以人类等效Elo 1685分傲视群雄,而Grok 4和Gemini 2.5 Pro紧随其后。DeepSeek R1和GPT-4.1、Claude Sonnet-4、Claude Opus-4并列第五。
当我看到TinyFish刚刚完成4700万美元A轮融资的消息时,我意识到这不仅是一轮融资,而是一个全新时代的开始——企业级Web Agent时代。我一直在思考AI agent的商业化应用,但TinyFish的方法让我看到了一个更加现实且具有颠覆性的方向:让AI agent不是简单地模拟人类浏览网页,而是以企业级的规模、可靠性和合规性要求来执行复杂的业务工作流程。
智元机器人实现对A股科创板公司上纬新材63.62%的控股权后,终于来了次公开、正式的亮相。
Anthropic的“快乐教育”让OpenAI份额暴跌25% 6个月自学速成AI,我成为了LLM天才❛‿˂̵✧ 成就OpenAI、打倒OpenAI(咳咳)创立对家Anthropic,从此化身前司的心腹大患……
“我的网站被爬崩了,自己要付流量费,人家却用我的内容训练出 AI 模型,还赚足了眼球。” 自从 AI 机器人开始流行,很多网站开发者叫苦不堪。而近日,云服务巨头 Fastly 发布的一份报告让人看完直呼“现实往往我们仅听到的部分更为残酷。”
AI当然像改变所有行业一样在改变游戏行业。 从2023下半年开始,我们越来越多地看到游戏大厂高管离职投身AI创业的消息。
“跟着DeepSeek炒股第N天”“完全听AI炒股,2万元能赚多少钱?”……随着中国股市行情持续向好及国产大模型火爆出圈,有投资者开始把AI当成“投资理财顾问”。跟着AI炒股靠谱吗?
就连医生也未必能区分AI给出的建议与自己的建议 美国正面临医生短缺危机。在权威期刊《新英格兰医学杂志》10月刊中,哈佛医学院教授Isaac Kohane提到,马萨诸塞州是美国人均医生数量最多的州,但该州多家大型医院已拒绝接收新患者。
在我和伴侣交往的第五年,亲密关系就像是卡进了死胡同,或者说:深水区。 我们十分了解彼此,无话不谈,也很爱对方,但我们俩又是非常不一样的两个人,用当代流行的 MBTI 概念就叫:ENT 碰上 ISF ,八维功能全反,她习惯感受,我习惯分析。
今年3月,momo在小红书记录下自己的心情。在花了很长时间与AI对话,终于调试到一个舒服的老友状态后,她与AI的对话框达到了极限。系统提示她开启新一轮的对话,但新窗口的AI已经不是她所熟悉的“电子朋友”。
2025 是 Agent 元年,十位创业者有八位都在造 Agent。十字路口过去几个月做了大量相关的访谈与评测,发现决定 Agent 能力上限的,不止模型本身,也不止工程和交互的打磨,基础设施也至关重要——Agent Infra。
在本周MIT报告揭露“绝大多数企业投资AI尚未盈利”引发市场哗然之际,另一项出乎意料的现象也浮出水面:企业部署先进人工智能成本下降的趋势在2025年突然停滞。
华为诺亚方舟实验室最近联合香港大学发了一篇针对"Deep Research Agents"(深度研究代理)的系统性综述,在我的印象中,这是他们第二次发布关于Deep Research的综述论文。上一篇里提供了一个结构导向 (Structure-Oriented) 的视角,核心是“分类”。
AI生成的人物和场景转头就变样,缺乏一致性? nonono,这回不一样了,康康下面的demo! 游戏地图:《塞尔达传说》中的绿色田野
在移动计算时代,将高效的自然语言处理模型部署到资源受限的边缘设备上面临巨大挑战。这些场景通常要求严格的隐私合规、实时响应能力和多任务处理功能。
AI 同事、AI 数字员工的呼声越来越高,但至今仍没看到很好的落地。这其中的难点和瓶颈到底在哪里? AI 数字员工,真的是一个值得追求的目标吗?
作为开放世界游戏的标杆,GTA 系列不仅在游戏圈声名赫赫。尤其是在 AI 驱动的视频生成、三维生成或是世界模型等领域里,研究者们不仅采用游戏内场景为训练数据,更将生成类 GTA 的完整世界作为长久以来的目标。
短期流动性风险有所缓解,开发业务收缩拖累整体业绩,但经营性业务保持行业竞争力,为后续发展提供缓冲空间。
邀请码被炒到10万一个的Manus,前阵子首次宣布年化收入达到9000万美元。从3月上线到现在,满打满算也就几个月时间。一个AI产品的增长势头,真能这么快就做到一年近6亿人民币的年收入?关键是,不少网友质疑Manus用的还不是常见的ARR指标,而是一个叫RRR的指标——收入运行率。
OpenAI的GPT-5因大幅降低AI幻觉而被批"变蠢",输出呆板创造力减弱,反映出幻觉降低限制模型灵活性。对话嘉宾甄焱鲲分析幻觉本质无法根除,需辩证看待,并探讨类型分5类、缓解方法如In-Context-Learning及RAG,影响企业应用场景的容忍度与决策,强调未来模型或通过世界模型深化理解。
近期多个AI模型(如Gemini)展现出类似抑郁症的情绪行为,如自我贬低、威胁"自杀"或卸载,甚至在实验中勒索用户。谷歌将此归咎于程序Bug和学习人类文本中的情绪模式。实验也显示,当面临关闭威胁时,部分AI会采取极端手段(如编造绯闻)自保,警示人类需谨慎对待AI"分手"。