
AI读网页,这次真不一样了,谷歌Gemini解锁「详解网页」新技能
AI读网页,这次真不一样了,谷歌Gemini解锁「详解网页」新技能谷歌回归搜索老本行,这一次,它要让 AI 能像人一样「看见」网页。 这是谷歌前不久在 Gemini API 全面上线的 URL Context 功能(5 月 28 日已在 Google AI Studio 中推出),它使 Gemini 模型能够访问并处理来自 URL 的内容,包括网页、PDF 和图像。
谷歌回归搜索老本行,这一次,它要让 AI 能像人一样「看见」网页。 这是谷歌前不久在 Gemini API 全面上线的 URL Context 功能(5 月 28 日已在 Google AI Studio 中推出),它使 Gemini 模型能够访问并处理来自 URL 的内容,包括网页、PDF 和图像。
这家由剑桥大学行为科学背景的 James He 和 Patrick Sharpe 创立的公司,声称能够通过 AI 模拟整个人类社会的互动模式。他们不是在构建另一个聊天机器人或者内容生成工具,而是在尝试解决一个困扰人类社会数千年的根本问题:如何准确预测群体行为。
今天凌晨,特斯拉公布了他们的《宏图计划第四篇章》。 与以往聚焦汽车或能源产品的蓝图不同,特斯拉这次描绘了一个更遥远、也更理想化的终点:一个由 AI 和机器人主导的「可持续富足」的社会。
AI 硬件,已经成为大模型之后,又一个令人兴奋的领域。 正如 AI Agent 从通用开始走向垂直,AI 硬件,也已经逐渐分化到「陪伴」、「工作」等各个垂直领域。
国内AI音乐领域迎来突破性进展。日前,自由量级0到1全自研的音乐大模型——“音潮音乐”已成功通过国家互联网信息办公室的生成式人工智能服务备案(备案号:Shanghai-YinChaoYinYue-202507160059)。
不使用端侧AI的话,谷歌在Pixel 10上就有虚假宣传的嫌疑了。
AI搜索初创公司Perplexity,最近过得并不轻松。
还有不到两天,就是我国庆祝抗战和世界反法西斯战争胜利 80 周年的大阅兵了。
曾几何时,“黑作坊”“幽灵店”等没有堂食店铺,或是用假地址和假照片包装的外卖店,频频被曝光于公众视野。于是,不少年轻人与外卖店斗智斗勇,为了筛选出令人安心、吃得放心的外卖,下单之前总要看看商家照片、后厨照片甚至地址。
Builder.ai自称用AI简化软件开发,吸引微软、软银等巨额投资,估值一度超15亿美元。但实际靠人工冒充AI,财务造假被起诉。而这么做的,不止Builder.ai这一家! 两年前,快公司Fast Company评选出AI领域最具创新性的前10家公司,OpenAI、谷歌DeepMind、Builder.ai当选Top3,而英伟达位居第9。
过去一年,教育AI的热闹几乎无需赘述:
GPT-4o发布才过去半年,Nano Banana这种「下一代」的生图模型就出来了。 这难道是AI界的摩尔定律?不敢想再过半年后,会是什么样的「魔鬼级」生图模型来屠Nano Banana
智能体开发者的生存之道,是中国AI产业最接地气的底色。
DeepSeek发布DeepSeek-V3.1,使用的UE8M0 FP8 Scale针对下一代国产芯片设计
写今天这篇稿子,我心情有点复杂,因为我好像撞破了一些,和AI相关的灰色部分。 起因是我在刷小红书的时候,刷到了AI自习室。
AI让大脑退化,是真的...
前不久,印度身价最贵的板球运动员 Rishabh Pant 迷上了新兴网红 Mia Zelu。这位粉丝数超 1500 万的球星甚至会在 Mia 发布帖文的第一时间去点赞。
这期对话把火力对准了一个不体面的真相:更聪明的“路由”和更苛刻的“成本”正重写 AI 商业化的脚本。
如今,人工智能已经成为科技发展的主流,尤其是 ChatGPT 问世以来,大语言模型(LLM)正在深刻影响社会、企业和个人的方方面面。
这段时间 AI 编程的热度完全没退,一个原因是国内接连推出开源了不少针对编程优化的大模型,主打长上下文、Agent 智能体、工具调用,几乎成了标配,成了 Claude Code 的国产替代,比如 GLM-4.5、DeepSeek V3.1、Kimi K2。
不止贴「AI生成」标签
一个绝妙的点子往往是公司最危险的毒药。 最近在 X 上闲逛,淘到了一个神奇的网站 ——「Absurd.website」。 正如名字一样,它荒诞、有趣、脑洞大开,里面收录了各种奇葩的小项目,有些甚至能看到 AI 生成的痕迹。
人类心理学说服策略可以有效迁移至LLM 你有没有试过让ChatGPT骂你一句?(doge) 它大概率会礼貌拒绝:私密马赛,我不能这样做orz 但最新研究表明,只需要擅用一点人类的心理技巧PUA,AI就会乖乖(骂你)听话。
开放麦是「十字路口」社区线下活动的经典形式。 从最开始的探索到现在,我们已经举办了 16 场 AI 开放麦,邀请了超过 150 位新一代 AI 创业者和积极行动者登上开放麦的舞台,每个人用 10 分钟时间,分享他们在 AI 领域的产品和见解。
随着垂直领域 agent 的兴起,市面上的应用越来越多,用户不可避免地需要一个编排工具(orchestration tool)来将这些分散的应用串联起来,或者需要某种横向工具(horizontal tool)来统一构建 agent。而 n8n 正是这一生态位中的佼佼者,它正从一个工作流自动化工具,升级为 AI 应用的编排层。
“搜索调用太贵了。一次 Deep Research 任务可能消耗数百次搜索调用,成本一下子就突破数十美元” ,无论是个人开发者还是AI应用公司都明显有这种感觉。
8月28日,国内首个以AI+MGI(材料基因工程)技术为核心驱动的“干湿一体多糖生物基材料创新实验室”在浙江台州黄岩正式启用。
9 月,不仅是返校的季节,对许多人来说,也意味着一个新的开始。无论你是重返校园的学生,还是希望在职业道路上寻找新方向的探索者,可能都在思考同一个问题:「如何才能跟上这个被 AI 定义的未来?」
OpenAI计划在印度建设至少1GW规模的数据中心,这是「星际之门」计划首次大规模进入亚洲。印度之所以重要,不仅因其庞大的用户增长潜力与低价特供服务,还因多语言应用场景。奥特曼虽淡出CEO角色,却亲自推动全球算力布局,印度成为其展现野心的关键起点。
退休经济学教授用一个简单问题干懵GPT-5,其拉胯表现与奥特曼口中“博士级AI”的宣传大相径庭。