
小小具身智能成果,高中生在腾讯拿下!
小小具身智能成果,高中生在腾讯拿下!注意看,这个人形机器人在室内四处搜寻。 只因刚刚听到人类指令:请你走到足球的位置。
注意看,这个人形机器人在室内四处搜寻。 只因刚刚听到人类指令:请你走到足球的位置。
Meta在半年内第四次重组AI部门,将超级智能实验室拆分为四个团队,全面押注「超级智能」。新成立的TBD Lab由Alexandr Wang领衔,或放弃Llama 4并转向闭源模型,Meta开源旗帜动摇。Meta内部人心浮动,几家欢喜几家愁。
敏捷、优雅。 宇树用这两个词来形容自家最新人形机器人
开源赛道也是热闹了起来。 就在深夜,字节跳动 Seed 团队正式发布并开源了 Seed-OSS 系列模型,包含三个版本: Seed-OSS-36B-Base(含合成数据) Seed-OSS-36B-Base(不含合成数据) Seed-OSS-36B-Instruct(指令微调版)
微软前AI副总裁兼杰出科学家Sebastien Bubeck发文表示GPT-5 Pro从零攻克了数学论文中的未解区间,这个发现让他大受震撼。该发现引得众多大佬转发,OpenAI总裁认为AI或将加速数学研究。
自从 GPT-5 发布后,DeepSeek 创始人梁文锋就成了 AI 圈最「忙」的人。
AI Agent正在被要求处理越来越多复杂的任务。 但当它要不停地查资料、跳页面、筛选信息时,显存狂飙、算力吃紧的问题就来了。
要让视频生成模型真正成为模拟真实物理世界的「世界模型」,必须具备长时间生成并保留场景记忆的能力。然而,交互式长视频生成一直面临一个致命短板:缺乏稳定的场景记忆。镜头稍作移动再转回,眼前景物就可能「换了个世界」。
从 Sora 的惊艳亮相到多款高性能开源模型的诞生,视频生成在过去两年迎来爆发式进步,已能生成几十秒的高质量短片。然而,要想生成时长超过 1 分钟、内容与运动可控、风格统一的超长视频,仍面临巨大挑战。
您可能已经在产品里放进了问答、总结、甚至自动报表模块,但表格一上来,体验就变味了,这不奇怪。表格是二维、带结构、还经常跨表跨文,和纯文本完全不一样;项目作者在《Tabular Data Understanding with LLMs》里把这件事掰开揉碎,从输入表示到任务版图,再到评测与未来方向都梳理清楚了。
智东西8月20日报道,8月16日,Anthropic最新一期官方油管视频上线,三位AI研究员抽丝剥茧,深入探讨AI研究不应避开的一个关键“谜团”——大模型究竟是怎么思考的?
DeepSeek V3.1和V3相比,到底有什么不同?官方说的模模糊糊,就提到了上下文长度拓展至128K和支持多种张量格式,但别急,我们已经上手实测,为你奉上更多新鲜信息。
在经过长足的预热,并且见识到谷歌堪比阿勃维尔的保密程度之后,我们终于迎来了 2025 年谷歌的 Pixel 系列新品的正式发布。
AI换脸技术已能成功骗过部分人脸识别系统,用于实施金融诈骗(如盗号改法人、盗刷账户)。人脸识别存在安全漏洞,2D识别易被照片/视频破解,3D识别也可能被伪造数据欺骗。黑产已形成相关产业链,国家与技术公司正加强防御,但用户需提高警惕,谨慎使用人脸识别。
AI吃播视频合成虚幻食物内容,快速走红成为流量热点,用户通过其解压助眠获得成瘾体验。创作者利用平台激励和售卖提示词、课程实现盈利,而AI大厂如OpenAI持续亏损。模型如快手可灵商业化成功,从会员订阅中获利。
AI领域的“抢人”早就是个显性命题了,不过现在有愈演愈烈的架势。与海外相同,这场争夺是由大厂发起的,其中字节尤甚。单从最新发布的校招信息来看,字节今年的研发岗需求量增加了23%,其中算法、前端和客户端增幅最明显。在非研发招聘领域与产品相关的,像是产品经理、数据分析等方向,offer量翻了一倍。
自2024年5月谷歌推出AI Overviews(AI概览)功能以来,用户无需点击即可获取答案,这导致新闻网站和独立博主的点击量暴跌。数据显示,全球新闻网站的月自然访问量从2024年7月的23亿次骤降至2025年5月的不到17亿次
昨晚睡不着,我把四份最新AI纪要摊床上,越看越像四盘菜:Kimi那盘是精算师凉面,DeepSeek端上战略家佛跳墙,ChatGPT递来脱口秀炸酱面,Gemini则摆好外交官寿司。
8 月 20 日,在新加坡的 Stripe Tour 上与 Stripe CEO 对谈的时候,Manus 首席科学家季逸超(Peak)表示,Manus 从三月份推出至今已实现 9000 万美元的年化营收规模(revenue run rate),1 亿美元大关近在咫尺。
众所周知,前不久 Anthropic 宣布对用户实行每周速率限制。其中,在解释原因时,Anthropic 提到“虽然 Pro 和 Max 套餐提供了充足的 Claude 访问权限,但一些高级用户却全天候不间断地运行 Claude,消耗的资源远远超出了正常使用量。一位用户在 200 美元的套餐中消耗了数万个模型使用量。”
大模型与多模态之间的关系,可以理解为大模型就像是人脑中的‘前额叶’,主要负责高级认知功能,但只有前额叶的大脑是无法处理复杂任务的,这就需要多个不同模型之间互相协调,从单纯的“前额叶”走向“完整的大脑”,从而处理更加复杂的现实任务。
就在刚刚,全球首个手机通用Agent,来了!
RoboNeo 拿下百万 MAU 后,美图财报依旧强势。7 月中旬,美图上线了面向影像领域的 AI Agent RoboNeo,并靠“emoji 小人”的社媒风潮获取了第一批用户,上线一个月左右的时间,已拿下 100W 左右的 MAU。美图又以极快的速度,推火了一款新产品。在 AI 时代,聚焦影像的美图,有点乘风起的意味,如其昨天发布的半年报。
00后AI创业潮来袭!华人女生MIT辍学创业,拿下融资2100万美元(折合人民币1.5亿元)。 公司直接剑指RPA(机器人流程自动化)界的Copilot。
大家好,我是袋鼠帝 最近发现滴滴出手了!入局打车MCP 我还挺感兴趣的 于是找朋友帮忙开了白名单拿到了一个内测apikey https://mcp.didichuxing.com/
Firecrawl 联合创始人兼首席执行官 Caleb Peffer 清楚地记得找到领投 A 轮融资的投资人的那一刻。
虎牙Q2营收15.7亿,AI战略驱动平台实现创新转型。 8月12日,虎牙发布2025年第二季度财报。经过两年战略转型后,虎牙交出一份超越市场预期的亮眼业绩。
想象一个课堂:讲台上是永不疲倦的AI讲师,台下是专注于启发和引导的人类导师。本期播客,听听他们关于AI如何重塑教育、老师角色以及适应力为何是新一代职业保障的深刻洞见。
美国每年有超三分之一患者需跨机构转诊,但复杂行政流程导致转诊完成率不足一半。Tennr以AI为底座切入这一高摩擦、高错误率的关键节点,重构信息交互与操作流程,为医疗机构与患者带来更高效、更可控的转诊体验。
当我看到 Cursor、Claude Code、Lovable 这些 AI 编程工具的出现,以及它们正在以惊人的速度降低软件开发成本时,我意识到我们正站在一个历史转折点上。这不仅仅是开发效率的提升,而是整个软件行业商业逻辑的根本性重构。