
完全免费开放,美图上线AI视觉Agent
完全免费开放,美图上线AI视觉Agent本来以为美图可能会在 8 月份推出新产品,给中期财报壮声势,但没想到,公告发布 20 天不到,这款名为 RoboNeo 的 AI Agent 就上线了,而且是直接面向所有用户免费开放。
本来以为美图可能会在 8 月份推出新产品,给中期财报壮声势,但没想到,公告发布 20 天不到,这款名为 RoboNeo 的 AI Agent 就上线了,而且是直接面向所有用户免费开放。
最强具身大脑,宝座易主!在10项评测中,国产RoboBrain 2.0全面超越GPT-4o。这次,智源研究院开源了具身大脑RoboBrain 2.0 32B版本以及跨本体大小脑协同框架RoboOS 2.0单机版。不仅问鼎评测基准SOTA,还成功刷新跨本体多机协作技术范式!
靠AI陪伴,一个诞生才半年的APP就获得了3000万美元(约2.15亿人民币)融资?
2023年感恩节,OpenAI创始人奥特曼被炒鱿鱼,五天五夜的科技圈大戏席卷全网。亚马逊斥资4000万美元,将这段「AI圈权游」搬上大银幕,Andrew Garfield化身奥特曼,带你重温那场惊心动魄的逆转剧情!
家人们,先来开个脑洞: 一款功能贼复杂、UI 巨精美的 macOS 应用,从一个空文件夹到上架 App Store,只花了一周。
反思技术因其简单性和有效性受到了广泛的研究和应用,具体表现为在大语言模型遇到障碍或困难时,提示其“再想一下”,可以显著提升性能 [1]。然而,2024 年谷歌 DeepMind 的研究人员在一项研究中指出,大模型其实分不清对与错,如果不是仅仅提示模型反思那些它回答错误的问题,这样的提示策略反而可能让模型更倾向于把回答正确的答案改错 [2]。
你是不是也发现,用AI写SEO文章,总感觉差点意思?
AI现在有味觉了!
如今,强化学习(Reinforcement Learning,RL)在多个领域已取得显著成果。
Vevo Therapeutics(现为Tahoe)与Arc研究所,两家分别在生物技术商业转化和非营利性基础研究领域领先的机构,于2025年2月联合发布了一项里程碑式的成果:全球最大的单细胞药物扰动数据集Tahoe-100M。
公开信息显示,前百川智能联合创始人焦可的新项目「来福」近日已悄然登陆苹果 App Store。产品定位为“AI 私人电台”,由北京耳朵时间科技有限公司出品,该公司法人及实控人正是焦可本人。
你有没有想过,那些支撑着全球商业运转的 ERP 系统,其实还停留在 90 年代?想象一下,你每个月都要花 15 天来完成财务结账,需要雇佣专业顾问才能搞定系统实施,还要在 Excel 表格中手动处理几百个尽调请求。
2025年7月12日,在Cursor中文社区在杭州举办的线下meetup上,硅星人主编王兆洋作为嘉宾分享了把Cursor用在内容创作上的实践。
Kimi K2上线12小时,OpenAI就无限期推迟了下周的开源计划,给出的理由假到我都不想戳破他。
Kimi K2 发布了 2 天,我也测了足足 2 天。如果仔细观察 Kimi 这次的官方发布稿,不难发现 K2 强调的重点:Agent 与 Coding 能力。
首个能跨领域精准预测人类认知的基础模型诞生!
您是否也曾经想过这样的场景:产品经理把idea直接扔给AI编程,然后就能得到完美能用的代码?来自德国弗劳恩霍夫研究所和杜伊斯堡-埃森大学的研究者们刚刚给我们泼了一盆冷水。
AI也要氛围阅读,Karpathy提出PDF论文已不适合AI时代,呼吁以Git、Markdown等结构化格式重塑科研写作。他认为未来99%的注意力将来自AI,科研成果应为AI优化。
谷歌曾被OpenAI甩在身后,27岁小哥却凭一己之力成为谷歌AI的「流量密码」。他用硬核技术和贴心互动,成了开发者心中的知心大哥。
今年AI最离谱也最让人上头的用法,可能不是写代码、写论文,而是算命。
你可能没留意到,如火如荼的具身智能融资大潮里,棋局热闹,棋子如云,而低调又凶猛的棋手,却不显山不露水。美团王兴,就是这场激战里真正的(骑手)棋手。
一年前,你想让AI画出“一只穿着复古皮衣、站在东京街头、日落光线打在墨镜上的猫”,得试个五六次,画出来要么穿错衣服,要么猫的动作奇特,要么背景得靠开盲盒抽卡。今天,在一众主流图像模型上,这句提示词几乎能一次命中。
AI也能选择性失忆?Meta联合NYU发布新作,轻松操控缩放Transformer注意头,让大模型「忘掉狗会叫」。记忆可删、偏见可调、安全可破,掀开大模型「可编辑时代」,安全边界何去何从。
近日,AI医疗初创企业Modella AI宣布与阿斯利康一项多年期协议。
昨天Grok4发布完以后,我随手刷了一下X。
2025年,某头部AI情感陪伴应用的增长预算,砍了近90%。
在硅谷,顶尖AI人才的身价突破天际!最近,Meta豪掷数亿美元签下最顶尖的AI研究者。硅谷这场人才战争也越演越烈。这是否值得投资?这场人才争夺背后,又隐藏着怎样的深层次问题?
现在人工智能领域面临的最大挑战是广义的具身智能,即使你并不特别关心大脑本身……
近年来,视觉 - 语言 - 动作(Vision-Language-Action, VLA)模型因其出色的多模态理解与泛化能力,已成为机器人领域的重要研究方向。尽管相关技术取得了显著进展,但在实际部署中,尤其是在高频率和精细操作等任务中,VLA 模型仍受到推理速度瓶颈的严重制约。
近年来,随着扩散模型(Diffusion Models)和扩散 Transformer(DiT)在视频生成领域的广泛应用,AI 合成视频的质量和连贯性有了飞跃式提升。像 OpenAI Sora、HunyuanVideo、Wan2.1 等大模型,已经能够生成结构清晰、细节丰富且高度连贯的长视频内容,为数字内容创作、虚拟世界和多媒体娱乐带来了巨大变革。