拜拜了GUI!中科院团队“LLM友好”计算机使用接口来了
拜拜了GUI!中科院团队“LLM友好”计算机使用接口来了大模型Agent帮你自动操作电脑,理想很丰满,现实却骨感。
大模型Agent帮你自动操作电脑,理想很丰满,现实却骨感。
自回归(AR)大语言模型逐 token 顺序解码的范式限制了推理效率;扩散 LLM(dLLM)以并行生成见长,但过去难以稳定跑赢自回归(AR)模型,尤其是在 KV Cache 复用、和 可变长度 支持上仍存挑战。
10月,韩国成了 AI 产业最热战场
真正推动AI革命的,不是天才,而是懒人?那做的少、却赚得多的人,正在成为AI时代的赢家。当机器替我们写、画、想甚至设定目标,人类的勤奋成了旧时代的美德。别害怕AI取代你——先问问自己,还想亲自动手吗?
十月,《纽约时报》发表了题为《The A.I. Prompt That Could End the World》(《那个可能终结世界的 AI 提示词》)的文章。作者 Stephen Witt 采访了多位业内人士:有 AI 先驱,图灵奖获奖者 Yoshua Bengio;以越狱测试著称的 Leonard Tang;以及专门研究模型欺骗的 Marius Hobbhahn。
在一篇论文中,研究人员测试了 11 种 LLM 如何回应超过 11500 条寻求建议的查询,其中许多查询描述了不当行为或伤害。结果发现 LLM 附和用户行为的频率比人类高出 50%,即便用户的提问涉及操纵、欺骗或其他人际伤害等情境,模型仍倾向于给予肯定回应。
出品 / 新浪科技(ID:techsina) 作者 / 郑峻 Meta AI业务大地震!新主管上任三个月后,挥起裁员大刀,基础研究部门遭受重创,连明星大牛研究员都不幸失业。扎克伯格这是急功近利,自毁长
近日,有消息称,由百度集团前副总裁景鲲(Eric Jing)创立的AI搜索公司Genspark即将完成一笔2亿美元的新融资,投后估值预计达到10亿美元。
OpenAI距离IPO更近一步。最新消息,软银批准了对OpenAI剩余的225亿美元投资,这笔融资的条件是OpenAI要在年底前完成重组,为上市铺平道路。与此同时,奥特曼各种骚操作被曝光:他绕过投行和律师,主要依靠自己的心腹和英伟达、AMD等谈判,操盘了价值1.5万亿美元的芯片交易。
我已经设置了不要给我发疑问句
在硅谷AI竞赛的风暴眼中,研究员与高管以「战时」强度奔跑:从Anthropic的深夜Slack,到DeepMind的「0-0-2」作息与难享之财;微软以AI自救仍难减负;OpenAI为遏止倦怠与Meta挖角被迫「停摆一周」。这是一场以天才、时间与心力为燃料的冲刺,推动突破,也将人推向临界点:灯火通明,平衡仍无解。
在开放研究领域里,苹果似乎一整个脱胎换骨,在纯粹的研究中经常会有一些出彩的工作。这次苹果发布的研究成果的确出人意料:他们用谷歌的 Nano-banana 模型做个了视觉编辑领域的 ImageNet。
2025 年 10 月 22 日,AI 基础设施公司 Fal.ai宣布完成新一轮 2.5 亿美元融资。据悉,凯鹏华盈与红杉资本领投此轮,公司估值超40亿美元。
如何让一个并不巨大的开源大模型,在面对需要多步检索与复杂逻辑整合的问题时,依然像 “冷静的研究员” 那样先拆解、再查证、后归纳,最后给出可核实的结论?
这些刷屏的AI图片,你刷到了没?就是那种——和自己专属emoji合影的黏土风照片,画风长这样:本来以为是NanoBanana整的新玩法,结果点开评论区一看:嗐,原来是美图自家的AI Agent——叫RoboNeo~
语言模型遭遇严重的位置偏见,即模型对不同上下⽂位置的敏感度不⼀致。模型倾向于过度关注输⼊序列中的特定位置,严重制约了它们在复杂推理、⻓⽂本理解以及模型评估等关键任务上的表现。
聚焦大型语言模型(LLMs)的安全漏洞,研究人员提出了全新的越狱攻击范式与防御策略,深入剖析了模型在生成过程中的注意力变化规律,为LLMs安全研究提供了重要参考。论文已被EMNLP2025接收
最近的 Meta 可谓大动作不断,一边疯狂裁人,一边又高强度产出论文。
你永远无法精确描述出梵高的笔触或王家卫的光影。AI创作的未来,是让AI直接「看懂」你的灵感,而不是去揣摩你的指令。
《职场Bonus》独家获悉,“AI六小龙”零一万物迎来一轮密集的高管变动:前百度智能云中国区副总经理沈鹏飞已于今年零一万物转型后以联合创始人身份加入公司,负责零一万物 ToB、ToG 业务拓展与销售体系。
如何科学地给大模型「找茬」?Anthropic联合Thinking Machines发布新研究,通过30万个场景设计和极限压力测试,扒了扒OpenAI、谷歌、马斯克家AI的「人设」。那谁是老好人?谁是效率狂魔?
周末看到了宝玉老师的一个帖子,我自己其实有非常强烈的共鸣。 宝玉老师说的是编程,而我在创作这块,其实一直都有相同的观点: 如果你是一个想在某个领域,真正深耕下去,想成为这个领域的专家,那么,在你独立、手动、不借助(或极少借助)AI,完成1000个小时的刻意练习之前,离AI远一点。
在机器人与智能体领域,一个老大难问题是:当你让机器人 “把黄碗放进白色空篮子” 或 “从微波炉里把牛奶取出来放到餐桌上” 时,它不仅要看懂环境,更要解释指令、规划路径 / 可操作区域,并把这些推理落实为准确的动作。
看似无害的「废话」,也能让AI越狱?在NeurIPS 2025,哥大与罗格斯提出LARGO:不改你的提问,直接在模型「潜意识」动手脚,让它生成一段温和自然的文本后缀,却能绕过安全防护,输出本不该说的话。
OpenAI近日接连发布《日本经济蓝图》和《韩国经济蓝图》,标志其亚太战略从「产品输出」升级为「国家级合作」。在韩国,OpenAI提出「双轨战略」,推动韩国跻身全球AI前三强;在日本,则以「三支柱」计划为核心,助力日本借由AI重塑全球技术引领地位。
在 AI 时代,开发的边界正被重新划定。 我们能够观察到,越来越多的产品经理、数据分析师、设计师,甚至内容创作者,正在熟练地使用 Cursor、ChatGPT、DeepSeek 等 AI 工具,解决真
HuggingFace 与牛津大学的研究者们为想要进入现代机器人学习领域的新人们提供了了一份极其全面易懂的技术教程。这份教程将带领读者探索现代机器人学习的全景,从强化学习和模仿学习的基础原理出发,逐步走向能够在多种任务甚至不同机器人形态下运行的通用型、语言条件模型。
一场公开演讲,LeCun毫不留情揭穿真相:所谓的机器人行业,离真正的智能还远着呢!这番话像一枚深水炸弹,瞬间引爆了战火,特斯拉、Figure高管纷纷在线回怼。
Viven 的核心创新在于,它为每个员工创建了一个个性化的大语言模型,实质上就是一个数字分身。这个分身通过访问员工的内部电子文档,包括邮件、Slack 消息、Google Docs、会议记录等,学习这个人如何思考、如何沟通、拥有什么知识。关键是,这个学习过程是自动进行的,不需要员工做任何额外工作。你只需正常工作,你的数字分身就会不断更新和进化。
Gambo 称自己为 “世界上第一个 Game Vibe Coding Agent”。用户只需描述游戏类型、主题或风格,AI 就会自动生成场景、角色、交互与音效,并把这些内容编织成一个可玩的世界。