
2025,10个AI展望
2025,10个AI展望AI技术在2025年多领域发展,企业创新与应用日新月异。
AI技术在2025年多领域发展,企业创新与应用日新月异。
当o3编程碾压人类竞赛选手,一个更具前瞻性的声音传来——OpenAI现任董事会主席Bret Taylor发表重磅文章,首次深入探讨了软件工程即将到来的「自主时代」。
Daze是一款针对Z世代或初高中学生的熟人社交通讯应用程序,上线前通过实际使用视频宣传打破传统聊天范式,在各大社交媒体平台爆火,有近20万用户注册在等候名单。
近年来许多论文研究了基于扩散模型的定制化生成,即通过给定一张或几张某个概念的图片,通过定制化学习让模型记住这个概念,并能够生成这个概念的新视角、新场景图片。
对抗攻击,特别是基于迁移的有目标攻击,可以用于评估大型视觉语言模型(VLMs)的对抗鲁棒性,从而在部署前更全面地检查潜在的安全漏洞。然而,现有的基于迁移的对抗攻击由于需要大量迭代和复杂的方法结构,导致成本较高
超越ControlNet++,让文生图更可控的新框架来了!
本月,OpenAI科学家就当前LLM的scaling方法论能否实现AGI话题展开深入辩论,认为将来AI至少与人类平分秋色;LLM scaling目前的问题可以通过后训练、强化学习、合成数据、智能体协作等方法得到解决;按现在的趋势估计,明年LLM就能赢得IMO金牌。
我们将讨论的不仅仅是哪个超级大国会胜出,而是哪个国家的AI系统会成为全球基础设施的基石,能够被广泛采用和输出。
刚刚,OpenAI正式一分为二!营利性部门转变为PBC,追求商业利润;而非营利部门,继续专注于健康、教育和科学慈善工作。从此,OpenAI再拿投资人的钱,可就没有障碍了!网友:OpenAI正式变身ClosedAI。
全球用户累计生成700万3D模型,海外上千用户上传自己生成的3D动画短片……
最有潜力的他们正在创造下一个时代的新公司
2023年6月,理想汽车推出了自研认知大模型“Mind GPT”,它以“理想同学”App的形式出现在理想汽车的车机中,支持通过自然语言交流、发送指令。2024年,Mind GPT升级到3.0,带来了行业领先的自然语言任务执行功能。
上线一周, gemini-2.0-flash-exp、gemini-2.0-flash-thinking-exp 已经成为了我日常对话频率最高的模型之一。
Orr Zohar的指导老师Serena Yeung-Levy教授于2018年获得斯坦福大学博士学位,师从李飞飞和Arnold Milstein。2017年至2019年期间,Serena Yeung-Levy曾与Justin Johnson和李飞飞共同教授斯坦福大学卷积神经网络课程。
2023年6月,理想汽车推出了自研认知大模型“Mind GPT”,它以“理想同学”App的形式出现在理想汽车的车机中,支持通过自然语言交流、发送指令。2024年,Mind GPT升级到3.0,带来了行业领先的自然语言任务执行功能。
一个全新的模型能力衡量指标诞生了?!
最好的办法就是一开始就保持绝对的真实和坦诚,营造一种真诚和透明的氛围。如果在这种过程中发现不合适,那其实是好事,因为比起在后期出现问题,早期发现不合适要好得多。
数字生命一直是人类几十年来的追求,反映了我们对技术与人类体验交汇的深层探索。近期,复旦大学发表了一篇综述论文,首次系统梳理了角色扮演AI(Role-Playing Language Agents,RPLAs)的研究现状,现已被机器学习顶级期刊TMLR接收。
近年来,视觉-语言-动作模型(Vision-Language-Action, VLA)在诸多机器人任务上取得了显著的进展,但它们仍面临一些关键问题,例如由于仅依赖从成功的执行轨迹中进行行为克隆,导致对新任务的泛化能力较差。
CPU+GPU,模型KV缓存压力被缓解了。 来自CMU、华盛顿大学、Meta AI的研究人员提出MagicPIG,通过在CPU上使用LSH(局部敏感哈希)采样技术,有效克服了GPU内存容量限制的问题。
控制无人机执行敏捷、高机动性的行为是一项颇具挑战的任务。传统的控制方法,比如 PID 控制器和模型预测控制(MPC),在灵活性和效果上往往有所局限。而近年来,强化学习(RL)在机器人控制领域展现出了巨大的潜力。通过直接将观测映射为动作,强化学习能够减少对系统动力学模型的依赖。
视频生成模型卷得热火朝天,配套的视频评价标准自然也不能落后。 现在,北京大学MMCAL团队开发了首个用于视频编辑质量评估的新指标——VE-Bench,相关代码与预训练权重均已开源。
2025 新年将至。对于新的一年和未来几年,你对 AI 领域有什么期待和设想呢?你是否认为 AGI 将要实现了而人类社会的一切都将因之而改变。
DeepSeek新版模型正式发布,技术大佬们都转疯了! 延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。
刚刚,OpenAI宣布了三件事:1、选择一个非营利/营利结构,最有利于使命的长期成功。2、使非营利组织可持续发展。3、使每个部分都能发挥作用。
17日众议院议长约翰逊提交避免行政部门停摆的3800亿美元紧急预算,一千五百页的文件只给议员留了17小时审查时间,按以往经验谁也看不完最后会顺利通过。但这次马斯克的DOGE部门启用AI(Gork)总结文档摘要,查出被塞进去的私货,包括给议员加薪40%、给议员增加健康保险等条款。
AI初创团队狸谱,过去半年间,他们接连推出两款新奇的AI小游戏,在二次元圈和AI圈颇受关注。我们联系到狸谱产品增长负责人Levi,聊了聊AI赛道“一波流”产品的魅力,以及他们打造这些破圈小游戏背后的产品增长经验。
加州大学洛杉矶分校计划在2025年学校的一门比较文学课程将由AI来生成教科书、作业和提供一个随时可以探讨问题的助教。得益于人工智能,2025 年的这门课程格式和材料将呈现出全新的面貌。
在和 AI 没什么关系的东南亚,菲律宾和 AI 正在发生化学反应。
在 AI 生成的这些视频中,你能判断出哪个是 Sora 生成的吗?