量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了,SU哈佛亚马逊最新研究引热议
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了,SU哈佛亚马逊最新研究引热议4-bit量化,能让现有反学习/机器遗忘技术失灵!
4-bit量化,能让现有反学习/机器遗忘技术失灵!
真・覆盖当前 AI 领域 90% 重要知识。
最近,Nature上的一项研究,全面驳斥了LLM具有类人推理能力的说法。研究者设定的「人类亲吻难题」把7个大模型彻底绕晕。最终研究者表示,与其说LLM是科学理论,不如说它们更接近工具,比如广义导数。
通过过程奖励模型(PRM)在每一步提供反馈,并使用过程优势验证器(PAV)来预测进展,从而优化基础策略,该方法在测试时搜索和在线强化学习中显示出比传统方法更高的准确性和计算效率,显著提升了解决复杂问题的能力。
多智能体系统,可自动化整个 ML 工作流程,节省数千小时工时。
本文介绍了来自北京大学王选计算机研究所的王勇涛团队的最新研究成果 VL-SAM。针对开放场景,该篇工作提出了一个基于注意力图提示的免训练开放式目标检测和分割框架 VL-SAM,在无需训练的情况下,取得了良好的开放式 (Open-ended) 目标检测和实例分割结果,论文已被 NeurIPS 2024 录用。
生成式AI技术不断进步,但能打动玩家的仍是设计背后与人有关的部分。
近日,中科大王杰教授团队 (MIRA Lab) 针对离线强化学习数据集存在多类数据损坏这一复杂的实际问题,提出了一种鲁棒的变分贝叶斯推断方法,有效地提升了智能决策模型的鲁棒性,为机器人控制、自动驾驶等领域的鲁棒学习奠定了重要基础。论文发表在 CCF-A 类人工智能顶级会议 Neural Information Processing Systems(NeurIPS 2024)。
近两年来,AI儿童陪伴领域涌入了不少创业者,吸引众多目光,儿童陪伴也成为AI大模型落地的重要场景。
利用概念激活向量破解大模型的安全对齐,揭示LLM重要安全风险漏洞。
Chatgpt带来的AI技术风潮到今天已经进入新的阶段, AI推动商业技术进步和产品升级的过程中,越来越倾向于一个词——落地。
在当前 AI 开发中,提示词工程常常面临优化耗时、效果不稳定等挑战。LangChain 近日推出自家的自动提示词优化工具Promptim[1],为开发者提供了一套系统化改进 AI 提示词的解决方案。这款工具能够自动优化特定任务的提示词,显著提升开发效率。
预测金融市场和股票价格变动需分析公司表现、历史价格、行业事件及人类因素(如社交媒体和新闻报道)。
大家好,今天我们要聊的是Relume.io。这个AI网站构建平台能够让你以前所未有的速度设计和搭建网站。
草图在人类生活中扮演着重要角色
语音交互体验成为了 AI 落地的一块绊脚石。 而如今扣子推出的技术,有望使这种情况成为过去式。
这两天,我被这个Claude3.5这个神级Prompt惊呆了。 佩服的五体投地。 非常简单的话说,就是它用Prompt把o1级别的思维链,复刻到了Claude3.5里,而且思考逻辑更详细、更像人,甚至思考过程都跟o1一样,可以展开折叠。
鲨疯了!谷歌新版Gemini超越o1,强势登顶竞技场总榜第一! 在经6000+网友匿名投票后,不仅数学成绩和学霸o1相当,还拿下其它5个单项第一。
测评大模型Agent能力,从未如此直观。 新旧两版Claude 3.5 Sonnet在《我的世界》里PK盖楼,差距不要太明显,引来大量围观。
OpenAI发布了支持Windows和macOS的ChatGPT桌面端,这种更加集成化的形式为用户在各种生活与工作的场景下,带来了更好的无缝式交互体验。对于常在桌面端办公的开发者来讲,应用协作功能尤其引人注目并超乎期待。
今天,给大家介绍一款我们最近新出的产品,AI智能工作台ima.copilot(简称ima)
OpenAI奥特曼前天发了条神神秘秘的推文,“there is no wall”。
硅谷的AI科技新秀AKOOL以其革命性的AI技术,为广告营销领域带来前所未有的变革。从面部增强到实时数字人,再到未来新一代的视频编辑器,不仅提升了广告的互动性和个性化,还为品牌提供了全新的传播渠道。随着AKOOL技术的不断进步,我们期待它将如何继续推动广告营销行业的创新和发展。
MEGA-Bench是一个包含500多个真实世界任务的多模态评测套件,为全面评估AI模型提供了高效工具。研究人员发现,尽管顶级AI模型在多个任务中表现出色,但在复杂推理和跨模态理解方面仍有提升空间。
这篇文章获选 Neurips 2024 Spotlight,作者均来自于伊利诺伊大学香槟分校计算机系。第一作者是博士生林啸,指导老师是童行行教授。所在的 IDEA 实验室的研究兴趣涵盖图机器学习、可信机器学习、LLM 优化以及数据挖掘等方面。
Sora 的发布让广大研究者及开发者深刻认识到基于 Transformer 架构扩散模型的巨大潜力。作为这一类的代表性工作,DiT 模型抛弃了传统的 U-Net 扩散架构,转而使用直筒型去噪模型。鉴于直筒型 DiT 在隐空间生成任务上效果出众,后续的一些工作如 PixArt、SD3 等等也都不约而同地使用了直筒型架构。
受 ChatGPT 强大问答能力的影响,大型语言模型(LLM)提供商往往优化模型来回答人们的问题,以提供良好的消费者体验。
2024 年,AI 大模型从「以分计价」跨入「以厘计价」的时代。
2024年下半年,AI行业的人才流动呈现出戏剧性的转折:从科技巨头出走创业后,如今又选择回流大厂。
破解基因组的奥秘一直是生物科学的前沿挑战,如何让人工智能(AI)读懂 DNA 的复杂信息,并用它来设计和操控生命的“程序代码”?