翁荔,掌管OpenAI安全的北大校友,刚刚现身B站线下演讲
翁荔,掌管OpenAI安全的北大校友,刚刚现身B站线下演讲OpenAI研究副总裁(安全)翁荔(Lilian Weng),现身国内! 还首次在国内大型活动场合公开发表AI主题演讲。
搜索
OpenAI研究副总裁(安全)翁荔(Lilian Weng),现身国内! 还首次在国内大型活动场合公开发表AI主题演讲。
11月1日,夸克全面升级“AI搜题”产品,让搜题与解题的过程速度更快、能力更强。用户可通过手机、平板、电脑等设备搜到各类新题和难题
近日,小编每天都在蹲守@raccoonstolemyiphone博主的更新贴。分享的内容真的太有趣了!故事的开始就像博主的名字一样——raccoon stole my iphone,浣熊偷了我的iPhone。
创新是避免内卷的终极解药,这在3D打印行业同样适用。
多图像场景也能用DPO方法来对齐了! 由上海交大、上海AI实验室、港中文等带来最新成果MIA-DPO。 这是一个面向大型视觉语言模型的多图像增强的偏好对齐方法。
现在,一个大模型就能直接拿来当游戏,还是开放世界的那种! 可以直接根据玩家操作预测下一帧,连游戏引擎都省了。 这个怎么看都像是《我的世界》的界面,就是这款游戏Oasis本尊了。
虽然有些人认为人工智能是种威胁,但美国军方却将其视为探测威胁的工具。美国防部近期在肯塔基州蓝草陆军仓库(BGAD)部署了一套由安防初创公司Scylla开发的人工智能监控系统,以提升军事设施的安保能力。该系统在为期八个月的测试中展现出卓越的性能,将为美国核设施安全带来革命性变革。
就在刚刚,CEO奥特曼携4大高管集体亮相reddit有问必答活动(AMA ),挨个回复了大家对OpenAI主要产品、AGI路线规划等提问。
人在知乎,正经搞科研,这事儿越来越有谱了(doge)。 想了解下学术热点,直接一搜,AI不仅一步到位给出总结,连参考文献都列好了。
临近年关,打算开个新系列,从总结视角聊聊AI领域的新趋势,顺便填坑。第一篇先聚焦产品形态的变化。
探索更高效的模型架构, MoE是最具代表性的方向之一。 MoE架构的主要优势是利用稀疏激活的性质,将大模型拆解成若干功能模块,每次计算仅激活其中一小部分,而保持其余模块不被使用,从而大大降低了模型的计算与学习成本,能够在同等计算量的情况下产生性能优势。
专注金融领域的AI Agent平台Interface.ai宣布完成3000万美元首次融资,由Avataar Venture Partners领投。
本文介绍了一种自动化故事可视化系统,可以生成多样化、高质量、一致性强的故事图像,且需要最少的人工干预。
今天 ChatGPT 的搜索功能发布了,或许是已经用 Perplexity 比较习惯,此次 ChatGPT 的搜索就没太多惊艳感了,所以我体验了一下感觉效果一般般,看看后续多用用会不会有更多不一定的体验。
CGPO框架通过混合评审机制和约束优化器,有效解决了RLHF在多任务学习中的奖励欺骗和多目标优化问题,显著提升了语言模型在多任务环境中的表现。CGPO的设计为未来多任务学习提供了新的优化路径,有望进一步提升大型语言模型的效能和稳定性。
强化学习(RL)对大模型复杂推理能力提升有关键作用,然而,RL 复杂的计算流程以及现有系统局限性,也给训练和部署带来了挑战。
大模型热,企业落地难?就在刚刚,百川智能推出「1+3」产品矩阵,一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」,仅需10分钟就能让企业自主成为模型定制增强专家,实现行业最佳的多场景可用率。
2024年10月24日,全球生命科学行业云软件领导者Veeva Systems (NYSE: VEEV) 在上海举“2024 Veeva中国商务峰会”,活动现场,Veeva宣布了其基于中国市场洞察的一系列业务进展。
时代变了,最强 AI 加持搜索引擎问世,没有广告。
对于人类而言,一旦掌握了 “打开瓶盖” 的动作,面对 “拧紧螺丝” 这样的任务通常也能游刃有余,因为这两者依赖于相似的手部动作。然而,对于机器人来说,即使是这样看似简单的任务转换依然充满挑战。例如,换成另一种类型的瓶盖,机器人可能无法成功打开。这表明,目前的机器人方法尚未充分让模型学习到任务的内在执行逻辑,而只是单纯的依赖于数据拟合。
大型语言模型在学习概念时竟然会形成令人惊讶的几何结构,比如代码和数学特征会形成一个「叶(lobe)」,类似于我们在做磁共振功能成像时看到的大脑功能性脑叶。这说明什么呢?
在奖励中减去平均奖励
Unbounded 是由 Google 研发的一个创新的角色模拟生成性无限游戏,它通过采用最新的生成模型技术,突破了传统视频游戏的局限。
Ferret-UI 2 是苹果研究团队最新发表的一款先进的多模态大型语言模型(MLLM),旨在实现跨多个平台的通用用户界面(UI)理解。
Agent-to-Sim (ATS) 是一个创新的三维模拟系统,能够从日常视频集合中学习三维代理的交互行为模型,由 Meta Codec Avatar 实验室主导研发。
OmniParser 是由微软研究院提出的一个创新性工具,旨在通过解析用户界面截图来增强基于视觉的图形用户界面(GUI)代理的性能。
来自华东师范大学、南洋理工和中科院等高校的联合研究团队提出了一种新颖的人工智能教育框架“场景-对象-评估”(SOE),旨在利用大型语言模型(LLMs)构建能够模拟人类学生行为和个体差异的虚拟学生代理(LVSA)。
在 Reddit AMA中,OpenAI 首席执行官萨姆·奥特曼承认,计算能力不足是阻碍公司频繁推出产品的一个主要因素。
NotebookLM是谷歌开发的一款人工智能驱动的研究和写作工具,上传一个源文件,它会为用户生成一个音频概述或播客。这款产品的爆火很大一部分原因是简单的一键式体验,研发人员将交互按钮设计得十分简洁有趣,吸引更多用户尝试。
全球AI驱动的旅游市场正处于快速增长阶段,预计市场规模将从2023年的1,317亿美元增至2033年的29,037亿美元,年均增长率达到36.25%。