走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理
走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理最近,有人在社交媒体上发布了一张有关 GPT4.5 更新的截图。图中内容显示,和 GPT 系列之前推出的模型相比,GPT4.5 最大的惊喜可能就是处理 3D 和视频的能力。至于 3D 能力到底是指看得懂 3D 图像,还是能输入 3D 模型,目前只能靠猜。
搜索
最近,有人在社交媒体上发布了一张有关 GPT4.5 更新的截图。图中内容显示,和 GPT 系列之前推出的模型相比,GPT4.5 最大的惊喜可能就是处理 3D 和视频的能力。至于 3D 能力到底是指看得懂 3D 图像,还是能输入 3D 模型,目前只能靠猜。
用扩散模型预测化学反应,速度直接暴涨1000倍!原本需要用计算机硬算几小时甚至一天,现在单个GPU用6秒钟就能搞定。
多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。
本文讨论了人文学者刘擎和钉钉总裁叶军对于AI时代的不同看法。刘擎担心AI可能引发社会阶层变化和人类关系改变的问题,而叶军持乐观态度认为AI能够提升生产力和创造更多机会。文章还探讨了AI对组织结构和关系的影响。
12月15日,上海交通大学医学院附属瑞金医院正式发布瑞金医学大模型矩阵,涵盖RJH-Base基座大模型、RJH-Med应用大模型,以及多模态大模型,并携手上海人工智能实验室、腾讯等建设可持续发展的医学大模型应用生态,实践以数据、知识、算法、模型为关键驱动的医学AI新范式。
大语言模型作为操作系统级的技术革新,在 2023 年涌现出强大的理解和推理能力。在大模型走向日臻完善的过程中,相信 AGI 的先行者已经率先把新一代技术底座融入进产品,来增强个体的人生。
在数字化建设不断推进的今天,随着技术的不断发展,从统计学、机器学习、深度学习,再到因果学习以及最新的热门大模型方向,九章云极 DataCanvas 始终紧贴最前沿的、最能助力企业和落地实践的方向,不断进行着面向决策和面向智能的探索。本文将分享大模型时代下的因果推断。
这是王小川创业做大模型的第 8 个月。很多过去行业的常识、惯性的做法,都不再适用当下的大模型时代,
小模型的风潮,最近愈来愈盛,Mistral和微软分别有所动作。而网友实测发现,Mistral-medium的代码能力竟然完胜了GPT-4,而所花成本还不到三分之一。
最近,UC伯克利的一项研究揭示了LLM和小孩子们在认知上的一项重要差别——创造新的因果结构的能力。
人在家中坐,秒变马斯克。
对海外AI业务依赖于国外厂商API的字节而言,微软的态度将至关重要。
大模型的领域工程,是要将行业模型的参数规模做小,任务执行效率更高的同时,节省算力和部署成本。
12月16日,商汤科技发布讣告称,商汤科技创始人、香港中文大学信息工程学系教授汤晓鸥因病去世,享年55岁。
文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720 分辨率没有压力,而且生成效果非常连贯。
今天,我要和大家聊一聊近期在AI领域掀起波澜的一款产品:字节跳动推出的coze。
12月13日,由韩国MBC电视台内部企业VLAST推出的虚拟男团PLAVE凭借新曲《Merry PLLIstmas》打入Melon排行榜13日日榜123位、Bugs日冠,以逆袭男团“音源不入榜魔咒”、远远高于诸多五代和六代真人男团的成绩,引起K-Pop粉丝高度关注。
AI可以从自己生成的「合成数据」中学习,最重要的是,能够大幅提升数据问题解决和代码生成的能力。
OpenAI的出现,源自马斯克和拉里佩奇的一场争论。那是在2015年,特斯拉刚刚盈利,佩奇还是谷歌的CEO。就是这场争吵的几周后,OpenAI在一次晚饭上诞生。
据外媒报道,在生成式AI竞争中处于落后的字节跳动想要“抄近道”,该公司一直在秘密使用OpenAI的技术开发自家大语言模型,这违反了OpenAI的服务条款。
离圣诞节还有一周了,GPT-4.5是发还是不发?OpenAI还没动作,网上已经是各种爆料漫天飞。各位大V煞有介事,Altman则是急着辟谣。按以往的规律看,这次爆料的真实性倒是不小。
Ilya领衔的OpenAI对齐团队,刚刚发表了首篇论文——用类似GPT-2监督GPT-4的方法,或可帮人类搞定自己更聪明的超级AI!
困扰数学家多年、让陶哲轩直呼喜欢的上限集问题数学难题,竟然被DeepMind的新算法破解了?这是史上首个用LLM发现的算法,堪称里程碑级研究,一经发布立马登Nature。
更多孩子靠AI回家
AI技术的应用,为我们的生活带来巨大变化。当AI技术应用到声音领域,是否面临侵权风险?司法又将如何回应?12月12日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例“AI声音侵权案”。
本文讨论了巨头AI受困于巨头垄断的问题,指出在线模型受商业壁垒限制,无法满足用户的个性化需求。文章以旅行计划为例,说明了通过本地部署的通用AI可以更好地满足用户需求。
DeepMind的研究团队开发了一款基于大型语言模型的人工智能系统,名为FunSearch,可以在数学和计算机科学中生成新的解。通过迭代中的进化,FunSearch能够解决复杂的数学问题,并发现新的数学知识和算法。这种基于大型语言模型的人工智能系统不仅能超越人类数学家,而且比现有的方法更有效。
GPT 4.5疑似大泄漏: 一个是新模型将具备全新多模态能力,文本语音图片以及视频和3D信息全都能一并处理,并且还可以跨模态理解。
用大模型解决困扰数学家60多年的问题,谷歌DeepMind最新成果再登Nature。
区别于其他智库和研究机构,量子位智库基于量子位长期以来对AI及其他前沿科技的追踪报道,积累了数年对前沿科技的深入洞察。