
小红书&上交多模态大模型新基准,Gemini 1.5 Pro准确率仅48%
小红书&上交多模态大模型新基准,Gemini 1.5 Pro准确率仅48%多模态大模型理解真实世界的水平到底如何?
多模态大模型理解真实世界的水平到底如何?
整个春节假期,我眼睁睁看着 DeepSeek 从“全民狂欢”变成“全民卡顿”——官网十问九崩,还有谁没被“服务器正忙,请稍后重试”的提示,搞崩溃过。
现在,人人都可以构建DeepSeek智能体了!
席卷全球的 DeepSeek 依然是科技圈最大的话题,连 San Altman 都承认每天醒来都会担忧。因此本周在巴黎举办的 AI 行动峰会聚光灯稍显黯淡,但这里依然汇聚了全球大量重要的头脑。
最近,外媒Bloomberg曝出了惊人消息:DeepSeek的估值竟已飙至1500亿美元,已经达到OpenAI的一半?在巴黎AI峰会现场,DeepSeek已经如同房间里的大象。甚至巴黎地铁里的70岁老人也开始讨论DeepSeek!
超级碗再次证明了自己是美国最优秀的职业体育赛事。 作为转播商的福克斯,公布了美国时间2月9日举行的超级碗转播相关记录。福克斯引用收视率调查企业尼尔森,和负责流媒体转播的Tubi,以及NFL官方网站的数据计算,此次超级碗平均有1.26亿人观看。
最近有文章称“DeepSeek让多地智算中心停建”,但不少业内人士并不认同。春节之后,不少企业,尤其是上市公司,都正在接入DeepSeek。未来几个月将是应用验证期。
最近,全球科技行业的焦点无疑落在了DeepSeek引发的热潮之上。几乎在一夜之间,全球市场对中国AI大模型及其相关产业的态度发生了180度转变——从此前的“过度悲观”瞬间跳跃至“极度乐观”,2025也似乎成为中美AI对决元年。
DeepSeek 最近的爆火程度令人咋舌。短短20天内用户量就突破3000万,导致官方服务器几乎天天处于过载状态。虽然市面上已经涌现出不少第三方接入平台,但这些平台大多针对个人用户,对开发者和企业的需求难以满足。
OpenAI 又来刷存在感了。 就昨天的事儿,秀儿 OpenAI 在 “ 美国春晚 ” 超级碗上打了一个长达 60 秒的广告,用黑白点彩画的风格,展现了一波人类技术的发展和进化。
MattoBoard,一家旨在简化室内设计师和建筑师创作过程的云端软件,正在进入人工智能领域。周二,这家初创公司宣布完成 200 万美元的种子融资,将支持推出一项名为 Design Stream 的新功能,这是一款基于人工智能的视觉搜索和发现工具。
还在用枯燥的数学题和编程题测试AI?落伍啦!现在,打游戏就能测出AI的真实力。GameArena团队打造的Roblox新游《AI空间逃脱》,让你在紧张刺激的密室逃脱中,顺便就把AI模型的推理能力给评估了。这不仅比传统测试方法更有趣,还能生成宝贵的游戏数据,帮助开发者更全面地了解AI的强项与短板。
凌晨的时候,使用deepseek深度思考+联网搜索做了一个AI产品卡片,展示效果很惊艳,如下是做了几个关于AI教育智能硬件产品的特性图,放几个看看效果。我们需要深度思考+联网搜索的能力,需要根据关键词去检索到详细的信息源,因此联网搜索必不可少,然后根据如上搜索整合的信息让deepseek自适应地根据内容进行排版,选择不同地风格,呈现不同地样式。
开源推理大模型新架构来了,采用与Deepseek-R1/OpenAI o1截然不同的路线: 抛弃长思维链和人类的语言,直接在连续的高维潜空间用隐藏状态推理,可自适应地花费更多计算来思考更长时间。
这一篇文章来源于我自己的困惑而进行的探索和思考,再进行多次讨论后总觉隔靴搔痒,理解不透彻。 而在我自己整理后,发现已经有小伙伴点明了他们的区别。但是因为了解深度的不够,即使告诉了答案,我也无法理解,总有隔靴搔痒之感。
在2023年2月,我正处于大学的最后一年,课业繁重。当时,我没有从Meta的实习中获得回聘,事后回想,这反而是发生在我身上最好的事情。我受到了独立黑客圈里一些大佬的启发,他们开始涉足AI领域,像Pieter Levels这样的名字激励了我。于是,我开始探索如何利用OpenAI的API构建有用的工具。
在巴黎AI行动峰会上,李飞飞博士作为开幕嘉宾受邀发表演讲。她带领我们回顾了人工智能的发展,重点讲解了她现在的研究方向「空间智能」与「具身智能」。马克龙为峰会造势使用的AI生成视频同样引起了人们热议。
梁文峰说,钱从来都不是问题,唯一担心的是缺算力。不过,基于国产昇腾算力的DeepSeek R1系列推理API,性能已经直接对标高端GPU了!而且,华为已经率先携手国内15所头部高校,打造出了独一份的科教创新卓越/孵化中心,通过产教融合、科教融汇破解高校科研的算力困局。
复旦新研究揭示了AI系统自我复制的突破性进展,表明当前的LLM已具备在没有人类干预的情况下自我克隆的能力。这不仅是AI超越人类的一大步,也为「流氓AI」埋下了隐患,带来前所未有的安全风险。
人类通过课堂学习知识,并在实践中不断应用与创新。那么,多模态大模型(LMMs)能通过观看视频实现「课堂学习」吗?新加坡南洋理工大学S-Lab团队推出了Video-MMMU——全球首个评测视频知识获取能力的数据集,为AI迈向更高效的知识获取与应用开辟了新路径。
2月11日,在阿联酋迪拜举办的World Governments Summit 2025峰会上,百度创始人李彦宏与阿联酋AI部长奥马尔·苏丹·奥拉马(Omar Sultan AI Olama)对谈时表示,尽管技术进步、成本降低,但仍需持续投入AI基础设施,以确保处于技术创新的最前沿。
微软 ( NASDAQ: MSFT) 2025 年第一季度营收激增,同时还有大规模的人工智能投资(1000 亿美元)。此后,该股表现略逊于市场(标准普尔 500 指数,+3.65%),价格回报率为负 1%。几天前,该公司公布了第二季度业绩。
DeepSeek的爆火,让AI大模型在新一年的开年,又一次引起了全球的关注。然而,时至今日全球AI领域还没有完全消化DeepSeek带来的实质影响——这样的模式将给全球、给中国AI领域带来什么样的变局?
基于400万条Claude真实对话数据,Anthropic重磅发布全新报告!基于400万条Claude真实对话数据,Anthropic重磅发布全新报告!这些有关AI在各经济领域应用情况的问题,报告用实实在在的统计数据全回答了。
字节出了个全新架构,把推理成本给狠狠地打了下去!推理速度相比MoE架构提升2-6倍,推理成本最高可降低83%。
推理大语言模型(LLM),如 OpenAI 的 o1 系列、Google 的 Gemini、DeepSeek 和 Qwen-QwQ 等,通过模拟人类推理过程,在多个专业领域已超越人类专家,并通过延长推理时间提高准确性。推理模型的核心技术包括强化学习(Reinforcement Learning)和推理规模(Inference scaling)。
用了两天接入了DeepSeek R1的飞书,坦率的讲,我已经被彻底折服了,今天,我必须要写一篇文章安利一下。故事是这样的。飞书的多维表格,在前天下午接入了满血版的DeepSeek R1。
先是三星宣布智谱的Agentic GLM成为其新手机Galaxy S25的AI能力来源,紧接着The Information爆料,在经历了近一年的模型测试与合作伙伴探索后,苹果终于敲定了中国市场的合作伙伴:阿里巴巴。这意味着,中国iPhone用户很可能在今年迎来一个由国产大模型驱动的iPhone。
今天又得知咱们的老朋友,支付宝推出的智能体开发平台百宝箱,也悄悄接入了 DeepSeek!还一下子直接接入了 DeepSeek-R1 满血版、蒸馏版 32B、蒸馏版 7B、DeepSeek-V3 共四种尺寸。
科技公司、车企或者是新消费企业,一时间都宣布接入DeepSeekR1大模型。DeepSeek,成了当下的“AI显学”。网易有道、学而思、云学堂行业里做软件的,做内容的,做平台的都宣布接入DeepSeek大模型。