Is Scaling All You Need? LLM收益递减,AI小厂难活命
Is Scaling All You Need? LLM收益递减,AI小厂难活命在GPT-4发布后14.5个月里,LLM领域似乎已经没什么进步了?近日,马库斯的一句话引发了全网论战。大模型烧钱却不赚钱,搞AI的公司表示:难办!
搜索
在GPT-4发布后14.5个月里,LLM领域似乎已经没什么进步了?近日,马库斯的一句话引发了全网论战。大模型烧钱却不赚钱,搞AI的公司表示:难办!
现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输出构造更可靠的偏好数据,结合视觉约束提高学习效率和准确性。
号称不可能轻易被击败的AGI基准ARC-AGI被GPT-4o撼动,GPT-4o以在公共测试集50%、在训练集71%的准确率成为了新的SOTA!
一年一度CVPR最佳论文放榜了!刚刚结束开幕演讲上,公布了2篇最佳论文、2篇最佳学生论文、荣誉提名等奖项。值得一提的是,今年北大上交摘得最佳论文提名桂冠,上科大夺得最佳学生论文。
炸裂!OpenAI真正的灵魂人物Ilya,刚刚官宣了自己出走OpenAI后要创建的新公司——SSI,也即安全超级智能。好家伙,这是直接跨过AGI了,Ilya手里究竟捂着什么前沿研究技术?网友们激动得奔走相告,更有大佬在评论区留言:请收下我的赞助!
继Sora官宣之后,多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来,LUMA、Gen-3 Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力,文生视频、图生视频的新前沿不断被扩展令大家惊喜不已,抱有期待。
机器人操纵的一个基本目标是使模型能够理解视觉场景并执行动作。
图灵奖得主Hinton在他的访谈中提及「在未来20年内,AI有50%的概率超越人类的智能水平」,并建议各大科技公司早做准备,而评定大模型(包括多模态大模型)的「智力水平」则是这一准备的必要前提。
为了实现高精度的区域级多模态理解,本文提出了一种动态分辨率方案来模拟人类视觉认知系统。
Claude大模型又双叒叕更新升级了!
水能载舟,亦能覆舟
稚晖君创立智元机器人,资本竞相投资。
大模型、AI 搜索的一次重要实践。
怎么度量现在的AI到底能干什么不能干什么?
GPT-4通过图灵测试,54%人误认为真人。
AI正在改变消费电子产品。
一场关于非共识和长期最优解的对话。
Ilya去哪了?这个自去年年底OpenAI上演宫斗之后,所有关心AI的人都在问的问题,有了最终的答案。
人工智能技术创新与产业发展综合实力将进入全国第一方阵。
今天, OpenAI劲敌Anthropic忽然丢炸弹,发布下一代旗舰大模型Claude 3.5 Sonnet。
测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了,针对视频理解能力的那种。
城市时空的预测,迎来GPT时刻。 清华大学电子系城市科学与计算研究中心推出了第一个无需自然语言的纯时空通用模型——UniST,首次展示了纯时空模型本身的通用性和可扩展性,研究成果已被KDD2024接收。
将音频、图像、视频整合进同一工作流,这个由斯坦福初创公司发布的视频工具火了! 预览版支持生成30S逼真视频,网友们直呼不输Luma。
毕业季,大模型人才正在被各家大厂和创业公司重金哄抢。 刚刚,腾讯也曝光了他们与大模型相关的人才计划,并且直通2025年校招—— 将面向全球范围内大举扩招50%大模型人才,并且放话薪资算力什么的不用愁。 不出所料,各家抢人下手都既快又狠,晚一步生怕就抢不到(不是)。
今天凌晨,OpenAI前首席科学家Ilya Sutskever向外界透露了他的最新动态。 不要再问Ilya去哪了,他宣布创立了一家名为“安全超级智能”(Safe SuperIntelligence,简称SSI)的新公司。
OpenAI从非营利转向营利引发争议,奥尔特曼遭批评。
Copilot GPT的叫好不叫座,似乎成了显而易见的事情。
AI对计算栈的改变远超过去50年各种变化的总和。
AI时代的危机!
在随时会被大模型能力覆盖掉的品类里如何突出重围。