
1篇长文 = N张小红书爆款图?!Gemini 2.5 Pro 这效率,我跪了!
1篇长文 = N张小红书爆款图?!Gemini 2.5 Pro 这效率,我跪了!你有没有这样的烦恼:辛辛苦苦写完一篇公众号文章,想转发到小红书,却要再花大量时间制作3:4比例的精美图片?作为一个小红书小号拥有者(小1万粉丝呢,虽然躺在那吃灰有点可惜),我深知这种痛苦。每次想着要做几张图片就头大,甚至因此放弃了不少内容的二次分发。
你有没有这样的烦恼:辛辛苦苦写完一篇公众号文章,想转发到小红书,却要再花大量时间制作3:4比例的精美图片?作为一个小红书小号拥有者(小1万粉丝呢,虽然躺在那吃灰有点可惜),我深知这种痛苦。每次想着要做几张图片就头大,甚至因此放弃了不少内容的二次分发。
每次更换语言模型就要重新优化提示词?资源浪费且效率低下!本文介绍MetaSPO框架,首个专注模型迁移系统提示优化的元学习方法,让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果:框架自动生成了五种不同教育范式的系统提示,最优的"苏格拉底式"提示成功由DeepSeek-V3迁移到通义千问模型,评分从0.3920提升至0.4362。
学习大模型的优质博客又更新了!
近年来,生成式人工智能的快速发展,在文本和图像生成领域都取得了很大的成功。
本文作者分别来自中国科学院大学和中国科学院计算技术研究所。第一作者裴高政为中国科学院大学博士二年级学生,本工作共同通讯作者是中国科学院大学马坷副教授和黄庆明教授。
在当前大模型推理愈发复杂的时代,如何快速、高效地产生超长文本,成为了模型部署与优化中的一大核心挑战。
自回归(AR)范式凭借将语言转化为离散 token 的核心技术,在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o,「next-token prediction」以简单粗暴的因果建模横扫语言领域。
经过对多种开源存储系统的评估对比,我们选择了 JuiceFS 。我们的架构采用 Redis 进行高性能元数据管理,同时构建了自有 MinIO 集群作为底层对象存储,这一架构完美解决了模型训练场景中的数据读写瓶颈、元数据访问延迟以及计算资源之间的存储互通问题。
最近,人们对AI谈得最多的是deepseek(简称DS)。这匹来自中国本土的黑马,闯入全球视野,一度扰乱美国股市,在 AI 领域掀起了一场轩然大波。
FastVLM—— 让苹果手机拥有极速视觉理解能力
统一图像理解和生成,还实现了新SOTA。
ChatGPT「舔狗化」事件背后,暴漏目前AI仍是「黑箱」。 一场关于「机制可解释性」的路线分歧,正撕裂AI研究最核心的价值共识。谷歌认怂,Anthropic死磕——AI还能被「看懂」吗?
教AI学会使用工具,带图推理就能变得更强?!
强化学习(RL)+真实搜索引擎,可以有效提升大模型检索-推理能力。
该工作由南洋理工大学陶大程教授团队与武汉大学罗勇教授、杜博教授团队等合作完成。
半导体行业观察:众多趋势表明,AI,不再只是“云端的特权”,而是正快速成为“终端的标配”。而在这一发展趋势下,微控制器(MCU)大厂似乎早已嗅到其中端倪。
近日,腾讯 PCG 社交线的研究团队针对这一问题,采用强化学习(RL)训练方法,通过分组相对策略优化(Group Relative Policy Optimization, GRPO)算法,结合基于奖励的课程采样策略(Reward-based Curriculum Sampling, RCS),将其创新性地应用在意图识别任务上,
最近,Google 推出了一个可以精准控制画面中光影的项目 —— LightLab。 它让用户能够从单张图像实现对光源的细粒度参数化控制, 可以改变可见光源的强度和颜色、环境光的强度,并且能够将虚拟光源插入场景中。
多模态大模型(Multimodal Large Language Models, MLLM)正迅速崛起,从只能理解单一模态,到如今可以同时理解和生成图像、文本、音频甚至视频等多种模态。正因如此,在AI竞赛进入“下半场”之际(由最近的OpenAI研究员姚顺雨所引发的共识观点),设计科学的评估机制俨然成为决定胜负的核心关键。
ChatGPT新版记忆功能居然被民间大佬逆向工程了!
超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。
这两天Lovart产品火出圈外,昨天大家都还在疯狂求码,
梁文锋亲自参与的DeepSeek最新论文,来了!
大型推理模型(如 OpenAI-o1、DeepSeek-R1)展现了强大的推理能力,但其静态知识限制了在复杂知识密集型任务及全面报告生成中的表现。为应对此挑战,深度研究智能体 WebThinker 赋予 LRM 在推理中自主搜索网络、导航网页及撰写报告的能力。
在上一篇文章中,我为大家介绍了SAT如何通过神经网络驱动的智能分段技术,解决传统文本处理中的语义割裂问题。今天,我将继续与您探讨SAT如何与Pneuma系统融合,开创表格数据检索与表示的新范式。
和人工标记数据说拜拜,利用预训练语言模型中的注意力机制就能选择可激发推理能力的训练数据!
随着DeepSeek的横空出世,行业竞争加剧,无论是AI原生企业还是转型中的互联网巨头,都面临战略路径的重新校准。这一现象引发了行业的连锁反应:一方面,头部企业加速产品迭代和推广;另一方面,部分企业由于战略失误和反应缓慢开始面临用户流失风险。在这样的竞争环境下,企业的战略选择显得尤为关键。成功的AI公司通常具备三大核心能力:精准的战略定位、快速的调整能力以及高效的执行落地。
2025年国内AI技术突破推动资产重估,资源向头部企业高度集中,形成“赢家通吃”格局。高端制造受政策与资本驱动,龙头优势扩大,但就业市场与科创投资错位,加剧通缩压力。政策转向结构性调控,聚焦科技与安全资产,投资者需关注确定性强的核心资产及防御性配置。
国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火,以超低的成本实现了部分超越 OpenAI o1 的表现,一定程度上让人不再过度「迷信」国外大模型。
一文读懂AG-UI协议