
鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了
鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了刚刚,鹅厂把文生图卷出了新高度——发布混元图像2.0模型(Hunyuan Image 2.0),首次实现毫秒级响应,边说边画,实时生成!用户一边描述,它紧跟着绘制,整个过程那叫一个丝滑。不用等待,专治各种没有耐心。
刚刚,鹅厂把文生图卷出了新高度——发布混元图像2.0模型(Hunyuan Image 2.0),首次实现毫秒级响应,边说边画,实时生成!用户一边描述,它紧跟着绘制,整个过程那叫一个丝滑。不用等待,专治各种没有耐心。
Chris Pelkey,一位枪击案受害者,对法庭如是说道。但这并不是他本人。他在 2021 年的一次路怒枪击事件中,已经不幸去世。庭审现场上播放的,是以 Pelkey 的形象和声音制作的 AI 视频。
Windsurf发布首个前沿模型SWE-1,AI编程领域风起云涌,目标是将开发效率提升99%。SWE-1不仅能写代码,更能理解并协助整个软件工程流程。核心创新在于「流动感知」系统,即AI与用户共享操作时间线,实现高效协作。
Manus深夜官宣,现在支持生成图像了!和一般AI绘图工具的“抽卡”模式不同,Manus能够理解你画图的目的,规划出生成方案后再“动手”。
苹果近期开源本地端侧视觉语言模型FastVLM,支持iPhone等设备本地运行,具备快速响应、低延迟和多设备适配特性。该模型依托自研框架MLX和视觉架构FastViT-HD,通过算法优化实现高效推理,或为未来智能眼镜等新硬件铺路,体现苹果将AI深度嵌入系统底层的战略布局。
5 月 14 日凌晨,X 平台的用户发现,Grok 在回应各种无关问题时,会固执地转向一个敏感话题:南非的“白人种族灭绝”。比如,用户询问棒球运动员 Max Scherzer 的薪水,“MaxScherzer 今年不打球真的能赚 7200 万美元吗?”
你以为PDF只是用来阅读文档的?这次它彻底颠覆了你的想象!极客Aiden Bai最新整活——直接把大语言模型(LLM)塞进PDF里,打开文件就能让AI讲故事、陪你聊天!更夸张的是,连Linux系统都能在PDF里运行。
近日,腾讯 PCG 社交线的研究团队针对这一问题,采用强化学习(RL)训练方法,通过分组相对策略优化(Group Relative Policy Optimization, GRPO)算法,结合基于奖励的课程采样策略(Reward-based Curriculum Sampling, RCS),将其创新性地应用在意图识别任务上,
最近,Google 推出了一个可以精准控制画面中光影的项目 —— LightLab。 它让用户能够从单张图像实现对光源的细粒度参数化控制, 可以改变可见光源的强度和颜色、环境光的强度,并且能够将虚拟光源插入场景中。
多模态大模型(Multimodal Large Language Models, MLLM)正迅速崛起,从只能理解单一模态,到如今可以同时理解和生成图像、文本、音频甚至视频等多种模态。正因如此,在AI竞赛进入“下半场”之际(由最近的OpenAI研究员姚顺雨所引发的共识观点),设计科学的评估机制俨然成为决定胜负的核心关键。
ChatGPT新版记忆功能居然被民间大佬逆向工程了!
不久前,TikTok 推送的一系列热门视频让白鲸编辑部注意到一个特别有趣的硬件 Enabot。
@U航 毕业版 恐怕是全网第一个被上百万人追着要股票代码的创作者。抖音热榜TOP1话题下,超过六千万用户为这款AI学霸折腰。
超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。
今年以来,AI短剧的舆论风向一变再变。但在AI短剧的商业化逐渐得到验证后——有了真金白银收入,这一赛道似乎真正开始逼近产业化的临界点。
这两天Lovart产品火出圈外,昨天大家都还在疯狂求码,
在电商世界,没有人会忽视视觉的力量。
Something New :为了更好地沉淀 AI 时代的投资 insights,我们上线了 「AGI 投资手册」知识库(点击文末阅读原文链接查看),欢迎留下建议与 ideas,共建 AGI 时代的投资指南。也可以在评论区留言你认为最值得关注的 AI 股票,我们会为留言的朋友送出最新「 AGI 投资报告」 PDF。
梁文锋亲自参与的DeepSeek最新论文,来了!
OpenAI前研究员预言超级智能体将问世,大公司加速AI自主化,2027年AI或能完全自主编程,开启智能爆炸时代,而这一切正悄然改变就业市场,软件工程师肖恩的遭遇只是冰山一角。
打破科技巨头算力垄断,个人开发者联手也能训练超大规模AI模型?
大型推理模型(如 OpenAI-o1、DeepSeek-R1)展现了强大的推理能力,但其静态知识限制了在复杂知识密集型任务及全面报告生成中的表现。为应对此挑战,深度研究智能体 WebThinker 赋予 LRM 在推理中自主搜索网络、导航网页及撰写报告的能力。
由AI技术定义整个功能模块,对于整个端侧AI市场来说,这是积极的信号。
微信正从超级应用迈向超级Agent。
在上一篇文章中,我为大家介绍了SAT如何通过神经网络驱动的智能分段技术,解决传统文本处理中的语义割裂问题。今天,我将继续与您探讨SAT如何与Pneuma系统融合,开创表格数据检索与表示的新范式。
“隐私掣肘”和“应用优先”的必要代价。
外包服务成为收入增长的驱动因素
和人工标记数据说拜拜,利用预训练语言模型中的注意力机制就能选择可激发推理能力的训练数据!
随着DeepSeek的横空出世,行业竞争加剧,无论是AI原生企业还是转型中的互联网巨头,都面临战略路径的重新校准。这一现象引发了行业的连锁反应:一方面,头部企业加速产品迭代和推广;另一方面,部分企业由于战略失误和反应缓慢开始面临用户流失风险。在这样的竞争环境下,企业的战略选择显得尤为关键。成功的AI公司通常具备三大核心能力:精准的战略定位、快速的调整能力以及高效的执行落地。
英伟达与沙特主权基金旗下AI公司HUMAIN达成合作,将提供1.8万枚最新AI芯片,助力沙特建设大型数据中心以推动经济转型。此合作推动英伟达股价大涨,黄仁勋身家单日增59亿美元。沙特通过巨额投资及与多家科技巨头合作加速布局AI,但专家指出实际应用落地才是转型关键。