阿里开源14B电影级视频模型!实测来了:免费可玩,单次生成时长可达分钟级
阿里开源14B电影级视频模型!实测来了:免费可玩,单次生成时长可达分钟级AI视频生成正在迎来“通义时刻”! 就在昨夜,阿里突然发布了一款由音频驱动的14B视频模型Wan2.2-S2V—— 仅需一张图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。
AI视频生成正在迎来“通义时刻”! 就在昨夜,阿里突然发布了一款由音频驱动的14B视频模型Wan2.2-S2V—— 仅需一张图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。
一直以来,Anthropic 的 Claude 被认为是处理编程任务的最佳模型,尤其是本月初发布的 Claude Opus 4.1,在真实世界编程、智能体以及推理任务上表现出色。其中在软件编程权威基准 SWE-bench Verified 测试中,Claude Opus 4.1 相较于前代 Opus 4 又有提升,尤其在多文件代码重构方面表现出显著进步。
大家好,这里是歸藏(guizang),今天教大家如何最大程度发掘最强图片编辑模型 Nano Banana 的潜力。
爆火的神秘图像编辑模型nano-banana,终于脱掉了“香蕉皮”! 就在今天,谷歌官方认领,并表明这个模型其实是Gemini 2.5 Flash Image。
苹果刚刚官宣发布会为iPhone 17预热的同时,高管们也正在悄悄算着另一笔账: 要不要花上百亿美元把两家AI公司打包带回家? 据The Information爆料,苹果内部正在严肃讨论收购法国AI初创公司Mistral和美国AI搜索工具Perplexity。
人工智能的浪潮正将我们推向一个由 RAG 和 AI Agent 定义的新时代。然而,要让这些智能体真正「智能」,而非仅仅是信息的搬运工,就必须攻克一个横亘在所有顶尖团队面前的核心难题。这个难题,就是推理密集型信息检索(Reasoning-Intensive IR)。
人类和AI在工作中如何协作?耶鲁和南大的研究人员合作的这篇论文讲清楚了。 这篇论文提出了一个数学框架,通过把工作技能拆分成两个层次来解释这个问题
AI 时代的聚光灯,不应只属于从零到一的创业者。 我们注意到一个有趣的现象:与热衷在全球舞台上表达观点的硅谷高管相比,中国的大厂高管们通常更倾向于低调行事。
刚刚,又一个人工智能国际顶会为大模型「上了枷锁」。 ICLR 2025 已于今年 4 月落下了帷幕,最终接收了 11565 份投稿,录用率为 32.08%。
顶尖AI人才的争夺战在Meta和OpenAI等科技巨头之间越演越烈,但根据华尔街日报的报导: Claude的开发商Anthropic,似乎才是众多工程师更心仪的去处。
DeepSeek V3.1上演的bug大秀“极你太美”,可谓是让全网热议了一波。 简单来说呢,就是陆续有开发者们发现,当他们在调用API进行代码开发的过程中,输出结果里会时不时蹦出来“极”字。
只用一周,一个相当于人类20年经验的“数字技术工人”——基于时序大模型和Agent的智能体,就能直接上岗。
小扎钞能力失效,一夜痛失三位核心研究员!其中,两位前OpenAI大牛仅入职一月,火速回流OpenAI。团队频繁重组,内部矛盾「埋雷」,小扎「超级智能梦」能否交出一份满意的答卷?
人工智能正在吟诗作画,我们人类却在打扫卫生。 这句话几乎描述出了今天所有人对AI的困惑,一边是模型底层技术的突破,另一边却是AI进入真实世界后的无力感。一个验证码能摧毁一个压缩全世界知识的AI大脑,一个垃圾桶能绕晕一个拥有30多个自由度的人形机器人。
Gemini 2.5 Flash Image是谷歌最新发布的顶级图像生成与编辑模型,被网友誉为「最强图像模型」。其化身nano-banana在LMArena盲测中以历史最大优势夺冠,凭借角色一致性、提示编辑、原生世界知识和多图像融合四大能力,引发广泛关注。
一觉醒来,AI版地球online,上线了。不是玩梗整活,而是一个真正的,可以容纳十万个AI智能体的在线虚拟世界。 全名叫Aivilization,是一个由港科大研发的,模拟真实世界的大型AI实验。也可以直接叫它,AI小镇。
马斯克宣布了一个疯狂的计划,将在5年内实现5000万张H100的算力,这是什么概念?这将为人类带来怎样的影响?ASI能否在勇敢者的孤注一掷下现身?
智东西8月26日报道,近日,美国浏览器公司Brave发布博客,称该公司在美国知名AI搜索独角兽Perplexity打造的AI浏览器Comet中发现了一个严重安全漏洞,攻击者可通过在网页中发布恶意指令,来操纵AI浏览器登录网站、访问邮箱、获取验证码,并将这些敏感信息发送给外部攻击者。全程耗时两分半,连普通人也能完成这种攻击。
Perplexity 将允许出版商分享 AI 搜索产生的收入,该公司此举旨在应对部分媒体对其内容使用提出的批评和法律诉讼。
如果你拥有了庞大的三维空间数据,你会用来做什么? 大模型时代之后,数据成了支撑模型的承重柱。能否获取足够的可用高质量数据,直接决定了某个领域的 AI 的发展上限。
2023年,AI浪潮席卷全球,无数创业者开始了一场寻找“下一代硬件”的竞赛。
当大多数 AI 教育公司还在为盈利发愁时,成立仅两年的 Praktika,交出的一组运营数据:30人团队支撑起近 2000 万美元年化收入,超500万用户,在2024 年 5 月拿下 Blossom Capital 领投的 3550 万美元 A 轮融资,加上早期种子轮,总融资已达 3800 万美元,这个靠 AI 虚拟外教(Avatar)走红的 App,正在重新定义语言学习的商业模式。
Humain 作为沙特领先的人工智能公司,已推出一款面向阿拉伯和穆斯林群体的对话式 AI 应用,正值沙特寻求在该技术领域获得区域领导地位之际。
在AI客服这个看似红海的赛道里,几乎每个人都遇到过这样的尴尬:明明刚刚告诉AI你的会员账号,转个身的功夫它就不记得了。这种被称为“金鱼脑”的AI失忆现象,正是大模型在企业级应用中最大的痛点。
你有没有想过,一家小企业想要贷款时,为什么总是被迫在两个极端选择之间挣扎?要么选择社区银行的低利率,但要忍受漫长的审批流程和落后的数字化体验;要么转向在线放贷平台的快速审批,却要承受高达60%的年化利率。这种看似无解的困境,正在被一家名为Casca的创业公司彻底颠覆。
头部科技公司已经开始卡位新AI时代软硬件一体能力,一个判断是,只能做硬件或只能做软件的公司或许都会损失一部分竞争力
8 月 25 日,钉钉十周年,8.0 版本发布。但是在发布会现场, CEO 无招却说: 钉钉 8.0 也是 AI 钉钉的 1.0,我们决心清空过去,以归零的心态,为 AI 时代打造一个全新的钉钉。
数据显示,70%的雇主更愿意招一位会AI的新人,而不是拥有该岗位10年经验却不会AI的老手。任何毕业生都需要掌握在日常生活中使用AI的能力。现在随着低代码技术的兴起,以及各种让编程变得更简单的工具出现,我们将走到这样一个阶段:每个学生不仅应该学会如何使用AI,还应该学会用AI来创造,比如创造图像、开发应用、编写代码。
这份来自麻省理工的2025年商业AI现状的研究报告最近在网上炸锅了,该报告称 95% 的人工智能试点都失败了,这吓坏了美国股市的投资者。报告提到大多数公司都陷入了困境,因为 95% 的 GenAI 试点项目都没有产生任何投资回报率,而只有 5% 的公司通过使用可学习、可融入实际工作流程并随着使用而改进的系统获得了成功。
在AI时代,AI能力超越人但无法取代人的独特价值:人因宝贵和不可预测需求必须掌控微决策——即个人冒险决定体现风格与价值观,AI辅助下执行计算,微决策提升工作独特性,前景乐观。