智能体迈入L4 时代!纳米AI多智能体蜂群,可创作史上最长10分钟AI视频
智能体迈入L4 时代!纳米AI多智能体蜂群,可创作史上最长10分钟AI视频忘掉繁琐交互流程,也不用再蹲Veo 3了! 现在分钟级高质量的AI创意大片,能够一键生成了。 比如一张人物图+提示词脚本,就能生成记者第一视角下采访西游记的视频特辑。
忘掉繁琐交互流程,也不用再蹲Veo 3了! 现在分钟级高质量的AI创意大片,能够一键生成了。 比如一张人物图+提示词脚本,就能生成记者第一视角下采访西游记的视频特辑。
「软件正在吞噬世界,但AI将吞噬软件。」—英伟达CEO黄仁勋的预言正加速照进现实。
Agent形式又进化了,现在“有头有脸”,能自主帮你完成KPI!
NVIDIA和AMD,终于有对手了? 一家名不见经传的芯片初创公司——Bolt Graphics,在最新发布的测试中抛出惊人数据: 其首款GPU模组Zeus 4C,在路径追踪(Path Tracing)场景中,性能飙至RTX 5090的13倍。
心累!也是被小扎挖人挖怕了,奥特曼开始让员工保护好自己的名字。 员工清单=OpenAI最高机密。 首席科学家出去接受访谈,都被要求禁止透露重要员工名字。
LaTeX 公式的光学字符识别(OCR)是科学文献数字化与智能处理的基础环节,尽管该领域取得了一定进展,现有方法在真实科学文献处理时仍面临诸多挑战:
最近在「观猹」平台上,又又又又又上新了超多有意思的 Agent 产品!
AI 作图,不止卖家在用,买家也在用。最近,不少网友晒出了一个令人啼笑皆非的操作:为了从卖家那里占到一点便宜,一些买家会故意声称商品有瑕疵,并要求退款。但其实,瑕疵图是他们自己用 AI 做的,比如把好的榴莲做成腐烂掉的榴莲。
Huxe 是您的个人音频伴侣,旨在将您关心的一切,转化为精心生成的交互式体验。
SkinVision 是一家于 2011 年在荷兰阿姆斯特丹成立的数字健康公司,致力于通过人工智能(AI)驱动的移动解决方案,实现皮肤癌的早期检测与个性化皮肤健康管理。
近年来,大语言模型(LLM)在语言理解、生成和泛化方面取得了突破性进展,并广泛应用于各种文本任务。随着研究的深入,人们开始关注将 LLM 的能力扩展至非文本模态,例如图像、音频、视频、图结构、推荐系统等。
声音理解能力新SOTA,小米全量开源了模型。 MiDashengLM-7B,基于Xiaomi Dasheng作为音频编码器和Qwen2.5-Omni-7B Thinker作为自回归解码器,通过创新的通用音频描述训练策略,实现了对语音、环境声音和音乐的统一理解。
沉寂了长达半年之后,“AI六小虎”中有4家,用接连发布的新模型,又杀回了模型竞技场。就在半年前,六小虎的命题,还是“失败”。
在数据隐私日益重要的 AI 时代,如何在保护用户数据的同时高效运行机器学习模型,成为了学术界和工业界共同关注的难题。
Science重磅揭露科研圈两大乱象:一是「论文工厂」已形成庞大产业链,部分编辑、作者、中介相互勾结;二是ChatGPT悄然渗入科研写作,22%计算机论文含AI痕迹。系统性造假与技术滥用,正重塑学术界根基。
在 2025 年第二季度财报中,Palantir 交出了一份几乎所有 SaaS 从业者都梦寐以求的成绩单:美国商业业务收入同比增长 93%、总收入突破 10 亿美元、调整后经营利润率 46%、自由现金流利润率 57%、Rule of 40 指数高达 94%。
老黄曾预言,每个像素都将由AI生成!刚刚,谷歌DeepMind放出的「通用世界模型」Genie 3,一句话即生720p实时模拟世界,1分钟视觉记忆一致性超高。刚刚,谷歌DeepMind祭出新一代通用世界模型——Genie 3,能模拟出史无前例的丰富交互环境。
还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。此外在Agent任务和推理方面进一步升级。但加量不加价,定价和Claude Opus 4一样。
今天凌晨,OpenAI 甩出一对王炸,正式发布两款开源模型:gpt-oss-120b 和 gpt-oss-20b。是的,你没看错,那个曾经被戏称为 CloseAI 的男人,带着他的诚意,回来了!
MiniMax副总裁、战略投资负责人魏瀚曈已离职,据消息人士透露,魏瀚曈将入职一家投资机构。公开资料显示,魏瀚曈曾在平安、字节跳动、小红书等公司从事战略投资方面工作,2024年5月从小红书离职后,入职MiniMax,并出任战略投资负责人,对外用的是MiniMax副总裁的称谓。其个人实名认证的社交平台显示,在MiniMax最后离开的时间是今年7月。
GPT-5又咕咕,但是把Claude新模型诈了出来—— Claude Opus 4.1,被曝正在进行内部测试。
一场激动人心的 AI 国际象棋比赛即将开幕。 看够了研究者们天天在论文上刷新基准,是时候拉模型出来遛一遛,性能是不是真如传说中的碾压全场?
通义模型家族,刚刚又双叒开源了,这次是Qwen-Image——一个200亿参数、采用MMDiT架构的图像生成模型。 这也是通义千问系列中首个图像生成基础模型。
AI生图,但是没有AI味,可能么? 一款全新、可编辑、照片级的AI生图模型FLUX.1 Krea [dev]现已发布,可在Krea Edit上免费试用。
The Information 消息,被 Cognition 收购的 Windsurf 约 200 名员工,最近收到了新公司的邮件,要么接受新公司的 996 的工作条件,要么选择接受 9 个月的补偿买断方案。
近日,ChatGPT 用户们震惊地发现,自己与该人工智能模型的聊天记录竟出现在了谷歌搜索结果中。有用户发现,他们可以通过谷歌搜索“ site:chatgpt.com/share ”来查找数千条陌生人与人工智能助手的对话。
你有没有这种感觉?最近 AI 圈像是压着一口锅,所有人都在等一样东西出来。 GPT-5。 不管你是不是 AI 行业的人,这几个字现在都开始有点玄学意味了。只能说 Sam Altman 能不能别在营销上整手段了。跟个搞预告片的导演似的,一边说“我们很快发布”,一边在播客里自爆“GPT-5 的推理速度快得让人害怕”,然后又补一句:“我们会慎重推出”。
在旧金山,一波00后群体正以惊人的速度席卷AI赛道。他们从MIT、斯坦福果断辍学,扔掉名校光环,带着激情创办AI公司并拿下巨额融资。这帮Z世代CEO们用实力喊话,年龄不是桎梏。
成立仅一年的初创公司Reflection AI 正洽谈融资逾 10 亿美元,用于开发开源大语言模型,与中国深度求索(DeepSeek)、法国 Mistral 及美国 Meta 等企业展开竞争。
世界是动态变化的。为了理解这个动态变化的世界并在其中运行,AI 模型必须具备在线学习能力。为此,该领域提出了一种新的性能指标 —— 适应性遗憾值(adaptive regret),其定义为任意区间内的最大静态遗憾值。