刚刚,MiniMax新模型接管「音乐圈」!20秒出歌Cover全风格
刚刚,MiniMax新模型接管「音乐圈」!20秒出歌Cover全风格4 月 10 日,MiniMax 又带来一次重磅更新,其中最核心的新功能,就是 Cover 翻唱。一首平平无奇的生日快乐歌,可以被 cover 成 EDM 风格:经典的《友谊地久天长》也能被 AI 改编成灵魂乐调调:
搜索
4 月 10 日,MiniMax 又带来一次重磅更新,其中最核心的新功能,就是 Cover 翻唱。一首平平无奇的生日快乐歌,可以被 cover 成 EDM 风格:经典的《友谊地久天长》也能被 AI 改编成灵魂乐调调:
最近,计算机视觉领域的顶级会议 CVPR 2026 的 NTIRE 鲁棒性 AIGC 图像检测挑战赛( Robust AI-Generated Image Detection in the Wild Challenge )结果出炉。蚂蚁集团 AI 安全实验室的队伍 MICV 凭借在鲁棒性测试样本上 ROC AUC 达到了惊人的 0.9723,成功摘得「复杂真实场景鲁棒性样本测试」挑战赛的冠军。
今天我们发布 MMX-CLI,一个面向 AI Agent 的命令行工具。接入 MMX-CLI 后,Agent 可以在 Claude Code、OpenClaw 等环境中原生调用 MiniMax 最新的编程、视频生成、语音合成、音乐创作等全模态模型,无需适配繁琐接口,也无需额外编写 MCP Server。
国产AI营销持续刷屏行业!原本2周策划,现在十几分钟落地,从内容爆款到精准投放全流程智能搞定。营销人别再拍脑袋,再不跟上这个浪潮,669亿AI营销市场真没你份了。
今天,智谱正式开源其最强模型GLM-5.1,这一模型在专业软件开发基准测试SWE-Bench Pro中,GLM-5.1刷新全球最佳成绩,得分达到58.4,超过了GPT-5.4、Claude Opus 4.6等已经正式发布的闭源模型,和MiniMax M2.7、Kimi K2.5等开源模型。
从OpenClaw刷屏开始,人人都能拥有专属的AI“个人助理”仿佛不再是科幻电影里的未来。在这场通往新世界的拥挤赛跑中,一家聚焦海外市场的初创公司Boxy刚刚获得红杉中国种子基金投资的数百万元美元融资。
OpenAI 的下一代图像模型 GPT-Image-2,今天在 Chatbot Arena 上被人发现了。独立开发者 levelsio 率先爆料,这个模型以三个代号悄悄上线了 Arena:maskingtape-alpha、gaffertape-alpha、packingtape-alpha。
这几天,港股市场的情绪,又被AI大模型点燃了!
相似度超越Seed-TTS、MiniMax-Speech等知名模型。昨晚,美团LongCat团队发布了文本转语音模型LongCat-AudioDiT,并开源1B、3.5B参数量的版本。这一模型的最大特点,是彻底抛弃了梅尔谱等中间表示,直接在波形潜空间进行基于扩散模型的文本转语音。通俗地说,这一模型直接根据声音本身的规律进行生成,“雕刻”出最原始的声音波形,从根源阻断数据转换的级联误差。
3月30日,阿里巴巴内部发布了 Wan2.7-Image 图像生成与编辑统一模型。根据官方公布的数据,在人类偏好盲测评分中,Wan2.7-Image 目前位列国内第一。从放出的评测雷达图来看,无论是文本生图(Text-to-Image)还是综合图像编辑(Image Editing),它的各项指标基本都盖过了市面上主流的几家头部模型。