国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马
9140点击    2026-05-02 11:01

这是Bubble2026年的第51篇更新


Hello, 大家假期好!


从去年开始做这个账号以来,我其实写过不少测模型的文章。我相信也有很多朋友是因为看了我测评的文章关注我的。


但从过年之后,真的就很少写模型评测的文章了。


主要是我写文章的速度甚至一度跟不上模型发布的速度了。


比如上周,又是gpt image 2, 又是gpt 5.5, 又是DeepSeek V4, 这哪个单拿出来,都是炸裂级,更别说放在一周之内,这你能受的了么;


但,咱也不能不测就是说!


所以放假第一天,我就整一个活,做了个横测,看看国产的模型里,到底哪个比较实用点。


我选择的国产模型里有MiniMax, DeepSeek ,Kimi,还有小米的MiMo 的最新模型。


不为别的,就为找到最能匡匡干活的那个。


那我们废话少说,直接开始!


我是直接把这些模型都接入进了OpenCode 里。


我测试的第一个任务是把DeepSeek 最新的讲多模态的这篇论文从pdf 格式提取精华内容做成pptx格式的PPT。


靠北,为什么DeepSeek 每次都在放假的时候更新!


提示词不复杂,就是:


“把这篇论文的内容做成一个格式为PPTX 的PPT; 内容上尽可能全面; PPT样式需要设计的高级好看; ”


我们先来看下Kimi K 2.6的效果。


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


内容挺全面详细的,但是可以看到有文字明显重叠了,而且有的标题和正文之间的间距明显过于拥挤了。


然后是DeepSeek V4 Pro 的效果,我把推理程度开到最大进行测试。


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


内容总结提取的也不错。但是也是样式上,特别是文字间距控制的不是很好,而且文字和表格可以看到重位了都,强迫症看着非常难受。


再来看MiniMax M2.7 的效果,


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


我认为是比较好的一个效果,无论是内容提取,还是对样式排版上的设计,都是比前两个模型要好的。


最后是小米新出的MiMo V2.5 Pro的效果:


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


讲真,论样式,我可能会更吃小米这个。


但是很明显的问题是,它做出来的,也是出现了文字位置的重叠的问题,可读性比较差。


所以这一part 我会投票给MiniMax。


第二个任务, 是让模型自己去抓一些DeepSeek V4 相关的内容,然后写成一个word 文档。


我们先来看Kimi K 2.6的效果:


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


整体还是非常不错的,有表格,有字体颜色的变化,还有排版,信息也比较全面,还带了来源。


然后是DeepSeek 自己的表现:


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


果然,自己搜自己的表现就是不一样,内容更加详尽,样式也更好看。


但是唯一的问题是,我用的DeepSeek 是V4 Pro, 推理程度开到最高,就会导致最后生成速度变慢很多。


再来是MiniMax M2.7的表现:


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


MiniMax 速度是比较快的而且格式也没什么问题,但是整理的内容相比前面两个模型来说,没特别详尽。


但人家这毕竟只是个200多B的模型,参数量比其他几家小了好多倍呢是,当然会有点偷懒。


最后是MiMo的表现,


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


内容比较详尽,而且排版样式我觉得是这几个里和DeepSeek 的我最喜欢的。


这一part,我会把票投给MiMo 和 DeepSeek;


我测的第三个任务是结合了我一个复杂的Skill。


这个Skill 是让这几个模型生成一个HTML格式的PPT,但是里面要求模型要调用图像模型的API来进行图像的生成,还有用playwright mcp来对做好的HTML进行一页页截图存在项目中。


这个任务相比于前面两个任务是比较复杂的了。


我们还是先来看Kimi K 2.6的效果。


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


我后面看Agent 的thinking 过程的时候发现它在做的时候没去调用我的skill。


难怪我说这结果怎么看怎么别扭。


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


我发现问题在于它执行Glob的时候,没找到我的Skills...


不知道为啥别的模型都没问题,就K2.6出现了问题... 我觉得这应该不单单是模型的原因,跟这个跟Agent 框架也有很大的关系。


可能适配度没那么高。


再来看DeepSeek 的效果;


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


DeepSeek 在执行的整个过程是没什么问题的,包括调用API生图,然后用playwright 截图都做了。


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


但是它在当中第4页的时候,因为黑色背景的原因,导致部分字体和背景重了


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


再来看看MiniMax的效果;


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


整个观感都没什么问题,没有字体重叠,错位,遮挡这些问题。美感上也比其他几个模型更强。


最后是MiMo的效果:


国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马


也做的不错。


所以这一part, 我把票投给MiMo 和MiniMax。


写到这儿,我觉得可以再来盘盘几个模型的订阅方式。


DeepSeek 不用多说,没有Coding Plan,目前是只能靠API打折,和极低的缓存命中价格来提供给用户。


MiMo 有token plan,但是消耗的则快/


Kimi 提供了自己的Coding plan ,并且还有自己专属的Kimi CLI,但是速度没那么快;


MiniMax 提供的Token Plan,选择档位更多,速度也更快;而且除了用于Coding之外,还可以用于图像、视频、音乐的生成,


再结合一下,它们之前开源了他们的CLI和Skills, 这简直就是打工牛马人心中的专属牛马配置。


牛马工具就得配上牛马模型。


以前评测的时候,我们总是在问,哪个模型效果最牛逼,


但是今年以来,我看到的明显的趋势是,


算力越来越贵,coding plan 越卖越少,甚至卖到被迫下线,没法再出售的地步。。。


AI是越来越牛逼,融入了我们的生活,但是对普通用户来说,一个很现实的问题也开始出现了:


你到底能不能长期用得起。 


因为 Agent 时代,模型不只是拿来聊天和跑分的,它要会调用工具,要会执行任务,要能又快又好的稳定输出。


这次测下来,我觉得MiniMax M2.7 确实是我这次觉得最全面的一个。


它不一定每一项都都是顶尖,


但它确实是一个真的能坐到工位上帮我稳定干活的模型。


文章来自于微信公众号 "BubbleBrain",作者 "BubbleBrain"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0