挖到M2.1的7个神仙用法,有点上头。。

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
挖到M2.1的7个神仙用法,有点上头。。
9841点击    2025-12-27 10:56

大家好,我是年底还在卷的袋鼠帝


年底了,AI圈还是一如既往的crazy,更新速度快到我这个老程序员都快跟不上了。


上周我还在折腾各种图片、视频生成模型,这周又到了编程周。


前天MiniMax丢出了个在编程界绝对有分量的模型:MiniMax-M2.1


然后发现就在刚才已经开源了:


https://github.com/MiniMax-AI/MiniMax-M2.1


https://huggingface.co/MiniMaxAI/MiniMax-M2.1


挖到M2.1的7个神仙用法,有点上头。。


看了一下,这两天M2.1在海外还挺火的,大家对它的评价都不错。


值得一提的是,(左图)Theo这位硅谷红人,在X上拥有26万粉,t3dotchat的CEO,还专门开了场直播,给于了M2.1高度肯定。


挖到M2.1的7个神仙用法,有点上头。。


挖到M2.1的7个神仙用法,有点上头。。


于是我就研究了一下,发现这次M2.1最大的升级是把以前AI不太擅长的后端和客户端开发能力给补齐了。


增强了Rust、Java、Golang、C++、Kotlin等多项编程语言的开发能力,而且是从底层到应用层开发的全面提升。


说实话,开发大型项目太需要这种底层理解了,想起了我以前研究netty、nacos、shenyu等源码的心酸历程。


做开发的同学可能更清楚,之前AI模型写写Python脚本、搞搞前端页面确实很有一手,但一碰到浏览器插件、C++底层或者安卓iOS原生开发等,翻车是常有的事情。


先给结论,省流版:


1.M2.1加强了原生Android / iOS开发能力,并且Web和App的前端审美也提升了;


2.Agent能力增强:长程工具调用,多指令遵循提升,优化了接入Claude Code、Cline等Agent的体验,对Skill.md、Claude.md / agent.md等提供了更好的支持;


3.回复和思维链更简洁了,这意味着更低的token消耗和更高效的任务处理;


4.技术说明和写作方面也得到了一定的提升。


为了验证M2.1是不是真的有那么好用,我这几天拿着M2.1接入Claude Code在本地跑了几个跨平台、跨语言的项目,结果真的有点出乎意料。


PS:MiniMax也搞了个9块9包月Coding Plan,放在文章最后了。


咱们先来看第一个:


 局域网手机遥控器 


这个需求其实很接地气,我有个当老师的朋友跟吐槽,去教室上课经常找不到PPT翻页笔,每次翻页都得跑回讲台按键盘,特麻烦。


我就想,既然大家手机都不离身,能不能直接用手机遥控电脑翻页呢?


于是我给M2.1提了个需求:


Prompt:我需要开发一个局域网遥控器系统。


场景:用 Android 手机控制 Windows 电脑,用于 PPT 翻页或控制视频播放(暂停/音量)。


限制:电脑端必须用 Golang 编写。手机端将用 Kotlin 编写(稍后生成)。


两者在同一WiFi下。


一开始M2.1就给了我预期的文件结构,思路非常清晰。


挖到M2.1的7个神仙用法,有点上头。。


但在写Go语言服务端的时候,出了个小问题。


挖到M2.1的7个神仙用法,有点上头。。


它一开始引用了一个第三方的键盘模拟库,结果因为版本问题报错了。


看来兼容性问题还是绊脚石(其实可以通过context7 mcp解决)


遇到这种情况,平时可能就想着去修复库依赖了。


但我想了哈,既然M2.1懂底层,那我就干脆不让用第三方库了。


我直接让它重写main.go,要求只用Go语言自带的标准库syscall调用Windows原生的API来模拟按键。


这就好比做菜,既然超市买的酱料不对味,那我就让你从葱姜蒜开始自己调,看看你的基本功到底扎不扎实。


Prompt:请重写 main.go不要引入任何 GitHub 上的第三方库(不要用 robotgo,也不要用 keybd_event)。 请使用 Go 语言自带的 standard library syscall 和 NewLazyDLL("user32.dll"),通过调用 Windows 原生的 keybd_event 或 SendInput API 来模拟按键。 这样我就不需要下载任何依赖,也不需要 GCC,直接 go run 就能跑。请展示你的底层编码能力。


结果M2.1真的做到了,一次性跑通了go的后端代码


挖到M2.1的7个神仙用法,有点上头。。


挖到M2.1的7个神仙用法,有点上头。。


电脑端搞定了,接下来是手机端。


说实话,我之前完全没有安卓开发的经验,大部分时间都花在下载Android Studio和配置环境上了。


但M2.1生成的Kotlin代码,真的是一次性跑通。


在同一个WiFi下,就能遥控电脑,而且延迟很低,几乎感觉不到,我相信作为ps5那种王国之泪遥控器应该也是可以的。

挖到M2.1的7个神仙用法,有点上头。。


当我在手机上按下按钮,看着电脑屏幕上的PPT听话的翻页,那种感觉真的太奇妙了。


延迟极低,操作丝滑,就像用着原装的蓝牙遥控器一样。如果没有M2.1对Go和Kotlin的双重支持,我这个安卓小白估计这辈子都不会想着尝试做这个东西。


左图是go服务日志,右图是手机端界面:


挖到M2.1的7个神仙用法,有点上头。。


挖到M2.1的7个神仙用法,有点上头。。


 C++窗口半透明工具 


我又给M2.1出了个难题


Prompt:帮我写一个 C++ 工具,带界面的,运行后,我可以调整windows上任意窗口的透明度,需要有滑动条实时调节透明度。


这个需求对于很多想边写代码边看直播摸鱼的朋友来说,简直是刚需 哈哈哈哈。

挖到M2.1的7个神仙用法,有点上头。。


C++这种古早的底层编程语言,懂的都懂,指针、内存管理,我大学直接从入门到放弃。


但M2.1做得很不错,窗口句柄的获取、透明度的设置,界面的响应,都处理得井井有条。


虽然用c++生成的工具长得不咋地,但是跑起来之后,看着我的代码编辑器半透明地浮在直播窗口上,那感觉,就像是给电脑装了个透视,实用又酷炫。


 终端系统监视器 


后端高性能编程语言三强:Go、C++都发挥的不错,就差Rust了


Rust这门语言以难学著称,尤其是它的所有权机制和并发模型,劝退了不少人。


让M2.1写一个终端系统监视器,看看它能不能驾驭Rust。


很快就跑完了,说实话,它的这些用法,看着就很底层


挖到M2.1的7个神仙用法,有点上头。。


最终效果像这样,界面比较极客,能感觉到性能不错。


挖到M2.1的7个神仙用法,有点上头。。


感觉M2.1非常适合用来写性能好,且实用的一些小工具


 前端页面审美 


接下来,我想看看它的前端审美


分别用了,四个提示词,生成了四个网页


Prompt:创建一个具有电影级视觉效果的着陆页,使用深邃的渐变背景,玻璃拟态设计元素,流畅的微交互动画,整体呈现出奢华科技品牌的质感。


Prompt:设计一个极简主义的仪表板界面,运用大量留白、精致的阴影层次、优雅的过渡动画,体现现代高端设计的精髓


Prompt:生成一个具有未来感的数据可视化大屏,使用霓虹色彩、粒子效果、3D变换动画,营造科幻电影中的高科技氛围


Prompt:创建一个艺术画廊风格的网页,融合抽象几何图形、流动的色彩渐变、视差滚动效果,展现前卫的现代艺术美感


这前端页面做的,着实给我惊艳到了

挖到M2.1的7个神仙用法,有点上头。。


接下来这个也让我很惊喜:


 体验用Android Studio做手机游戏(重力感应雷电)


我让M2.1用Kotlin写一个安卓原生的重力感应游戏,要求不准用任何图片素材,全靠代码画出来,还得用Jetpack Compose框架,加上协程处理高帧率。


Prompt:


Task: 编写一个单文件、纯代码实现的 Android 重力感应雷电游戏 。Technical Stack (核心考点):


Language: Kotlin


UI Framework: Jetpack Compose (不使用 XML)


Concurrency: Coroutines & withFrameNanos (实现高帧率游戏循环)


Hardware: SensorManager (Accelerometer)


Game Design & "Vibe" Requirements (AppDev 审美):


Zero Assets (零素材): 严禁引入任何图片文件。所有画面必须用 Compose Canvas 绘制。

挖到M2.1的7个神仙用法,有点上头。。


这效果还真心不错


首先是物理手感。一般的大模型写重力感应,往往就是简单的把传感器数值赋给位置,导致操作起来生硬得很,要不就是移动的非常慢,要不就是移动不顺畅,要不手抖一下飞机就乱跳。


但M2.1用了一段线性插值平滑的代码,给飞机加了惯性。


// 惯性平滑
playerVelocity += (targetVelocity - playerVelocity) * 5f * deltaTime
playerX += playerVelocity * deltaTime


你倾斜手机,飞机是滑过去的,不是瞬移过去的。


我用M2.1生成的我的世界网页版,也是近期我觉得移动跳跃,最舒服最自然的一版。


我在小米手机上实测的这个游戏,手感真的超绝,丝滑流畅,玩起来甚至有点上瘾。


 爆火游戏八分音符酱复刻 


用嘴玩的游戏(Kotlin + Jetpack Compose)


雷电游戏展示的是 传感器 (Sensor)能力。


八分音符酱展示的是音频处理 (Audio Processing)和麦克风调用。


看当年邓紫棋玩的有多疯,贼好笑 哈哈哈


挖到M2.1的7个神仙用法,有点上头。。


提示词如下:


prompt:Role: Android Audio & Game Developer.


Task: 使用 Kotlin + Jetpack Compose 复刻经典的声控游戏《八分音符酱》(Yasuhati)。


核心要求 (Single File & No Assets):


零素材: 不使用图片,全用 Canvas 绘制。


主角: 画一个可爱的黑色八分音符 (♪),带两个圆圆的眼睛。


地形: 简单的黑色矩形方块,类似马里奥的地面,中间有坑(掉下去 Game Over)。


声控逻辑 (Audio Core):


使用 AudioRecord 实时读取麦克风音量(分贝/振幅)。


核心机制:


小声: 角色向前慢走。


大声: 角色向上跳跃(声音越大跳得越高)。


注意: 请在界面上加一个 “灵敏度调节” 滑块,防止需要在深夜大吼大叫。


游戏循环:


地图自动向左滚动,或者角色向右跑。


简单的重力下落逻辑。


碰撞检测:碰到地面站立,掉出屏幕下方失败。


工程结构:


所有代码写在 MainActivity.kt。


权限处理: 代码中必须包含请求 RECORD_AUDIO 权限的逻辑。


包名: package com.example.mygame0 (根据实际情况修改)。


Output: 提供完整的代码,并明确告诉我需要在 Manifest 中添加什么权限。


挖到M2.1的7个神仙用法,有点上头。。


一打开游戏,主动提示完成申请麦克风权限,分数统计、游戏逻辑、操控非常丝滑,这个很有意思,甚至可以在朋友聚会或者团队游戏场合一起来玩这个游戏了!


这能证明M2.1不仅懂物理,还懂信号处理(把声音分贝转换成跳跃高度)。


调用麦克风并实时分析波形,这是非常Native的操作,H5很难做得丝滑,但原生安卓可以。 


 一键定制Java项目 


最后来到我最熟悉,但是已经快两年没有摸过的Java


Prompt:作为Java后端架构师,实现一个Spring Boot用户鉴权模块。需求: - 使用JWT token进行认证,支持登录/注销/角色检查。 - 严格分层:Controller处理HTTP,Service业务逻辑,Repository数据库交互(用JPA+H2内存DB模拟)。 - 合理使用注解如@RestController、@Service、@Autowired、@Entity。 - 复合约束:集成Spring Security,确保密码哈希(BCrypt),处理异常如Unauthorized返回401;代码必须模块化,可扩展到微服务。 - 生成pom.xml依赖、完整代码目录结构,并解释为什么这种分层提升了维护性(避免“前端式工具函数”)。


看到这逐层创建过程,太真实了,作为我的"母语",这个我最有发言权,它是真滴懂Java


挖到M2.1的7个神仙用法,有点上头。。


卧槽,这看着太熟悉了(之前天天用springboot爽写项目)


整个项目结构可以说非常规范了


Spring Boot用户鉴权模块已完成!以下是项目结构:
  项目目录结构
  E:\AI_projects\M2.1springboot\
  ├── pom.xml                           # Maven依赖配置
  ├── src/main/
  │   ├── java/com/example/auth/
  │   │   ├── AuthApplication.java      # 主启动类
  │   │   ├── config/
  │   │   │   ├── SecurityConfig.java   # Spring Security配置
  │   │   │   └── DataInitializer.java  # 数据初始化
  │   │   ├── controller/
  │   │   │   ├── AuthController.java   # 认证API(登录/注册/注销)
  │   │   │   └── AdminController.java  # 管理API(角色检查)
  │   │   ├── dto/
  │   │   │   ├── AuthRequest.java      # 登录请求
  │   │   │   ├── AuthResponse.java     # 认证响应
  │   │   │   └── RegisterRequest.java  # 注册请求
  │   │   ├── entity/
  │   │   │   ├── User.java             # 用户实体
  │   │   │   └── Role.java             # 角色枚举
  │   │   ├── exception/
  │   │   │   ├── UnauthorizedException.java
  │   │   │   ├── BadRequestException.java
  │   │   │   └── GlobalExceptionHandler.java
  │   │   ├── repository/
  │   │   │   └── UserRepository.java   # JPA数据访问
  │   │   ├── security/
  │   │   │   ├── JwtTokenProvider.java     # JWT工具
  │   │   │   ├── JwtAuthenticationFilter.java
  │   │   │   ├── CustomUserDetails.java
  │   │   │   └── CustomUserDetailsService.java
  │   │   └── service/
  │   │       ├── AuthService.java      # 认证接口
  │   │       └── AuthServiceImpl.java  # 认证实现
  │   └── resources/
  │       └── application.yml           # 应用配置


测试账号

    | 用户名     | 密码     | 角色        |
  |------------|----------|-------------|
  | admin      | admin123 | ADMIN       |
  | user       | user123  | USER        |
  | superadmin | super123 | SUPER_ADMIN |
  
  分层架构优势
  为什么这种分层能提升维护性?

   | 层级       | 职责                    | 避免的问题                 |
  |------------|-------------------------|----------------------------|
  | Controller | HTTP请求/响应、参数校验 | 业务逻辑分散在多个地方     |
  | Service    | 业务逻辑、事务管理      | "前端式工具函数"、重复代码 |
  | Repository | 数据库CRUD              | SQL注入、数据访问混乱      |
  | Entity     | 数据模型                | 模型与业务耦合             |
  
  避免"前端式工具函数"的弊端:
  1. 单一职责:每个类只做一件事
  2. 可测试性:Service层可单独测试,无需HTTP
  3. 可替换性:更换数据库只需改Repository
  4. 可复用:业务逻辑可在多个API复用
  5. 团队协作:前端、后端、DB可并行开发
  API端点
  | 方法 | 路径               | 描述         | 角色  |
  |------|--------------------|--------------|-------|
  | POST | /api/auth/login    | 用户登录     | 公开  |
  | POST | /api/auth/register | 用户注册     | 公开  |
  | POST | /api/auth/logout   | 用户注销     | USER+ |
  | GET  | /api/auth/me       | 获取当前用户 | USER+ |
  | GET  | /api/admin/users   | 获取用户列表 | ADMIN |
  | GET  | /api/admin/stats   | 系统统计     | ADMIN |


以下是概览代码录屏,一看这个风格这个味道就知道,M2.1成了,


浓浓的SpringBoot味道,计算机专业学生简直太亲切了。

挖到M2.1的7个神仙用法,有点上头。。


几年前,我在公司的架构组,还专门搞了一个脚手架一键生成平台,供内部开发同事使用,现在看来根本不需要了,AI已经能根据需求一键定制脚手架,不得不说,这两年时代进步太快了。


「最后」


总结一下这几天的体验。M2.1给我的感觉,不仅仅是支持的语言变多了。更重要的是,它更懂开发了。


它知道写Java后端要分层,知道写Go服务要处理并发,知道写安卓App要考虑生命周期等等。


而且是真的理解每种语言、以及他们的特性和最佳实践。


对于我们这些开发者来说,这已经不只是全栈了,是全能。


不管你是想搞后端、写底层,还是做移动端开发,它都能给你兜底,甚至还能教你更优的写法。


如果你也是像我一样喜欢折腾新技术的开发者,或者想尝试全栈开发但又被各种语言门槛劝退的朋友,Minimax M2.1绝对值得你去试一试。


它虽然还不完美,但在多语言编程和工程化落地这块,确实走在了前面。


以及,它真好玩,每次都能给我一些惊喜,确实是可以让人上瘾的程度~


国内AI编程都卷疯了,MiniMax也来了个首月9块9 Coding Plan


挖到M2.1的7个神仙用法,有点上头。。


我是袋鼠帝,持续分享AI实践干货,咱们下期见。


文章来自于微信公众号 “袋鼠帝AI客栈”,作者 “袋鼠帝AI客栈”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales