ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
“偷”X数据,用特斯拉显卡,马斯克把AI炼成啥样了?
6455点击    2024-08-16 10:45

马斯克有点偏心了


有个怪事儿,前段时间,大模型竞技场上,一位代码为sus-column-r的匿名模型横空出世。


没人知道它师出何门,但在过去的一个月里,它却称得上是过关斩将。。。


累计一万多人的投票,硬生生让它挤进了排行榜前列。到现在,综合能力已经和 5 月 13 号发的GPT-4o( API 版本 )并列第三了。



看这势头,当时就有不少人猜测,这可能是 OpenAI 那个迟迟没向大众公布的,神秘的“ 草莓 Q* ”项目。



然而,就在昨天,这个困扰大伙儿很久的谜语,终于有答案了。但解开它的,不是 OpenAI ,而是经常被大家忽略,但也在搞 AI 的马斯克。



这个匿名的 sus-column-r 模型,其实就是 xAI 要推出的新模型 Grok2,现在已经上线会员版的 X 了。


而之所以在大模型竞技场上整这么一出,说白了,是想给昨天的发布热热场子。


像是在官宣推出 Grok2 的博客里,就明晃晃地展示了之前 sus-column-r 积累的战绩,甚至还做了对战胜率表。


按照他们自个儿的说法,表里面除了谷歌的 Gemini 1.5 Pro 外,其余无论是 GPT-4o ,还是 Claude3.5 Sonnet ,都只能是 Grok2 的 “ 手下败将 ” 。



当然了,其他的纸面成绩, Grok2 答得也挺不错。光从各个基准的数据来看,它的各项能力,都和市面上最先进的 AI 差不多,这一线大模型的行列,也算是被 Grok 给挤进去了。



不过在世超的标准里,一个模型好不好,光看这些数据也还不行,最重要的是,得看大伙们的实际使用体验。


相较于上次的还只能文字开开玩笑的 Grok1.5 ,这次 Grok2 最明显的一个升级,就是新增了图片功能。


但和其他家自己动手搞多模态 AI 不一样,这次马斯克倒挺罕见地选择了和别人合作。


合作的对象,差友们应该还有点印象,就是前两天咱刚写过的FLUX.1。



看到这,世超也没对 Grok2 的图片功能抱太大的期待,毕竟是前脚刚试过的 AI 。。。


但没想到集成到 Grok2 里面的 FLUX.1 ,还真撞出了一点不一样的火花。


倒也不是说,在性能上它一夜之间飙升了一大截。而是相较于市面上的其他图片 AI , Grok2 的整活能力可以称得上是一骑绝尘。


同样是迪士尼公主的一个提示词, Grok2 在尺度上就比其他模型要大胆的多。



而且, Grok2 还能直接对着自己的老板恶搞,比如这是一个爱吃甜品,吃到发胖的马斯克。



转眼,他还能穿越到权力的游戏里,玩角色扮演。



更搞的是,还有网友直接拿 Grok2 生成的图,和视频 AI 配合起来,做起了视频。



不过, Grok2 这么肆无忌惮地恶搞各种公众人物、卡通人物,风险肯定还是有的。


像是有网友生成马里奥抽烟喝酒、观望 “ 911 ” 事件的图片,就已经有人督促任天堂起诉了。



除了新增有图片功能外, Grok2 这次提升的基础能力,咱肯定也得上手测测,看看实力。


考虑到目前 X 上线的,还只是性能差一点的小杯 mini 版,于是世超在大模型竞技场上,试用了下能力更强的 Grok2 ,还拉来了最新版本的 GPT-4o 作比较。


比试第一招,先从 AI 容易犯错的题目开始。前段时间,大模型集体在 “ 小数比较 ” 上翻车,大伙应该都听说过了。


这次再来波经典重现,让它俩来比比9.5 和 9.11的大小。


没想到的是, GPT-4o 依旧是死性不改,结果对了,但一看解题思路,完全就是一塌糊涂。反倒是 Grok2 倒有理有据,给出了正确答案。



还有经典的数数问题, GPT-4o 依旧让人大跌眼镜, “ 我一把把把把住了 ” 它竟然数出来 5 个把字, Grok2 这边倒还是稳定发挥。



不过紧接着问它俩这句话的意思, Grok2 就有点露怯了,乱说了一大堆,没一个踩到得分点。而这次 GPT-4o 简单几句话就给解释清楚了。



接下来世超又试了一些比较基础的常识性问题,比如说 “ 李政道是谁 ” ,它俩回答的,都还算正确。就是不知道为啥, GPT-4o 很容易犯懒,草草几句话就结束了。


而 Grok2 这边,每次给出得答案都挺详细,还贴心地分了类。



反正世超在实际用的时候,是真有感觉到 Grok2 能力的提升。


另外,按照官方给的数据,这次 Grok2 在数学这块儿,也能算得贼溜了。


于是我就又翻出了之前 Grok 做错的那道数学题,是一道求导的问题。



结果马斯克还真没忽悠咱,它俩都把这道题给整明白了。



而把 Grok 奶成现在的模样,马斯克在背后出得力可不止一星半点儿。


但有意思的是,马斯克主打的,就是薅自己其他公司的羊毛。。。


先是员工这块儿, xAI 统共就只有 50 来个员工,其中有 11 个都是在特斯拉工作的,而且里面还有 6 个是在 Autopilot 团队工作的,是一点儿都不想避嫌。


据华尔街日报消息,甚至原本要给特斯拉用的 GPU ,也被马斯克要求优先供应给 xAI ,还冠冕堂皇的说,特斯拉现在也没地儿用,在仓库里放着也是放着。



偷完特斯拉的家,还不过瘾,马斯克把手也伸到了 X 上。


就在前两天,科技媒体 Techcrunch 称,为了 “ 悄悄 ” 用用户们的数据训练 AI , X 在更新的时候,还偷摸着把用户的默认设置给改了,而且要关掉还得专门登录网页版。。。


不过总这么偷家,难免会吃上官司。像是马斯克和他的 X ,就被特斯拉的股东,还有好几个国家的数据保护机构给起诉了。


目前,关于特斯拉的案件,已经在特拉华州的一个法院审理了。


而另外几个数据保护机构,也把 X 告得,暂停用用户数据训练 Grok 了。甚至 X 还有可能遭到“ 4% 平台营业额 ”的罚款。



但无论如何,在大模型这块儿,马斯克的 Grok 也算是真正赶上大家伙的进度了。和其他大模型比,不管是图片生成,还是其他基础能力上, Grok2 都不算差,甚至还整出了一点儿自己的特色。


据说, xAI 下一步会把 Grok 更深入地揉到 X 平台上面,而且还要再发一个多模态理解的预览版 AI 。


不知道为啥,世超已经有点期待,马斯克还能整出什么花活儿来了。。。


文章来源微信公众号“差评X.PIN”,作者来自"松鼠"



关键词: 模型训练 , sus-column-r , xAI , Grok2
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0