ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
Gemini修bug神了!录网页视频把代码库甩给它就行,网友坐不住了:想要访问权限
5004点击    2024-03-09 14:55

谷歌Gemini修改bug让网友大开眼界!


X一小伙分享,为测试Gemini 1.5 Pro,自己在编写一个网页的代码时故意留了3个bug,并分别录制了网页bug视频。


接着把代码库打包成文件连同视频一起输给了Gemini 1.5 Pro,提示它找到并修复代码中的所有bug,且要提供一个简要指南以及所做更改的说明。


没想到,Gemini 1.5 Pro还真就分分钟正确识别并修复了每一个bug。



小伙将这种玩法po出来后热度不断攀升,网友们纷纷一键三连,转赞收藏量过万。


其本人还在评论区强调,“这只是一个简单的例子,也将是它最差的表现”,Gemini这小汁前途不可限量啊。



有网友表示想起来一件事觉得有趣:英伟达黄院士前段时间曾公开表示“孩子们以后不需要学编程了”,那时候还有很多人反对称“AI不会取代程序员”。



但甭管怎么说,AI可以给程序员提供帮助是有目共睹的。



接下来我们展开来看Gemini 1.5 Pro修复bug的经过。


事件经过


正如开头提到的,网友先是在编写网页代码时故意写错了3处:



这就导致网页上的一些功能操作无法正常运行,于是小伙分别拍摄了3处无法正常运行的视频,每个视频十几秒。


然后将视频连同代码库一起输给了Gemini 1.5 Pro。


prompt为:


Fix the bugs in my code.Create a simple markdown guide for me to fix them,and then write the actual code to fix the bugs.I need the full code like it’s for a complete PR so I am make the changes.(修复我代码中的bug,为我创建一个简单的Markdown指南以修复bug,然后编写实际的代码来修复。我需要完整的代码,就像它是为了一个完整的Pull Request一样,这样我才能进行更改。)


随后,Gemini 1.5 Pro立刻准确识别了3个bug:


  • 点击一个待办事项并不会将其标记为完成/未完成

  • 主题切换器不会切换主题

  • 点击登录按钮不会触发任何操作


紧接着就分别给出了修复方案,附带代码:



小伙仔细对照自己敲的代码,确认Gemini 1.5 Pro给出的答案是正确的:



小伙还强调,这3个bug在代码库文件中其实离着很远,这也就意味着Gemini 1.5 Pro确实读完了完整的上下文。



“想要访问权限”


网友看到这一系列操作后激动搓手,直呼想要Gemini 1.5 Pro访问权限:



除坐等外,还有网友表示用GPT-4帮忙修复代码也很好使,顺带畅想了一下GPT-5:


接下来可能是实时交互?或许能与GPT-5进行屏幕共享?


而另一边已经获得访问权限的网友早就玩嗨了。


比如,一次性输给Gemini 1.5 Pro最新的10篇论文,让它从中找到一个作者的电子邮件地址。


结果Gemini 1.5 Pro第一次就成功找到了:



然后又让Gemini 1.5 Pro从超360000token的《哈利·波特与凤凰社》整本书中找到一句话的说话人,Gemini 1.5 Pro也成功找到了。



测试继续上难度,一次性输入三本书,Gemini 1.5 Pro最后用时约1分钟再次成功找到对应的说话人:



惊讶之余,这位测试者总结了Gemini 1.5 Pro的逻辑推理能力:


对于常规提示,接近GPT-4的性能。

但当我添加数十个例子时,Gemini的性能在提升,似乎没有上限。多示例提示成为了新的微调方法。


沃顿商学院教授Ethan Mollick也来整活了。输给Gemini 1.5 Pro一本352页的《太空60年》规则手册,约250000token,然后要求它扮演一个角色。


即使说明书分散在很多页上,而且非常复杂,但Gemini“似乎明白了”:



Ethan Mollick教授表示,对所有其他AI进行这项测试都是失败的,只有Gemini 1.5 Pro成功了。



这位网友想要编译整个X算法的代码存储库并将其上传到Gemini 1.5 Pro,正在线向网友征集想问的问题。



只见编译完成后,共310489token,Dogan Ural向Gemini 1.5 Pro提出了网友们关心的一系列问题,比如“在推特上扩大或者减少影响力的前5件事是什么?”


Gemini 1.5 Pro很轻松地给出了这样婶儿的答案:



你还见过哪些有趣的玩法?欢迎评论区分享~


参考链接:

[1]https://twitter.com/mckaywrigley/status/1762175776726663267

[2]https://twitter.com/mattshumer_/status/1759981272779108403?s=46&t=iTysI4vQLQqCNJjSmBODPw


文章来自于微信公众号“量子位”(ID: QbitAI),作者 “西风”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0