今天凌晨,谷歌 Gemini 突然放大招,它在 X 上宣布:现在 Gemini 可以直接生成PDF、Word、Excel 或 Google Workspace 等文件,无需上传模板,只用和Gemini交流要做什么和讲清文件格式。

底下网友都炸开了锅,大家都开始花样尝试:
比如一个最简单的例子:为“鸡蛋”创建一份 PPT 。Gemini 起的标题是“不可思议的鸡蛋”~


有网友让Gemini把他儿子写的乱七八糟的3页纸转成PDF,它整理得井井有条,清晰易读。


一位日本校务人员尝试让Gemini写个PDF的公文,说一开始没抱太大期待,但没想到完成的挺好。


一个日本AI开发者试了一下生成Excel文件,体验完后感叹:“这绝对会改变游戏规则!!!”

有人在试用后说:“它甚至可以一次性生成30个文件”。可以看到它生成了 31 种不同格式的文件,外加Zip压缩文件。



还有人吐槽:Gemini 生成文件是即时的,而从 Gemini 中下载文件总是加载中、加载中、加载中……

效果究竟如何,让我们来实测瞧一瞧。
Gemini 文件生成实测
旅游计划 PDF
马上就是五一长假了,让 Gemini 生成一份旅游计划 PDF 看看会如何,小编用的 prompt 是:帮我生成一份《2026年7月新疆北疆7天自驾旅行计划》PDF,包括每日详细行程、预算表格(交通+餐饮+住宿)、必带物品清单、紧急联系方式和可爱的手绘地图风格插图。手机阅读友好。
很快,Gemini 就吐出了一份完整的旅行计划,看到的时候真的很惊喜,原来免费版就可以用。

下载还挺迅速,没有网友说的那么慢。但打开 PDF 后,刚开始看见简易路线图,心里在想:这是个啥?箭头都没有。

不过继续往下刷,7天行程的规划看起来很靠谱,重要景点都有介绍。预算它自动给了双人均摊的费用,租车、燃油、住宿、餐饮和门票都考虑到了。必带清单的内容也很贴心,还说了可以带长裙或亮色衣服,适合拍照。
在紧急联系方式部分,还自动添加了温馨提示,说新疆夏季日照长,晚上十点后才天黑。



小编还没去过新疆,不知道它给的计划和实际情况有哪些差距,但我让Kimi帮我分析了下这份旅游计划有哪些不合理的地方。
Kimi指出好多问题,总的来说就是行程节奏偏快、预算偏紧,对路况季节性考虑不足,要根据实际出行日期灵活调整。
生成日用类的计划文件还是要谨慎点,得让模型再评估下合理性和可行性,最好还是咨询下有经验的人。
健康食谱 Excel
小编这次五一可能宅家不出去旅游,每次放假都不知道吃什么,不知道单身打工人有没有同感,所以想让 Gemini 生成一个懒人食谱。
给的 Prompt 是:生成一份“ 5 日健康食谱” Excel,包含 5 天每日三餐菜单、所需食材购物清单、每餐预估时间和热量。风格轻松可爱。

看到结果后,真是"哇"出来了,很丰富的样子!不过有点太西式了,提示词上最好加上“中餐”关键词。
很好玩的是 Gemini 在五日菜单中添加了一列“元气语录”,比如“开启活力满满的一天!”;在购物清单里加了一列“备注”,比如“贝贝南瓜更甜”;还自己主动加了一个健康小贴士部分,提醒喝水和饮食方式等,其中有一条是“保持好心情是最好的消化剂!”
这个食谱 Excel,小编也让 Kimi 分析了有没有食物相克的问题,Kimi 的回复是没有,不过提醒不同人群需要注意调整餐食,还给出了一张表格:

不得不说,真的很好用,好方便啊!
项目提案 Word
最后来尝试一下用 Gemini 生成工作提案,让它给自己的母公司谷歌写份品牌升级建议,看看它会提出什么新鲜内容。
Prompt:生成一份《2026年谷歌公司品牌升级项目提案》Word 文档,包含项目背景、目标、详细执行计划、预算表格、时间线 Gantt 图(用表格模拟)和预期效果。风格专业现代,适合直接打印或分享。

在这一 part ,Gemini 的表现不太出色,整个提案的逻辑一致性和创意性较差,还是需要人类的头脑。
比如,它说品牌升级的背景是谷歌正从搜索公司演变为 AI 助手公司,核心驱动力是要强化 Gemini 品牌和谷歌母品牌的深度融合,而它设定的目标仍只是更新谷歌传统四色体系及图标,像微调 Logo 和引入“智能流”动效,公司的跨代感并没有明显地体现出来。
不过,能在几分钟内就针对详细执行计划、预算分配、项目时间线三个方面给出不同维度的预估,比外行人确实强太多了,可以在此基础上对可行性和落地性进一步深化。
写在最后
以前用 AI 写完内容后,还得手动复制到 Word、调整格式、处理表格崩坏等问题,而 Gemini 这个功能一发布,我们可以更加轻松地享受 AI 的生产力红利了。
学生能一键生成带目录的复习 PDF,职场人士能快速做出周报、预算表,还可以用于规划健身计划、家庭预算、出行计划之类的事项。时间被节省下来,就能做更多有创意、有温度的事情。
想必这也将会刺激其他 AI 模型跟进类似“原生文件生成”能力,推动整个行业从“生成文本/图像”向“生成完整可交付成果”迈进。未来这项功能还可能进化成为更精细的排版控制、更复杂的多文件打包(ZIP)、与本地 Office 软件的无缝协作等等。
文章来自于微信公众号 "51CTO技术栈",作者 "51CTO技术栈"
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0