谷歌要开始发力了。
在日前谷歌举办的 2024年I/O Connect China谷歌开发者大会上,AI大模型多元化成为市场关注的焦点。
围绕APP软件开发,谷歌推出三种不同规格的Gemini模型。谷歌方面称,Gemini Nano是最高效的模型,适合处理设备端任务。
据悉,Gemini 1.5 Flash是谷歌迄今为止最快、最经济的模型,适合处理高容量任务。面对所有开发者开放的Gemini 1.5 Pro,支持200万token 上下文窗口。为减少算力消耗,Gemini 1.5 Pro和1.5 Flash均已上线上下文缓存功能。
考虑到开发者可能需要更大的灵活性和掌控力,谷歌推出Gemini姊妹大模型Gemma。新发布的Gemma2相较于Gemma,新增90亿和270亿参数两种规格。其中,270亿参数版本经过优化,同时支持Google Cloud上的单个英伟达GPU以及Vertex AI单个TPU运行。
目前Gemini相关大模型已集成到Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ和 Firebase等开发工具中,可帮助开发者编写、调试、测试代码、生成文档、理解代码库等。
以Flutter为例,小米SU7配套应用就是基于Flutter所打造。在原有Flutter基础上,谷歌推出Flutter 3.24和 Dart 3.5。新版最大看点是“Flutter GPU”新API的早期预览版。如通过内置 Flutter SDK,开发者可使用Dart代码访问GPU,进而提高图像渲染能力。
为方便开发者使用,谷歌推出多个Package。如Flutter_Scene可将3D项目直接导入,进而提高游戏体验。
此外,谷歌也推出Android Studio ON IDX早期预览版,和原有Android Studi不同的是其支持在浏览器中完全运行。为保证借助AI构建应用的可靠性、合规性和安全性。谷歌推出包括如Firebase AI Monitoring 信息中心、Checks AI Safety等开发组件。
在AI大模型开源席卷全球下,谷歌推出开源大模型项目Project Oscar。但初始阶段,Project Oscar仅支持93000条代码提交以及2000名开发者Go编程语言项目。
围绕Web网站开发,随着Web GPU、WASM和Gemini内置到Chrome中,谷歌全新推出的Speculation Rules API可做到搜索即时导航,摆脱冗长页面加载。面向单页应用推出的View Transitions API,可提高页面过渡体验。二者结合,进而保证页面过渡的无缝衔接。
为保证Web开发者开发效率,谷歌顺势推出试和优化应用Chrome DevTools,其在开发者网站出现问题时会发出警告和错误提示。该应用已内置到Gemini中。
围绕下一代安卓原生应用开发,谷歌推出多款新产品。设备端AI模型Gemini Nano和系统服务AI Core;用于业务逻辑共享代码,适用于移动端、Web、服务器和桌面平台的Kotlin Multi Platform;并为DataStore、Room和ViewModel等多个Jetpack库添加Kotlin Multi platform支持。
测试平台Android Device Streaming,则联合小米、OPPO、一加、三星等手机厂商,方便开发者进行终端测试,现处于Beta阶段。Gemini in Android Studio纳入Android Studio稳定版,新增代码生成和代码转换功能,以及AI隐私设置控制数据分享功能。
围绕云业务,谷歌提出的云端新旅程具有五大特点:一是云上开发新范式,新推出的Vertex AI功能可实现上下文缓存和接地功能。二是自成体系的灵活扩展,新推出150多种模型,包括Gemini系列、Gemma开源模型、Anthropic Claude模型、Meta Llama模型和Hugging Face模型库。
三是打破壁垒的跨云之旅,新推出的优化PostgreSQL数据库和BigQuery Omni功能,支持跨云互联和联合查询以及多“云”协同。四是轻松实现强大功能,新推出的自动化与智能默认设置,搭建全套云基础设施只需45分钟,包括网络、身份验证和日志记录等。
五是AI智能助力,新推出的Gemini Code AssistIDE插件,提供代码生成、补全、解释和测试生成功能。Gemini in Databases则提供SQL生成和数据库操作智能化。
围绕开发者发布多款大模型,无疑彰显谷歌想要加速推进大模型商业化的决心。但目前谷歌的AI能力,尤其是输出和检索能力可能仍需提高。
今年6月份海外用户在询问谷歌“制作披萨使用多少胶水”问题时,谷歌AI搜索给出的答案为:据Business insider2024年5月的相关显示文章,谷歌Al搜索结果建议在披萨酱中加入1/8 杯,即2汤匙,白色无毒的胶水,以防止奶酪滑落。
文章作者KatieNotopoulos 表示,胶水没有明显改变酱汁的稠度,而披萨呈现出诱人的橙色。海外媒体The Verge验证后发现,该截图并非伪造。因披萨中不能加入任何胶水,该答案也引发海外用户对谷歌AI检索能力的质疑。
我们在对Gemini实测过程中发现,一方面Gemini文生图能力已被关闭,且Gemini暂时也不支持文生视频。另一方面,Gemini的逻辑推理、数学计算能力仍需提高。
图源:Gemini官网
我们将2024年高考数学真题给到Gemini且特意强调是多选题,三道题目正确答案分别为(BD)(ACD)(ABC),但Gemini给出的答案分别是(AC)(AD)(AB),虽说第10题和第11题Gemini的答案包括正确选项,但第9题却全部是错误选项。
图源:2024年高考数学真题
图源:Gemini官网
此外,随着谷歌大模型日益增多,正面临数据中心电力消耗产生的二氧化碳排放迅速增加的棘手问题。
谷歌相关环境报告指出,2023年仅谷歌数据中心电力消耗就增长17%,由电力消耗所产生的二氧化碳污染较2022年同期增长13%至1430万吨,大致相当于38家燃气发电厂每年可能排放的二氧化碳量。
不仅仅是谷歌,Microsoft2023财年的温室气体排放量比2020年高出约30%。对于未来如何降低碳排放,谷歌相关报告指出,随着我们进一步将人工智能集成到我们的产品中,由于人工智能计算强度的增加导致的能源需求增加,以及与我们的技术基础设施投资预期增加相关的排放,减少排放可能具有挑战性。
按照当前AI大模型发展速度,未来对电力需求或将成倍增长。作为全球拥有最多数据中心的美国,引发当地民众对人工智能压倒电网的电力需求急剧上升的担忧,并可能使煤炭和天然气工厂的存在时间比其他方式更长。
商业化、输出质量稳定化、减碳化等各种问题的存在,即使对于谷歌这样的全球大厂短期内也难言轻松。
文章来源于“DoNews”
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/