AI资讯新闻榜单内容搜索-gemini

谷歌掀语音Agent新纪元！开口就是生产力，Siri的最强外挂来了？

昨日凌晨，谷歌正式推出其最高质量的音频和语音模型——实时语音模型Gemini 3.1 Flash Live，并在Gemini App、Search Live以及Google AI Studio中同步开放，其中后者以预览版本向开发者提供。

来自主题: AI资讯

10139 点击 2026-03-27 14:41

全球 AI 公司烧了几千亿，最后都得抢着给苹果「打工」

就在刚刚，据彭博社报道，iOS 27 将引入一套名为「Extensions」的新机制，允许用户通过设置面板，把 Google Gemini、Anthropic Claude 等第三方 AI 接入 Siri，就像现在调用 ChatGPT 一样直接从 Siri 发起请求。

来自主题: AI资讯

7917 点击 2026-03-27 14:22

AI屠刀下一站“Vibe设计”！谷歌一个产品把合作伙伴Figma干崩了

谷歌宣布旗下AI设计工具Stitch支持Vibe Design。你都不需要键盘，只需要用嘴就可以vide design出这样婶儿的UI和前端界面：不得不说，谷歌的审美是真的好。Gemini 3生成前端的艺术效果就有口皆碑。

来自主题: AI资讯

8285 点击 2026-03-20 14:43

无需 VPN 翻墙！香港也能用上谷歌 Gemini 了

香港用户终于等来了这一天——谷歌宣布将逐步向香港开放 Gemini 网页应用，这意味着以后再也不需要翻墙 VPN 就能用上谷歌的 AI 助手了。在此之前，使用香港网络的用户一直无法直接访问 Gemini，需要借助 VPN 等「曲线救国」的方式才能使用。

来自主题: AI资讯

8524 点击 2026-03-19 21:54

AI助手现在认路了：谷歌地图直接「长」进大脑

谷歌DeepMind刚刚为Gemini API放了一个大招：内置工具和自定义函数终于可以在同一次调用里混着用了。再加上跨工具的「上下文环流」和Google Maps原生接入，Agent开发的编排噩梦正在终结。

来自主题: AI资讯

6689 点击 2026-03-19 15:23

500行极简开源框架，硬刚GPT/Gemini视觉极限！

多模态模型代码写得像老司机，却在数手指、量柱子时频频翻车？UniPat AI用五百行代码打造的SWE-Vision，让模型「掏出Python尺子」自我验证，一举拿下五大视觉相关基准SOTA。

来自主题: AI资讯

7831 点击 2026-03-16 15:08

从多模态大模型中「拆」出音频向量模型

Google 最近发了 Gemini Embedding 2，他们第一个原生多模态向量模型。文本、图像、视频、音频、文档，全部映射到同一个 3072 维向量空间。这是 Omni Embedding（全模态向量模型）的大趋势：一个架构吃下所有模态，从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5，大家都在往这个方向收敛。

来自主题: AI技术研报

5401 点击 2026-03-16 15:06