干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器
8580点击    2025-12-14 13:20

Google 正在加速将其 Gemini 模型的能力融入核心产品线。


Google 周五宣布,正式向 Google 翻译引入其 Gemini 模型的各项能力。此次更新不仅带来了能够通过耳机进行的实时语音翻译 Beta 版体验,还大幅提升了文本翻译的语境理解能力,并扩展了应用内的语言学习工具。


Google 还通过 Google Labs 推出了一款名为「Disco」的实验性浏览器,试图用 AI 重构网页浏览体验。


把所有耳机变成「同声传译」设备


谷歌宣布,Google Translate 正在推出一项基于 Gemini 模型的全新 Beta 功能,允许用户通过耳机收听实时翻译。

干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器


与以往仅限于 Pixel Buds 的独占功能不同,此次更新支持任何品牌的耳机。该功能旨在将佩戴耳机的用户设备变成一个实时的单向翻译工具。根据谷歌产品管理副总裁 Rose Yao 的介绍,这项功能不仅能翻译语言,还能保留说话者的语调、重音和节奏,从而让对话更加自然,也更容易区分不同的发言者。


无论是跨语言对话、在国外听讲座,还是观看外语影视作品,用户只需打开 App 点击「Live Translate」即可使用。


目前该 Beta 版本已在 Android 端的 Translate 应用中上线,支持超过 70 种语言。谷歌计划在 2026 年将该功能扩展至 iOS 平台及更多国家。


更懂「弦外之音」


除了语音功能,Google 还利用 Gemini 模型的高级能力重构了文本翻译体验。新的翻译引擎在处理俚语、成语或具有本地特色的表达时,能够更智能地解析上下文,而非进行生硬的逐字翻译。


Google 举例称,在翻译英语成语「stealing my thunder」(抢风头/抢功劳)时,Gemini 不会给出字面意思的翻译,而是根据语境捕捉其真实含义,生成更符合目标语言习惯的译文。


这一改进即日起在美国和印度推出,支持英语与近 20 种语言(包括中文、日语、德语、阿拉伯语和西班牙语)之间的互译。用户可通过 Android、iOS 应用及网页版体验。


另外,Google 还在进一步完善其翻译应用中的语言学习功能,使其更接近专业的语言学习软件(如 Duolingo)。


干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器


语言学习工具现已扩展至近 20 个新国家/地区。英语使用者现在可以练习德语和葡萄牙语。孟加拉语、简体中文、荷兰语、德语、印地语、意大利语、罗马尼亚语和瑞典语使用者可以练习英语。


新增了基于口语练习的改进型反馈机制,以及「连胜打卡(Streak)」功能,记录用户连续学习的天数,以激励用户保持学习习惯。


用 AI 生成即时「网页应用」


在翻译工具之外,谷歌 Chrome 团队在 Google Labs 推出了一个更具前瞻性的实验项目:Disco(意为 Discovery)。这是一款全新的浏览器,其核心概念是「GenTabs」(生成式标签页)。

干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器


什么是 GenTabs?不同于传统浏览器单纯展示网页,或目前主流 AI 浏览器仅提供文本摘要,Disco 试图通过 Gemini 3 模型将信息转化为「微型应用」。


当用户输入需求(例如「计划一次日本旅行」)时,Disco 不仅会打开相关的网页标签,还会根据这些网页的内容和用户的对话,自动生成一个包含地图、行程表和链接的交互式界面。

干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器


这是一个「浏览器中的浏览器」。GenTabs 是动态的,如果用户打开了新的相关网页,GenTabs 会自动抓取新信息并更新到交互界面中。


Chrome 团队负责人 Parisa Tabriz 强调,Disco 并非旨在取代 Chrome,也不是要「吃掉」网页流量。相反,它鼓励用户打开真实网页作为 AI 的「锚点」,形成用户浏览网页与 AI 整理信息之间的良性循环。


目前,Disco 作为一个实验性项目,已开放 macOS 版本的等待名单。


文章来自于微信公众号 “机器之心”,作者 “机器之心”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales