腾讯把翻译大模型Hy-MT2塞进了手机,没网也能用,性能还逼近Gemini
腾讯把翻译大模型Hy-MT2塞进了手机,没网也能用,性能还逼近Gemini你猜一个能翻译33种语言、性能逼近顶尖闭源模型的AI,装进手机里需要多大?
搜索
你猜一个能翻译33种语言、性能逼近顶尖闭源模型的AI,装进手机里需要多大?
刚刚,字节跳动旗下剪映国际版CapCut宣布和谷歌Gemini APP达成合作,不久后将会推出新功能,用户能够直接在Gemini APP中使用CapCut的编辑工具编辑图片和视频。CapCut在社交平台X上的官宣文案中称“我们相信未来的创作将更加注重对话性、直观性和智能化,并能将各种工具和体验融为一体。”
过去AI视频是「生成内容」,Omni直接升级成「生成世界」。它懂动能、重力、因果,还能把复杂概念瞬间可视化。人类距离「言出法随」的梦想,还剩几个Gemini Omni的距离?
不出所料,之前爆料的 Gemini Omni 正式发布了。
首个Gemini桌面端曝光,全新Gemini 3.2/3.5闪现,不到1分钟盲写2000行代码,操作系统级Agent真的来了。
劈柴和Hassabis把半年大招一晚清仓了!Gemini Omni任意输入生成视频,3.5 Flash断层碾压一切,Spark 7×24h云端替你干活。这次,谷歌是要把OpenAI和Anthropic一起给埋了。
Mechanize 发布了一项硬核测试:给前沿 AI coding agents 24 小时,用 Rust 从零写一个完整的 Game Boy Advance 模拟器,再和顶级开源模拟器 Mesen2 逐帧对比打分。
发布会还没开,谷歌彻底藏不住了!Gemini 3.2 Flash网页端静默上线,被开发者抓了个正着。单次提示狂飙2200行代码、手搓Windows 98,直接把自家旗舰Pro按在地上摩擦。
无论最终叫Veo 4还是Gemini Omni,这次泄露已足够震撼:AI视频不再是短视频工具,而是拥有导演思维的叙事生产力。谷歌I/O当天,答案即将揭晓,而整个行业,都将重新洗牌。
就在刚刚,Gemini 3.5提前曝光了! 网友Lentils放出最新消息,代号「Cappuccino」的Gemini 3.5 Pro检查点已经开始产出。而就在几个小时前,传闻还是Gemini 3.2,没想到一下子就替换成了Gemini 3.5。