
大模型 | 关于Google Gemini,您需要了解的一切
大模型 | 关于Google Gemini,您需要了解的一切谷歌正借助其旗舰产品——Gemini系列(涵盖一系列前沿的生成式人工智能模型、应用及服务)引领行业潮流。那么,Gemini究竟为何物?您该如何充分利用它?相较于OpenAI的ChatGPT、Meta的Llama以及微软的Copilot等其他生成式AI工具,Gemini又表现如何呢?
谷歌正借助其旗舰产品——Gemini系列(涵盖一系列前沿的生成式人工智能模型、应用及服务)引领行业潮流。那么,Gemini究竟为何物?您该如何充分利用它?相较于OpenAI的ChatGPT、Meta的Llama以及微软的Copilot等其他生成式AI工具,Gemini又表现如何呢?
26岁的OpenAI吹哨人,在发出公开指控不到三个月,被发现死在自己的公寓中。法医认定,死因为自杀。那么,他在死前两个月发表的一篇博文中,都说了什么?
这篇文章是我作为 AI 产品经理一年的复盘文章。 2022 年的某一天,我在互联网人群为主的即刻 APP 冲浪。彼时,在即友口中听说了在海外有一个叫 ChatGPT 的应用突然爆火了。于是,我开始关注 AI。
距离ChatGPT发布刚好两年,ChatGPT发布的第三天我就尝试用过了,当时给我的感觉是虽然和过去的AI完全不一样,但距离真人还是有点差距的。
就在刚刚,在OpenAI“双十二”的第七天,一种全新的对话交互模式诞生——Projects。它“长”在这儿,主页的左侧导航栏中:如其名,Projects的功能就是按照项目来组织和管理文件,正如官方介绍的那样:
OpenAI 放出了 o1 Pro、GPT-4o 高级语音、GPTCanavas,就跟孔雀开屏一样 ~ 谷歌最近的大动作是发布了 Gemini 2.0 嘛!2.0 比 1.5 版本快一倍,而且是原生的多模态大模型,能输入和生成语言、声音、图片、视频等。
OpenAI的实时API支持低延迟、双向音频流,使得多模态AI应用(如语音对话Agent)得以实现。它通过WebSocket连接管理对话状态,并提供短语结束检测和语音活动检测(VAD)功能,大大简化了实时语音应用的开发。
嘿!最近 AI 圈都在关注 OpenAI 的连续 12 场直播。就在直播开播同一天,OpenAI 也出炉了 o1 系统卡(o1 System Card),今天咱们就来啃啃这块硬骨头。
OpenAI谷歌天天刷流量,微软也坐不住了,推出最新小模型Phi-4。 参数量仅14B,MMLU性能就和Llama 3.3/ Qwen2.5等70B级别大模型坐一桌。
江旭是OpenAI GPT 4的重要贡献者,于2023年离开OpenAI。