Google 17年老兵离职创业,融资800万美金,重新定义AI社交
Google 17年老兵离职创业,融资800万美金,重新定义AI社交我们每天花在群聊上的时间越来越多,却也越来越感到疲惫和混乱。想想看,那些无尽的消息提醒、找不到的重要信息、永远进行不下去的决策讨论,还有复制粘贴ChatGPT回答的尴尬时刻。这些看似日常的群聊烦恼,其实暗示着一个更深层的问题:AI革命已经改变了我们与机器的交互方式,但我们最重要的社交空间——群聊,却依然停留在十年前的状态。
我们每天花在群聊上的时间越来越多,却也越来越感到疲惫和混乱。想想看,那些无尽的消息提醒、找不到的重要信息、永远进行不下去的决策讨论,还有复制粘贴ChatGPT回答的尴尬时刻。这些看似日常的群聊烦恼,其实暗示着一个更深层的问题:AI革命已经改变了我们与机器的交互方式,但我们最重要的社交空间——群聊,却依然停留在十年前的状态。
在人工智能技术迅速迭代的当下,一种新的幻觉机制正在悄然成型。
随着ChatGPT,DeepSeek等一批AI大模型被人们越来越多运用到日常生活和工作中,用ChatGPT解答疑问,编写程序,创作音乐和写作,成为了越来越多人的日常。
GPT-5是一个分水岭,终于学会了「推理」。联创Greg Brockman最新访谈畅谈了OpenAI AGI之路,未来AI可以做到边用边学,在超临界模式下推导出N阶后果。
自GPT-2以来,大模型的整体架构虽然未有大的变化,但从未停止演化的脚步。借OpenAI开源gpt-oss(120B/20B),Sebastian Raschka博士将我们带回硬核拆机现场,回溯了从GPT-2到gpt-oss的大模型演进之路,并将gpt-oss与Qwen3进行了详细对比。
作者测试了智谱GLM-4.5V(开启/关闭推理)、豆包、Kimi、元宝和ChatGPT-5在识别十张奇葩卫生间标识上的表现。评测模拟紧急如厕场景,按识别正确性评分。结果智谱普通模式得分最高(86分),ChatGPT-5和智谱推理模式次之(78分),豆包和元宝70分,Kimi垫底(38分),揭示了各AI视觉能力的差异及局限性。
情绪价值这块儿,GPT-5让很多网友大呼失望。 免费用户想念GPT-4o,也只能默默调理了。
GPT-5比人类医生还会看X光片?! 最新研究显示,GPT-5对医学影像的推理和理解准确率分别比人类专家高出24.23%和29.40%。
前沿 AI 模型真的能做到博士级推理吗? 前段时间,谷歌、OpenAI 的模型都在数学奥林匹克(IMO)水平测试中达到了金牌水准,这样的表现让人很容易联想到 LLM 是不是已经具备了解决博士级科研难题的推理能力?
GPT-5发布以来,路由架构是最受关心的部分之一。它不仅实现了多个模型统一调度,而且还藏着奥特曼的诸多小心思。比如成本更可控、悄悄识别意图插入广告等。