中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑
中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑没等到GPT-4o,商汤先把《Her》给发布出来了!
没等到GPT-4o,商汤先把《Her》给发布出来了!
最近,一个对标 GPT-4o 的开源实时语音多模态模型火了。
“一天到晚就是跑分,刷榜,谁谁谁又超越GPT4了,OpenAI又出来sora了,又出来GPT-4o了等等。今天这个震撼发布,明天那个史诗级更新,但是我要问,应用在哪里?谁从中获益了?”
囤 GPU 真的像修铁路一样,是一项划算的投资吗?
谷歌的Gemma 2刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了Gemma 2 9B/27B模型的中文通用对话、角色扮演、数学、工具使用等能力。
马斯克为Grok 3要豪掷近40亿美元狂买10万张H100,GPT-6的训练则可能要耗资百亿。然而红杉和高盛近日都给行业泼了冷水:每年要挣6000亿美元才能支付的巨额硬件支出,换来的却只是OpenAI 34亿美元的收入,绝大多数初创连1亿美元都达不到。而如果全世界的AI泡沫都被戳破,很可能就会导致新的经济危机。
重视大模型AI应用落地的展示,是今年大模型厂商们一个非常明确的策展主题。
瑞士苏黎世联邦理工学院的研究者发现,为ChatGPT等聊天机器人提供支持的大型语言模型可以从看似无害的对话中,准确推断出数量惊人的用户个人信息,包括他们的种族、位置、职业等。
套壳生意,被国产大模型快要打没了。
Moshi 具有彻底改变人机通信的潜力。