GPT Next年底来袭!有效计算量百倍GPT-4,OpenAI耗资数百亿打造基建
GPT Next年底来袭!有效计算量百倍GPT-4,OpenAI耗资数百亿打造基建OpenAI的下一代前沿模型GPT Next,或许真的有着落了。KDD 2024峰会上,发言人再次称,虽然GPT-3和GPT-4的能力相对接近,但GPT Next预计将取得实质性地性能跃升。
OpenAI的下一代前沿模型GPT Next,或许真的有着落了。KDD 2024峰会上,发言人再次称,虽然GPT-3和GPT-4的能力相对接近,但GPT Next预计将取得实质性地性能跃升。
老黄预言AI生成游戏的未来,很快就要实现了!在一年一度Roblox开发者大会上,CEO官宣了3D基础模型,仅用文本提示便可生成3D物体。未来目标,便要瞄准10亿玩家,AI视频游戏大爆发时代不远了。
一直否定AI的回答会怎么样?GPT-4o和Claude有截然不同的表现,引起热议。
9 月 2 日,马斯克发文称,其人工智能公司 xAI 的团队上线了一台被称为「Colossus」的训练集群,总共有 100000 个英伟达的 H100 GPU。
今天,DeepMind又发布了Alpha模型家族的新成员,堪称是「专精版」的AlphaFold,专注于设计蛋白质结合剂,将大幅减少所需的实验室工作,提升开发效率。
今年 7 月,一份《全球数字经济白皮书 (2024)》统计显示,全球目前已有 1300 多个基础大模型,美国的数量最多,中国紧随其后排在第二。
涌现(Emergence),是生成式AI浪潮的一个关键现象:当模型规模扩大至临界点,AI会展现出人类一般的智慧,能理解、学习甚至创造。
快速更迭的开源大模型领域,又出现了新王:Reflection 70B。 横扫 MMLU、MATH、IFEval、GSM8K,在每项基准测试上都超过了 GPT-4o,还击败了 405B 的 Llama 3.1。 这个新模型 Reflection 70B,来自 AI 写作初创公司 HyperWrite。
你敢相信 4B 参数小模型,性能却超越千亿量级的 GPT-3.5 !OpenAI、谷歌、微软、苹果等一众海内外巨头还没做到的事,被一家中国大模型公司抢先了!
视频理解仍然是计算机视觉和人工智能领域的一个主要挑战。最近在视频理解上的许多进展都是通过端到端地训练多模态大语言模型实现的[1,2,3]。然而,当这些模型处理较长的视频时,内存消耗可能会显著增加,甚至变得难以承受,并且自注意力机制有时可能难以捕捉长程关系 [4]。这些问题阻碍了将端到端模型进一步应用于视频理解。