苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人
苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在 2024 苹果股东大会上,苹果 CEO 蒂姆・库克表示,今年将在 GenAI 领域实现重大进展。此外,苹果宣布放弃 10 年之久的造车项目之后,一部分造车团队成员也开始转向 GenAI。
今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在 2024 苹果股东大会上,苹果 CEO 蒂姆・库克表示,今年将在 GenAI 领域实现重大进展。此外,苹果宣布放弃 10 年之久的造车项目之后,一部分造车团队成员也开始转向 GenAI。
AI世界的进化快的有点跟不上了。刚刚,全球最强最大AI芯片WSE-3发布,4万亿晶体管5nm工艺制程。更厉害的是,WSE-3打造的单个超算可训出24万亿参数模型,相当于GPT-4/Gemini的十倍大。
近日,谷歌DeepMind宣布推出一个可扩展指令多世界智能体(Scalable Instructable Multiworld Agent,SIMA)。
约一年前,OpenAI发布了强大的基础模型GPT-4,这催生了一批基于GPT-4打造应用的创业公司,其中就有法律AI领域的领头羊Harvey。
在 AI 智能体这个领域,谷歌 DeepMind 又有了一项里程碑式研究。
最近我们关注到,马毅教授下的一家科技公司发生了股权变动,著名的VC基金真格入股。
信息革命产生了数字世界,数字世界为大模型的诞生提供了数据,也最容易实现通用人工智能(AGI)。
自古以来,人类创造、发明了各种工具,好奇心与对更美好生活的向往驱使着我们发现与创造新事物,而这也构成了我们的文明史。
刚刚,OpenAI超级对齐团队负责人官宣开源Transformer调试器。研究人员不用写代码,就能快速探索LLM的内部构造了!
基于大模型的Agent,已经成为了大型的博弈游戏的高级玩家,而且玩的还是德州扑克、21点这种非完美信息博弈。