揭秘:阶跃星辰万亿MoE+多模态大模型矩阵亮相
揭秘:阶跃星辰万亿MoE+多模态大模型矩阵亮相在 2024 年世界人工智能大会的现场,很多人在一个展台前排队,只为让 AI 大模型给自己在天庭「安排」一个差事。
在 2024 年世界人工智能大会的现场,很多人在一个展台前排队,只为让 AI 大模型给自己在天庭「安排」一个差事。
“有太多不法分子在使用 AI 生成视频,关键是要阻止他们并保护社会。”
AI基础设施的巨额投资,和实际的AI生态系统实际收入之间,差距已经到了不可思议的地步。曾经全球AI面临的2000亿美元难题,如今已经翻成了6000亿美元。
开源大语言模型(LLM)百花齐放,为了让它们适应各种下游任务,微调(fine-tuning)是最广泛采用的基本方法。基于自动微分技术(auto-differentiation)的一阶优化器(SGD、Adam 等)虽然在模型微调中占据主流,然而在模型越来越大的今天,却带来越来越大的显存压力。
检索增强式生成(RAG)是一种使用检索提升语言模型的技术。
马斯克连回两条推文为xAI造势,宣布8月发布Grok 2,年底将推出在10万张H100上训练的Grok 3,芯片加持创新数据训练,打造对标GPT的新一代大语言模型。
「忙碌海狸」难题困扰了计算机科学家40多年。如今,来自全球各地20+业余开发者和数学家们,终于取得了突破性进展。他们抓到了第五只忙碌海狸——用Coq辅助证明,得到答案47176870。对此陶哲轩激动地表示,这再次体现了证明助手对数学研究协作的重要性。
36氪获悉,快进时代(厦门)科技有限公司旗下「快进商店」宣布完成数百万美元战略融资,投资方为纳斯达克上市公司第九城市。本轮融资资金将主要用于产品升级及市场拓展。此前,「快进商店」已经完成了由小一创投投资的数百万人民币天使轮融资以及挑战者创投投资的千万级人民币Pre-A轮融资。
大厂拴不住的高级打工人,正涌向AIGC风口创业。
WWDC 2024上,苹果推出了Apple Intelligence,向大家展示了如何开发、训练出功能强大、快速且节能的模型,如何根据特定用户需求进行微调,以及如何评估模型的性能。