院士领衔推出大模型的第3种记忆:比参数存储和RAG都便宜,2.4B模型越级打13B
院士领衔推出大模型的第3种记忆:比参数存储和RAG都便宜,2.4B模型越级打13B给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来!
搜索
给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来!
市值140亿美元的初创公司Scale AI正在招聘博士训练LLM,用人成本的升高让该公司的毛利率在2023年有所下降,但创始人Alexandr Wang预计今年营收将增加两倍,突破十亿美元。
现实中,机器人收据收集可以通过远程操控实现。来自UCSD、MIT的华人团队开发了一个通用框架Open-TeleVision,可以让你身临其境操作机器人,即便相隔3000英里之外。
ChatGPT能耗惊人,该怎么解?谷歌DeepMind新算法JEST问世,让LLM训练的迭代次数降低13倍,计算量减少10倍,或将重塑AI未来。
基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大语言模型(Large Language Models,LLMs)的强大理解、生成和推理能力
马斯克为Grok 3要豪掷近40亿美元狂买10万张H100,GPT-6的训练则可能要耗资百亿。然而红杉和高盛近日都给行业泼了冷水:每年要挣6000亿美元才能支付的巨额硬件支出,换来的却只是OpenAI 34亿美元的收入,绝大多数初创连1亿美元都达不到。而如果全世界的AI泡沫都被戳破,很可能就会导致新的经济危机。
历经3个月,首届AI奥数竞赛终于公布最终结果了!Gemma 7B只能达到3/50正确率的题目中,第一名的Numina模型居然刷出了29/50的成绩。
Meta 3D Gen:AI革命性突破,3D创作从此告别高成本与复杂工艺
Meta的文生3D模型或将给3D创作生态带来剧变。
“有太多不法分子在使用 AI 生成视频,关键是要阻止他们并保护社会。”