
大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了
大模型实时打《街霸》捉对PK,GPT-4居然不敌3.5,新型Benchmark火了让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。
让大模型直接操纵格斗游戏《街霸》里的角色,捉对PK,谁更能打?GitHub上一种你没有见过的船新Benchmark火了。
GitHub三万Star项目MetaGPT上新,号称是“开源Devin”——推出数据解释器(Data Interpreter),能够应对数据实时变化、任务之间复杂的依赖关系、流程优化需求以及执行结果反馈的逻辑一致性等挑战。
“猛增至91万、涨幅高达264%、34倍”这一数据来自GitHub 上的AI开源项目统计对比。
这个名为DUSt3R的新工具,火得一塌糊涂,才上线没多久就登上GitHub热榜第二。
OpenAI也996,实锤了(doge)。
Karpathy力推代码生成任务增强流程,让GPT-4在CodeContests从19%提升到44%,不用微调不用新数据集训练,让大模型代码能力大幅提升。
混合专家(MoE)架构已支持多模态大模型,开发者终于不用卷参数量了!北大联合中山大学、腾讯等机构推出的新模型MoE-LLaVA,登上了GitHub热榜。
辛辛苦苦手写的论文,却被审稿人鉴定为“一眼ChatGPT”而被拒收。一位副教授的遭遇引发学术界关注,登上Nature专栏。她决定从此以后每篇论文都在GitHub上写,用变更记录来证明自己的清白。
一个体量仅为2B的大模型,能有什么用?答案可能超出你的想象。
只需一张照片,整个过程无需训练 LoRA 模型,多风格 AI 写真即刻呈现!