AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥
AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥刚刚,LMArena陷入了巨大争议,斯坦福MIT和Ai2等的研究者联手发论文痛斥,这个排行榜已经被Meta等公司利用暗中操作排名!Karpathy也下场帮忙锤了一把。而LMArena官方立马回应:论文存在多处错误,指控不实。
搜索
刚刚,LMArena陷入了巨大争议,斯坦福MIT和Ai2等的研究者联手发论文痛斥,这个排行榜已经被Meta等公司利用暗中操作排名!Karpathy也下场帮忙锤了一把。而LMArena官方立马回应:论文存在多处错误,指控不实。
来自英伟达和UIUC的华人团队提出一种高效训练方法,将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录!基于Llama3.1-Instruct打造的UltraLong-8B模型,不仅在长上下文基准测试中表现卓越,还在标准任务中保持顶尖竞争力。
每年毕业季,翟天临都会被拉出来“鞭尸”,眼看查重标准变得越来越严格,准毕业生们一个个都带上了痛苦面具。“到底是谁发表了我的论文!”不过今年除了往年经常讨论的查重率,又多了一个新的AIGC查重,这对于正在查重降重的学生们来说,无疑又是一个新的噩耗。
宇曜科技Matter-seek:用AI重构材料科学研发新范式。在高端制造领域,新材料研发的滞后性正成为制约产业升级的隐形瓶颈——光刻胶、航空发动机高温合金等核心材料长期依赖进口,单一材料研发周期动辄十年起步,失败率居高不下。宇曜(北京)科技有限公司推出的Matter-seek人工智能新材料研发平台,正试图用“数据引擎+层级神经网络”的技术组合,打破这一僵局。
连证件照都能在家用AI搞定,介么不是魔法嘛!这就是Aragon AI,一款利用AI生成专业证件照的软件,让人不出家门就能得到逼真的证件照。
Meta首届LlamaCon开发者大会开幕,扎克伯格在期间接受采访,回应大模型相关的一切。包括Llama4在大模型竞技场表现不佳的问题:
想象一下,你的智能体只需接收一条自然语言指令,就能在 600+ 工具中自动筛选出最合适的 API 组合来完成整个任务流程,无需逐个集成、无需硬编码。这不再是未来畅想,而是 ACI.dev 开源 MCP 中枢(Unified MCP Server)已经实现的现实。
反垄断几乎成为了科技巨头不可不体验的一个环节,如今谷歌也遇到了二十多年前微软同样的困境。
被AI带飞的小绿鸟,现在要彻底AI-first了。
Agent赛道热闹非凡,周鸿祎力推的纳米AI搜索,体验上能有什么不一样?