Transformer八子初创:AI横扫NP难题竞赛,Top 2%选手竟是智能体!
Transformer八子初创:AI横扫NP难题竞赛,Top 2%选手竟是智能体!编程智能体确实厉害!Transformer作者Llion Jones初创公司,专门收集了NP难题并测试了AI智能体,结果竟在上千人竞赛中排第 21!这意味着,它已经比绝大多数人写得好了。
搜索
编程智能体确实厉害!Transformer作者Llion Jones初创公司,专门收集了NP难题并测试了AI智能体,结果竟在上千人竞赛中排第 21!这意味着,它已经比绝大多数人写得好了。
LLM Ensemble(大语言模型集成)在近年来快速地获得了广泛关注。它指的是在下游任务推理阶段,综合考虑并利用多个大语言模型(每个模型都旨在处理用户查询),从而发挥它们各自的优势。大语言模型的广泛可得性,以及其开箱即用的特性和各个模型所具备的不同优势,极大地推动了 LLM Ensemble 领域的发展。
由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech Language Models: A Survey》已成功被 ACL 2025 主会议接收!这是该领域首个全面系统的综述,为语音 AI 的未来发展指明了方向。
美国国防部与OpenAI签订为期一年、价值2亿美元的合同,将采用其人工智能模型
深夜,沉寂已久的Kimi突然发布了新模型—— 开源代码模型Kimi-Dev,在SWE-bench Verified上以60.4%的成绩取得开源SOTA。
如果你也在用 Cursor 或者类似的 AI 编程神器,我敢打赌,你每个月的 AI 调用次数(Request)至少浪费了90%!
当碳基生物还在为写文献综述,打开了一百个浏览器窗口时,隔壁AI已经卷起来了。(doge)
5月15日晚,区瀚楠、陈睿轩走进了上海浦东的一栋民宿。 这里没有食物、没有智能手机、没有浏览器、没有APP,只有一台预装AI工具的联网电脑、一部非智能手机、一瓶饮用水和100元生存资金,他们将在这个封闭房间里依靠AI工具生存72小时。
CVPR 2025,自动驾驶传来重大进展: Scaling Law,首次在这条赛道被验证!
AI 角色扮演、AI 情感陪伴……更多 AI 交互方式的出现正在重新定义“社交”。