苹果为什么要用「小模型」?
苹果为什么要用「小模型」?WWDC 2024上,苹果推出了Apple Intelligence,向大家展示了如何开发、训练出功能强大、快速且节能的模型,如何根据特定用户需求进行微调,以及如何评估模型的性能。
WWDC 2024上,苹果推出了Apple Intelligence,向大家展示了如何开发、训练出功能强大、快速且节能的模型,如何根据特定用户需求进行微调,以及如何评估模型的性能。
当前大语言模型(LLM)的评估方法受到数据污染问题的影响,导致评估结果被高估,无法准确反映模型的真实能力。北京大学等提出的KIEval框架,通过知识基础的交互式评估,克服了数据污染的影响,更全面地评估了模型在知识理解和应用方面的能力。
姚班大神陈立杰最新去向现已明朗:2025年秋季起,任加州大学伯克利分校EECS助理教授。
文生图也有自己的prompt优化工具了。
只要把推理和感知能力拆分,2B大模型就能战胜20B?!
两年一届的ECCV录用结果终于揭晓了!刚刚,ECCV组委会公布了录用论文名单,共有2395篇论文被录用。
中国的大模型已经在春天了。
提前近20年预测到AGI发展现状的Ray Kurzweil又出续作《奇点更近了》,押注2045年迎来人类智能扩展百万倍新「奇点」。
导读:时隔4个月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上,以27B的参数击败了许多更大规模的模型,甚至超过了70B的Llama-3-Instruct,成为开源模型的性能第一!
2024年中关村仿生机器人大赛,今日正式启动!无论是人形仿生机器人、具身大模型、多足仿生机器人,甚至只是仿生灵巧手,统统可以报名了。评委由两院院士坐镇,奖金池更是高达255万!这两位正撸猫和原地弹跳的选手,已经是摩拳擦掌了。