港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!作者亲自解读在此
港大北航等1bit大模型引热议,IEEE刊物评“解决AI能源需求”!作者亲自解读在此极限量化,把每个参数占用空间压缩到1.1bit!
极限量化,把每个参数占用空间压缩到1.1bit!
使用大模型合成的数据,就能显著提升3D生成能力?
AI人才争夺战激烈,顶尖人才薪资激增。
阿里云发布最强开源大模型Qwen2,干翻Llama 3,比闭源模型还强。
神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
近日,由重庆市人力资源和社会保障局、重庆市人力资源开发服务中心开展的“AI工具与现代化办公”专题系列培训在中国·重庆人力资源服务产业园举行,培训旨在助推日常工作与AI工具有效融合,满足广大干部职工在新时代下现代化办公的实际需求,共有来自全市各级机关、企事业单位的200余名学员参加培训。
6 月 6 日下午,奇绩创坛在北京中关村举办了 2024 年春季创业营路演日,共有 53 家奇绩加速的公司参与了路演。
上周末在推特平台上有一篇写在谷歌文档里短文,在国外的科技/投资圈得到了非常广泛的浏览,叫做 The End of Software ( 软件的终结 ), 作者 Chris Paik 是位于纽约市的风险投资基金 Pace Capital 的创始合伙人,他之前同样在谷歌文档里总结的自己的投资框架也得到广泛的阅读。
24点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研究者最近提出了一种全新的BoT方法,用思维模板大幅增强了推理性能。而Llama3-8B在BoT的加持下,竟多次超越Llama3-70B!
DeepMind发表了一篇名为「To Believe or Not to Believe Your LLM」的新论文,探讨了LLM的不确定性量化问题,通过「迭代提示」成功将LLM的认知不确定性和偶然不确定性解耦。研究还将新推导出的幻觉检测算法应用于Gemini,结果表明,与基线方法相比,该方法能有效检测幻觉。