小米大模型提效新框架:训练最高提速34%,推理最高提速52%!Kaldi之父合作出品
小米大模型提效新框架:训练最高提速34%,推理最高提速52%!Kaldi之父合作出品大模型推理速度提升50%以上,还能保证少样本学习性能!
搜索
大模型推理速度提升50%以上,还能保证少样本学习性能!
方向完全搞错了?
是时候把数据Scale Down了!Llama 3揭示了这个可怕的事实:数据量从2T增加到15T,就能大力出奇迹,所以要想要有GPT-3到GPT-4的提升,下一代模型至少还要150T的数据。好在,最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了,但你有卡吗?
不用打标签,也能解决视觉大模型的偏好对齐问题了。
入选CVPR 2024 Highlight的三维语义高斯泼溅最新成果,查询速度比之前的SOTA方法LERF快了199倍!
何恺明入职MIT副教授后,首次带队的新作来了!
3D场景理解让人形机器人「看得见」周身场景,使汽车自动驾驶功能能够实时感知行驶过程中可能出现的情形,从而做出更加智能化的行为和反应。而这一切需要大量3D场景的详细标注,从而急剧提升时间成本和资源投入。
如何判断一个AI模型是否属于开源阵营?开源or闭源,到底哪种系统才更安全?最近,两位荷兰学者发表的一篇ACM FAccT论文给出了富有卓见的回答。
中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜!
自 ChatGPT 发布以来,大型语言模型(LLM)已经成为推动人工智能发展的关键技术。