AI资讯新闻榜单内容搜索-ATI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: ATI
如何从头开始编写LoRA代码,这有一份教程

如何从头开始编写LoRA代码,这有一份教程

如何从头开始编写LoRA代码,这有一份教程

作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大语言模型)的流行技术,最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。

来自主题: AI技术研报
6787 点击    2024-03-20 16:16
澜舟坚持四两拨千斤:ToB场景落地,10B参数大模型足矣

澜舟坚持四两拨千斤:ToB场景落地,10B参数大模型足矣

澜舟坚持四两拨千斤:ToB场景落地,10B参数大模型足矣

专注、极致、口碑、快、成本。 这是澜舟科技创始人兼CEO周明给出的“大模型落地九字法则”,是他在雷军互联网“七字诀”的基础上,加上了“成本”一词而来。

来自主题: AI资讯
3954 点击    2024-03-19 22:03
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

早在 2020 年,陶大程团队就发布了《Knowledge Distillation: A Survey》,详细介绍了知识蒸馏在深度学习中的应用,主要用于模型压缩和加速。随着大语言模型的出现,知识蒸馏的作用范围不断扩大,逐渐扩展到了用于提升小模型的性能以及模型的自我提升。

来自主题: AI技术研报
4573 点击    2024-03-16 15:28
OpenAI再陷巨大争议?Sora训练数据被质疑非法,CTO采访疯狂翻车

OpenAI再陷巨大争议?Sora训练数据被质疑非法,CTO采访疯狂翻车

OpenAI再陷巨大争议?Sora训练数据被质疑非法,CTO采访疯狂翻车

最近,OpenAI CTO Murati接受采访时,对Sora训练数据语焉不详、支支吾吾的表现,已经成了全网热议的话题。毕竟,要是一个处理不好,OpenAI就又要陷入巨额赔偿金的诉讼之中了。

来自主题: AI资讯
1905 点击    2024-03-16 15:18
OpenAI CTO:普通人数月后就能用Sora了

OpenAI CTO:普通人数月后就能用Sora了

OpenAI CTO:普通人数月后就能用Sora了

当地时间3月13日周三,OpenAI首席技术官米拉·穆拉蒂(Mira Murati)接受了《华盛顿邮报》的视频专访。

来自主题: AI资讯
7652 点击    2024-03-14 16:30
陶哲轩预测再成真!AI做出椭圆曲线难题重大发现,华人数学家接近千禧年大奖

陶哲轩预测再成真!AI做出椭圆曲线难题重大发现,华人数学家接近千禧年大奖

陶哲轩预测再成真!AI做出椭圆曲线难题重大发现,华人数学家接近千禧年大奖

最近的数学圈,都被椭圆曲线的murmuration(椋鸟群飞)现象震惊了。由经验不足的本科生无意中做出的这个成果,竟让一位华人数学家离「千禧年问题」更近了一步。而且这次数学难题的破解,是由AI来完成的!

来自主题: AI资讯
6673 点击    2024-03-11 17:49
人大系初创与OpenAI三次“撞车”:类Sora架构一年前已发论文

人大系初创与OpenAI三次“撞车”:类Sora架构一年前已发论文

人大系初创与OpenAI三次“撞车”:类Sora架构一年前已发论文

Sora出世前,他们拿着一篇如今被ICLR 2024接收的论文,十分费劲地为投资人、求知者讲了大半年,却处处碰壁。

来自主题: AI资讯
6002 点击    2024-03-07 14:05
GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况

GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况

GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况

推测解码(Speculative Decoding)是谷歌等机构在 2022 年发现的大模型推理加速方法。它可以在不损失生成效果前提下,获得 3 倍以上的加速比。GPT-4 泄密报告也提到 OpenAI 线上模型推理使用了它。

来自主题: AI技术研报
7390 点击    2024-02-20 17:22
让视觉语言模型搞空间推理,谷歌又整新活了

让视觉语言模型搞空间推理,谷歌又整新活了

让视觉语言模型搞空间推理,谷歌又整新活了

视觉语言模型虽然强大,但缺乏空间推理能力,最近 Google 的新论文说它的 SpatialVLM 可以做,看看他们是怎么做的。

来自主题: AI技术研报
8123 点击    2024-02-18 15:10