AI资讯新闻榜单内容搜索-8

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 8
陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替

陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替

陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替

比斯坦福DPO(直接偏好优化)更简单的RLHF平替来了,来自陈丹琦团队。 该方式在多项测试中性能都远超DPO,还能让8B模型战胜Claude 3的超大杯Opus。 而且与DPO相比,训练时间和GPU消耗也都大幅减少。

来自主题: AI资讯
8844 点击    2024-05-27 16:39
全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型

全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型

全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型

为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方面,一种有效的方法是根据人类反馈的强化学习(RLHF)。尽管经典 RLHF 方法的结果很出色,但其多阶段的过程依然带来了一些优化难题,其中涉及到训练一个奖励模型,然后优化一个策略模型来最大化该奖励。

来自主题: AI技术研报
9924 点击    2024-05-26 13:45
估值飙至138亿美元!27岁华裔天才少年再获融资,数据标注会是下一个风口?

估值飙至138亿美元!27岁华裔天才少年再获融资,数据标注会是下一个风口?

估值飙至138亿美元!27岁华裔天才少年再获融资,数据标注会是下一个风口?

Alexandr Wang创办的Scale AI是一个为AI模型提供训练数据的数据标注平台,近期完成新一轮10亿美元融资,估值飙升至138亿美元。该公司表示将利用新资金生产丰富的前沿数据,为通向AGI铺平道路。

来自主题: AI资讯
9995 点击    2024-05-26 12:05
89岁计算机架构先驱、超算软件之父戈登·贝尔逝世!ACM奖项以他命名

89岁计算机架构先驱、超算软件之父戈登·贝尔逝世!ACM奖项以他命名

89岁计算机架构先驱、超算软件之父戈登·贝尔逝世!ACM奖项以他命名

个人电脑原型的创造者、数字时代的「建筑师」Gordon Bell逝世,他曾提出过计算机系统领域的Bell定律,当选为美国国家工程院院士和科学院院士,获得过IEEE约翰·冯·诺依曼奖章,ACM在并行计算领域的Gordon Bell Prize就是由他赞助成立的。

来自主题: AI资讯
9447 点击    2024-05-26 12:01
鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好

鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好

鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好

鹅厂搞了个150多人的“翻译公司”,从老板到员工都是AI智能体! 主营业务是翻译网络小说,质量极高,参与评价的读者认为比真人翻译得还要好。 而且相比于雇佣真人,用它来翻译文学作品,成本降低了近80倍。

来自主题: AI技术研报
10305 点击    2024-05-25 18:41
只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

只需单卡RTX 3090,低比特量化训练就能实现LLaMA-3 8B全参微调

本文由GreenBit.AI团队撰写,团队的核心成员来自德国哈索·普拉特纳计算机系统工程院开源技术小组。我们致力于推动开源社区的发展,倡导可持续的机器学习理念。我们的目标是通过提供更具成本效益的解决方案,使人工智能技术在环境和社会层面产生积极影响。

来自主题: AI技术研报
8350 点击    2024-05-25 18:15
果然,美国限制AI出口立法的进程又进一步

果然,美国限制AI出口立法的进程又进一步

果然,美国限制AI出口立法的进程又进一步

当地时间2024年5月22日,美国众议院外交事务委员会以压倒性多数,通过了一项限制AI模型出口的法案——《加强海外关键出口限制国家框架法案》(Enhancing National Frameworks for Overseas Critical Exports Act / HR 8315,以下简称ENFORCE法案),旨在扩大美国政府监管人工智能系统出口的权力。

来自主题: AI资讯
2431 点击    2024-05-25 10:49
从80个模型中构建Scaling Law:华人博士生新作,思维链提出者力荐

从80个模型中构建Scaling Law:华人博士生新作,思维链提出者力荐

从80个模型中构建Scaling Law:华人博士生新作,思维链提出者力荐

在 AI 领域,扩展定律(Scaling laws)是理解 LM 扩展趋势的强大工具,其为广大研究者提供了一个准则,该定律在理解语言模型的性能如何随规模变化提供了一个重要指导。

来自主题: AI技术研报
4748 点击    2024-05-24 20:52
利润暴涨628%,AI霸主英伟达全产业链投资图鉴|智氪

利润暴涨628%,AI霸主英伟达全产业链投资图鉴|智氪

利润暴涨628%,AI霸主英伟达全产业链投资图鉴|智氪

5月22日,全球资本市场的“大网红”英伟达发布了2025财年第一财季(截至2024年4月28日)的报告。

来自主题: AI技术研报
5173 点击    2024-05-24 12:43