AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献

大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献

大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献

近年来,大模型在人工智能领域掀起了一场革命,各种文本、图像、多模态大模型层出不穷,已经深深地改变了人们的工作和生活方式。

来自主题: AI技术研报
7535 点击    2024-09-04 23:24
Meta:大语言模型可以通过自我批判取得大幅提升!

Meta:大语言模型可以通过自我批判取得大幅提升!

Meta:大语言模型可以通过自我批判取得大幅提升!

论文的审稿模式想必大家都不会陌生,一篇论文除了分配多个评审,最后还将由PC综合评估各位审稿人的reviews撰写meta-review。

来自主题: AI技术研报
7447 点击    2024-09-04 23:07
AI数据告急,大厂盯上廉价年轻人

AI数据告急,大厂盯上廉价年轻人

AI数据告急,大厂盯上廉价年轻人

说好的AI给人类打工呢? 为了拿到新数据、训练AI大模型,字节等互联网大厂正在亲自下场,以单次300元不等的价格招募“AI录音员”,定制语料库。

来自主题: AI资讯
4979 点击    2024-09-04 09:57
34页,超200篇文献,浙江大学最新综述,揭秘大语言模型中知识的利用机制

34页,超200篇文献,浙江大学最新综述,揭秘大语言模型中知识的利用机制

34页,超200篇文献,浙江大学最新综述,揭秘大语言模型中知识的利用机制

ChatGPT的出现引发了一场AI革命,它展示了通过简单对话就能完成各种任务的强大能力,并且将不同的 AI 功能整合到一个统一的平台上。还记得小编第一次使用 ChatGPT 的时候给我带来极大震撼。

来自主题: AI技术研报
7849 点击    2024-09-04 09:25
中国首个通用泛化机器人终于来了!清华校友打造中国版Figure 01,连续泛化丝滑处理多任务

中国首个通用泛化机器人终于来了!清华校友打造中国版Figure 01,连续泛化丝滑处理多任务

中国首个通用泛化机器人终于来了!清华校友打造中国版Figure 01,连续泛化丝滑处理多任务

中国首个拥有真正意义多任务连续泛化具身模型的机器人,诞生了!这个机器人,是真正由模型训练出来的,据了解,截止目前除了Figure 01,国内似乎还没有第二家能做到这种级别的泛化能力,即使被百般刁难,都能完成任务。清华校友下场创业,才4个月就已融资近2亿。

来自主题: AI资讯
8569 点击    2024-09-04 09:00
北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率

北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率

北大李戈团队提出大模型单测生成新方法,显著提升代码测试覆盖率

单元测试是软件开发流程中的一个关键环节,主要用于验证软件中的最小可测试单元,函数或模块是否按预期工作。单元测试的目标是确保每个独立的代码片段都能正确执行其功能,对于提高软件质量和开发效率具有重要意义。

来自主题: AI技术研报
5521 点击    2024-09-03 16:22
KV Cache:图解大模型推理加速方法

KV Cache:图解大模型推理加速方法

KV Cache:图解大模型推理加速方法

KV Cache 是大模型推理性能优化的一个常用技术,该技术可以在不影响任何计算精度的前提下,通过空间换时间的思想,提高推理性能。

来自主题: AI资讯
7578 点击    2024-09-03 10:46
MoE再下一城!港大提出AnyGraph:首次开启「图大模型」Scaling Law之路

MoE再下一城!港大提出AnyGraph:首次开启「图大模型」Scaling Law之路

MoE再下一城!港大提出AnyGraph:首次开启「图大模型」Scaling Law之路

AnyGraph聚焦于解决图数据的核心难题,跨越多种场景、特征和数据集进行预训练。其采用混合专家模型和特征统一方法处理结构和特征异质性,通过轻量化路由机制和高效设计提升快速适应能力,且在泛化能力上符合Scaling Law。

来自主题: AI技术研报
8479 点击    2024-09-02 16:35
整合 200 多项相关研究,大模型「终生学习」最新综述来了

整合 200 多项相关研究,大模型「终生学习」最新综述来了

整合 200 多项相关研究,大模型「终生学习」最新综述来了

该论文作者均来自于华南理工大学马千里教授团队,所在实验室为机器学习与数据挖掘实验室。论文的三位共同第一作者为博士生郑俊豪、硕士生邱圣洁、硕士生施成明,主要研究方向包括大模型和终生学习等,通讯作者为马千里教授(IEEE/ACM TASLP 副主编)。

来自主题: AI资讯
6207 点击    2024-09-01 15:57
当奖励成为漏洞:从对齐本质出发自动「越狱」大语言模型

当奖励成为漏洞:从对齐本质出发自动「越狱」大语言模型

当奖励成为漏洞:从对齐本质出发自动「越狱」大语言模型

本文第一作者为香港大学博士研究生谢知晖,主要研究兴趣为大模型对齐与强化学习。

来自主题: AI技术研报
5982 点击    2024-08-31 15:09