AI资讯新闻榜单内容搜索-post-train

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: post-train
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。

来自主题: AI技术研报
8558 点击    2025-01-11 13:45
Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic

Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic

Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic

随着对现有互联网数据的预训练逐渐成熟,研究的探索空间正由预训练转向后期训练(Post-training),OpenAI o1 的发布正彰显了这一点。

来自主题: AI技术研报
5379 点击    2024-10-14 15:46
Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍

Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍

Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍

越来越多研究发现,后训练对模型性能同样重要。Allen AI的机器学习研究员Nathan Lambert最近发表了一篇技术博文,总结了科技巨头们所使用的模型后训练配方。

来自主题: AI技术研报
11426 点击    2024-08-19 14:47