AI资讯新闻榜单内容搜索-Judge

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Judge
模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分

模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分

模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分

在目前的模型训练范式中,偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中,偏好数据通常被用作对齐(alignment)时的训练优化目标,如基于人类或 AI 反馈的强化学习(RLHF/RLAIF)或者直接偏好优化(DPO),而在模型评估中,由于任务的复杂性且通常没有标准答案,则通常直接以人类标注者或高性能大模型(LLM-as-a-Judge)的偏好标注作为评判标准。

来自主题: AI技术研报
11380 点击    2024-03-02 14:58
无需准确关键词和手动整理,瑞士信息与通信科技公司DeepJudge开发AI驱动的法律文本智能搜索工具|瑞士创新100强

无需准确关键词和手动整理,瑞士信息与通信科技公司DeepJudge开发AI驱动的法律文本智能搜索工具|瑞士创新100强

无需准确关键词和手动整理,瑞士信息与通信科技公司DeepJudge开发AI驱动的法律文本智能搜索工具|瑞士创新100强

瑞士连续12年全球创新指数竞争力排名第一,是全球重要的创新策源地,也是中国首个创新战略伙伴关系国,在创新发展和科技金融领域与中国具有极佳互补性。

来自主题: AI资讯
7511 点击    2023-12-11 10:24