AI资讯新闻榜单内容搜索-数据

手把手教你预训练一个小型 LLM｜Steel-LLM 的实战经验

随着开源数据的日益丰富以及算力价格的持续下降，对于个人或小型机构而言，预训练一个小型的 LLM 已逐渐成为可能。开源中文预训练语言模型 Steel - LLM 就是一个典型案例，其模型参数量与数据量并非十分庞大，基本处于参数量为 B 级别、数据量为 T 级别的规模。

来自主题: AI技术研报

8998 点击 2024-11-22 09:44

2024 年融资超过 1 亿美元的美国 AI 公司名单！46家！

据全球知名创投研究机构 CB Insights 发布的统计数据显示，2024 年第三季度，接近 1/3（31%）的风险投资流入了 AI 初创企业。另根据 Crunchbase 的数据，AI 公司在 2024 年第三季度筹集了 190 亿美元，占所有风险投资的 28%。2024 年第三季度还完成了有史以来最大的风险投资交易：OpenAI 募集了 66 亿美元的巨额资金。

来自主题: AI资讯

12715 点击 2024-11-21 22:43

让模型预见数据分布变化，东京大学等提出时态域泛化全新框架

在数据分布持续变化的动态环境中，如何进行连续模型泛化？

来自主题: AI技术研报

10725 点击 2024-11-21 14:02

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你「LLM+外部数据」的正确使用姿势

论文提出了一种RAG任务分类法，将用户查询分为四个级别，并讨论了将外部数据集成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。

来自主题: AI技术研报

9361 点击 2024-11-21 13:39

T-Rex Label ！超震撼 AI 自动标注工具，开箱即用、检测一切

“赛博螺丝工”解放双手的时刻来了！

来自主题: AI技术研报

10108 点击 2024-11-21 10:00

多样任务真实数据，大模型在线购物基准Shopping MMLU开源｜NeurIPS&KDD Cup 2024

谁是在线购物领域最强大模型？也有评测基准了。

来自主题: AI技术研报

4960 点击 2024-11-20 15:09

媲美OpenAI事实性基准，这个中文评测集让o1-preview刚刚及格

如何解决模型生成幻觉一直是人工智能（AI）领域的一个悬而未解的问题。为了测量语言模型的事实正确性，近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型事实正确性这一领域，目前该领域存在数据过时、评测不准和覆盖不全等问题。例如现在大家广泛使用的知识评测集还是 CommonSenseQA、CMMLU 和 C-Eval 等选择题形式的评测集。

来自主题: AI技术研报

10247 点击 2024-11-20 15:02