AI资讯新闻榜单内容搜索-eva

亚马逊云创新「神经稀疏检索」：仅需要文本匹配就能实现语义搜索

自从大模型爆火以来，语义检索也逐渐成为一项热门技术。尤其是在 RAG（retrieval augmented generation）应用中，检索结果的相关性直接决定了 AI 生成的最终效果。

来自主题: AI技术研报

9194 点击 2024-07-01 13:27

大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评估：多模型、多参数、多维度

基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能，但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数，采用FP16存储，模型大小约为350GB，而即使是英伟达最新的B200 GPU 内存也只有192GB ，更不用说其他GPU和边缘设备。

来自主题: AI技术研报

9139 点击 2024-06-19 23:30

最强开源大模型Llama 3来了，4000亿参数狙击GPT-4，训练数据达Llama 2七倍

智东西4月19日消息，Meta推出迄今为止能力最强的开源大模型Llama 3系列，发布8B和70B两个版本。 Llama 3在一众榜单中取得开源SOTA（当前最优效果）。Llama 3 8B在MMLU、GPQA、HumanEval、GSM-8K等多项基准上超过谷歌Gemma 7B和Mistral 7B Instruct。

来自主题: AI技术研报

7797 点击 2024-04-20 12:10

马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4

就在刚刚，马斯克Grok大模型宣布重大升级。

来自主题: AI技术研报

7376 点击 2024-03-30 13:48

阿里大模型春节礼包来了：代码可执行率超GPT-4，1.5版本全系列开源

阿里大模型，再次开源大放送——发布Qwen1.5版本，直接放出六种尺寸。

来自主题: AI资讯

5485 点击 2024-02-06 17:40

实测“超越GPT-4”的百川超千亿参数模型：医疗问答业内最强？

百川智能又对产品进行了一次大更新，发布了Baichuan 3模型。这次更新后，在多个权威通用能力评测CMMLU、GAOKAO和AGI-Eval中，其英文能力已经逼近 GPT-4，在中文任务表现上甚至超越了GPT-4：

来自主题: AI资讯

8139 点击 2024-01-30 11:27

构建企业级 RAG 系统的高级指南 [译]

欢迎再次加入我们的“RAG 系统高级掌握”系列！我们将深入了解构建企业级 RAG (Retrieval-Augmented Generation) 系统的复杂世界。

来自主题: AI技术研报

12583 点击 2024-01-28 12:14

IMF：人工智能将影响全球40%就业，发达国家最受冲击

IMF在报告中写到，人工智能技术将会进一步加剧不同国家之间、不同收入阶层之间的贫富差距。IMF主席克里斯塔利娜·格奥尔基耶娃（Kristalina Georgieva）在文章中表示：“在大多数情况下，人工智能可能会加剧整体不平等。这是一个令人不安的趋势，政策制定者必须积极应对，以防止这项技术进一步加剧社会紧张局势。”

来自主题: AI资讯

5184 点击 2024-01-15 23:59

网红已经开始用AI克隆自己赚钱了

2023 年 5 月中旬，小冰公司在中国和日本市场悄悄启动了一项 “克隆人” 计划。最近，这项计划正式被揭开了面纱。

来自主题: AI资讯

7804 点击 2024-01-12 17:40

一言不合就跑分，国内AI大模型为何沉迷于“刷榜”

商业利益的加入，就必然会驱使AI大模型厂商争先恐后去刷榜了。“不服跑个分”这句话，相信关注手机圈的朋友一定不会感到陌生。诸如安兔兔、GeekBench等理论性能测试软件，由于能够在一定程度上反映手机的性能，因此备受玩家的关注。

来自主题: AI资讯

5763 点击 2023-12-03 15:31