AI资讯新闻榜单内容搜索-GPT-3

OpenAI突发新模型，GPT-3.5退役，大模型成本2年骤降99%

来自主题: AI资讯

5546 点击 2024-07-19 10:40

如何将 LLM 的上下文扩展至百万级？

在2023年初，即便是当时最先进的GPT-3.5，其上下文长度也仅限于2k。然而，时至今日，1M的上下文长度已经成为衡量模型技术先进性的重要标志之一。

来自主题: AI技术研报

5484 点击 2024-07-19 10:14

ACL 2024 | 对25个开闭源模型数学评测，GPT-3.5-Turbo才勉强及格

大型语言模型（LLMs）在解决问题方面的非凡能力日益显现。最近，一个值得关注的现象是，这些模型在多项数学推理的基准测试中获得了惊人的成绩。以 GPT-4 为例，在高难度小学应用题测试集 GSM8K [1] 中表现优异，准确率高达 90% 以上。同时，许多开源模型也展现出了不俗的实力，准确率超过 80%。

来自主题: AI资讯

7856 点击 2024-07-18 16:57

成立1年估值超100亿、红杉软银争投，这家人形机器人公司做对了什么？

机器人行业的「GPT-3」时刻已经出现？

来自主题: AI资讯

10015 点击 2024-07-16 20:16

机器人大模型新公司，数据规模比同行大1000倍，贝索斯、孙正义等押注

GPT-3 时刻正在进入机器人世界。

来自主题: AI资讯

10286 点击 2024-07-13 12:56

少即是多！10亿参数「小巨人」击败ChatGPT

只有10亿参数的xLAM-1B在特定任务中击败了LLM霸主：OpenAI的GPT-3.5 Turbo和Anthropic的Claude-3 Haiku。上个月刚发布的苹果智能模型只有30亿参数，就连奥特曼都表示，我们正处于大模型时代的末期。那么，小语言模型（SLM）会是AI的未来吗？

来自主题: AI技术研报

7320 点击 2024-07-04 16:25

240万亿巨量数据被洗出，足够训出18个GPT-4！全球23所机构联手，清洗秘籍公开

是时候把数据Scale Down了！Llama 3揭示了这个可怕的事实：数据量从2T增加到15T，就能大力出奇迹，所以要想要有GPT-3到GPT-4的提升，下一代模型至少还要150T的数据。好在，最近有团队从CommonCrawl里洗出了240T数据——现在数据已经不缺了，但你有卡吗？

来自主题: AI技术研报

8985 点击 2024-06-24 15:25

大模型压缩量化方案怎么选？无问芯穹Qllm-Eval量化方案全面评估：多模型、多参数、多维度

基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能，但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数，采用FP16存储，模型大小约为350GB，而即使是英伟达最新的B200 GPU 内存也只有192GB ，更不用说其他GPU和边缘设备。

来自主题: AI技术研报

9531 点击 2024-06-19 23:30

苹果智能背后模型公布：3B模型优于Gemma-7B，服务器模型媲美GPT-3.5-Turbo

在刚刚结束的全球开发者大会上，苹果宣布了 Apple intelligence，这是一款深度集成于 iOS 18、iPadOS 18 和 macOS Sequoia 的全新个性化智能系统。

来自主题: AI技术研报

5269 点击 2024-06-13 10:01

用GPT-3.5生成数据集！北大天工等团队图像编辑新SOTA，可精准模拟物理世界场景

高质量图像编辑的方法有很多，但都很难准确表达出真实的物理世界。那么，Edit the World试试。

来自主题: AI技术研报

8972 点击 2024-05-30 10:48