AI资讯新闻榜单内容搜索-LLama

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLama

Meta陷入恐慌？内部爆料：在疯狂分析复制DeepSeek，高预算难以解释

Meta陷入恐慌？内部爆料：在疯狂分析复制DeepSeek，高预算难以解释

Meta陷入恐慌？内部爆料：在疯狂分析复制DeepSeek，高预算难以解释

「工程师正在疯狂地分析 DeepSeek，试图从中复制任何可能的东西。」DeepSeek 开源大模型的阳谋，切切实实震撼着美国 AI 公司。最先陷入恐慌的，似乎是同样推崇开源的 Meta。

来自主题: AI资讯

7653 点击 2025-01-24 10:59

Atom Capital：中美AI最前沿——创投新趋势、中美竞争与初创企业出海战略

Atom Capital：中美AI最前沿——创投新趋势、中美竞争与初创企业出海战略

Atom Capital：中美AI最前沿——创投新趋势、中美竞争与初创企业出海战略

2024又是AI精彩纷呈的一年。LLM不再是AI舞台上唯一的主角。随着预训练技术遭遇瓶颈，GPT-5迟迟未能问世，从业者开始从不同角度寻找突破。以o1为标志，大模型正式迈入“Post-Training”时代；开源发展迅猛，Llama 3.1首次击败闭源模型；中国本土大模型DeepSeek V3，在GPT-4o发布仅7个月后，用 1/10算力实现了几乎同等水平。

来自主题: AI资讯

9294 点击 2025-01-19 10:38

一行代码Post-Train任意长序列！360智脑开源360-LLaMA-Factory

一行代码Post-Train任意长序列！360智脑开源360-LLaMA-Factory

一行代码Post-Train任意长序列！360智脑开源360-LLaMA-Factory

大模型长序列的处理能力已越来越重要，像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式，需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。

来自主题: AI技术研报

8844 点击 2025-01-11 13:45

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

因为 V3 版本开源模型的发布，DeepSeek 又火了一把，而且这一次，是外网刷屏。训练成本估计只有 Llama 3.1 405B 模型的 11 分之一，后者的效果还不如它。

来自主题: AI资讯

7814 点击 2025-01-09 09:31

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

全网都在扒的DeepSeek团队，是清北应届生撑起一片天

DeepSeek-v3大模型横空出世，以1/11算力训练出超过Llama 3的开源模型，震撼了整个AI圈。

来自主题: AI资讯

9251 点击 2025-01-04 15:15

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

26年前老年机跑Llama2，每秒39个token：你的AI PC，也可以是Windows 98

让 Llama 2 在 Windows 98 奔腾 2（Pentium II）机器上运行，不但成功了，输出达到 39.31 tok / 秒。

来自主题: AI资讯

8829 点击 2024-12-30 15:15

传统PC巨头IBM发布了最新的Granite3.1模型，跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

传统PC巨头IBM发布了最新的Granite3.1模型，跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

传统PC巨头IBM发布了最新的Granite3.1模型，跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

IBM 正式发布了其新一代开源大语言模型 Granite 3.1，这是一组轻量级、先进的开源基础模型，支持多语言、代码生成、推理和工具使用，能够在有限的计算资源上运行。这一系列模型具备 128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。

来自主题: AI资讯

10055 点击 2024-12-25 09:57

LangChain《2024人工智能全景报告出炉》：OpenAI依旧是龙头开源模型采用率上升（附PDF版）

LangChain《2024人工智能全景报告出炉》：OpenAI依旧是龙头开源模型采用率上升（附PDF版）

LangChain《2024人工智能全景报告出炉》：OpenAI依旧是龙头开源模型采用率上升（附PDF版）

OpenAI在LangSmith用户群中继续稳居最常使用的大语言模型供应商宝座，其使用率是排名第二的Ollama的六倍以上。开源模型的采用率有了显著增长，特别是Ollama和Groq两家公司，它们支持用户运行开源模型，并在今年成功跻身行业前五。

来自主题: AI资讯

10422 点击 2024-12-23 21:12

开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law

开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law

开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law

o1完整版公开仅10天，Scaling Law新范式就被逆向工程复现了！

来自主题: AI技术研报

6250 点击 2024-12-17 17:12

大模型 | 关于Google Gemini，您需要了解的一切

大模型 | 关于Google Gemini，您需要了解的一切

大模型 | 关于Google Gemini，您需要了解的一切

谷歌正借助其旗舰产品——Gemini系列（涵盖一系列前沿的生成式人工智能模型、应用及服务）引领行业潮流。那么，Gemini究竟为何物？您该如何充分利用它？相较于OpenAI的ChatGPT、Meta的Llama以及微软的Copilot等其他生成式AI工具，Gemini又表现如何呢？

来自主题: AI资讯

13524 点击 2024-12-15 10:23

上一页当前第8页,共40页下一页