AI资讯新闻榜单内容搜索-Llama

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Llama
曝DeepSeek让Llama4未发布已落后!小扎坐不住了:2025预算4000亿起步,年底AI算力将达130万卡

曝DeepSeek让Llama4未发布已落后!小扎坐不住了:2025预算4000亿起步,年底AI算力将达130万卡

曝DeepSeek让Llama4未发布已落后!小扎坐不住了:2025预算4000亿起步,年底AI算力将达130万卡

Meta这次真的坐不住了,计划在AI上继续加码!匿名员工爆料,黑马DeepSeek的出现,让Llama 4还未发布就已经落后,Meta慌了。

来自主题: AI资讯
6585 点击    2025-01-26 00:01
Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释

「工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。」DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。最先陷入恐慌的,似乎是同样推崇开源的 Meta。

来自主题: AI资讯
6558 点击    2025-01-24 10:59
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory

大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。

来自主题: AI技术研报
7127 点击    2025-01-11 13:45
新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

OpenAI“双12”刚进行到第二天,就把大模型圈搅得好不热闹! 一边是Meta没预告就发布了Llama 3.3,70B版本就能实现以前405B的性能。

来自主题: AI资讯
7170 点击    2024-12-07 15:29
Claude Artifacts的开源实现,Llama3驱动的AI程序员,瞬间做一个软件还能实时渲染。

Claude Artifacts的开源实现,Llama3驱动的AI程序员,瞬间做一个软件还能实时渲染。

Claude Artifacts的开源实现,Llama3驱动的AI程序员,瞬间做一个软件还能实时渲染。

Llamacoder是Claude Artifacts的开源实现。 最大的亮点就是,左侧AI写代码,右侧实时渲染。 之前给大家推荐过一个基于Claude做的,Llamacoder是用了Meta 的 Llama 3.1 405B 作为底层语言模型。

来自主题: AI资讯
5811 点击    2024-12-01 11:55
UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

UC伯克利:给大模型测MBTI,Llama更敢说但GPT-4像理工男

如果给LLM做MBTI,会得到什么结果?UC伯克利的最新研究就发现,不同模型真的有自己独特的性格

来自主题: AI技术研报
6101 点击    2024-11-26 13:59