AI资讯新闻榜单内容搜索-开源模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 开源模型
MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

开源模型上下文窗口卷到超长,达400万token! 刚刚,“大模型六小强”之一MiniMax开源最新模型—— MiniMax-01系列,包含两个模型:基础语言模型MiniMax-Text-01、视觉多模态模型MiniMax-VL-01。

来自主题: AI技术研报
7184 点击    2025-01-15 15:10
让模型部署像调用API一样简单!1小时轻松完成超100个微调模型部署的神器来了,按量计费每月立省10万

让模型部署像调用API一样简单!1小时轻松完成超100个微调模型部署的神器来了,按量计费每月立省10万

让模型部署像调用API一样简单!1小时轻松完成超100个微调模型部署的神器来了,按量计费每月立省10万

大家可能看到过很多类似的结论:针对特定任务,对开源模型进行 LoRA 微调可以干翻 GPT-4 这类闭源模型。

来自主题: AI资讯
7200 点击    2025-01-09 09:37
DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿

DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿

DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿

因为 V3 版本开源模型的发布,DeepSeek 又火了一把,而且这一次,是外网刷屏。 训练成本估计只有 Llama 3.1 405B 模型的 11 分之一,后者的效果还不如它。

来自主题: AI资讯
7039 点击    2025-01-09 09:31
全网都在扒的DeepSeek团队,是清北应届生撑起一片天

全网都在扒的DeepSeek团队,是清北应届生撑起一片天

全网都在扒的DeepSeek团队,是清北应届生撑起一片天

DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama 3的开源模型,震撼了整个AI圈。

来自主题: AI资讯
8290 点击    2025-01-04 15:15
DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet对比实测来了

国产之光DeepSeek V3竞技场排名新鲜出炉—— 优于o1-mini(总榜第7),获最强开源模型认证(也是唯一闯入前10的开源模型)。

来自主题: AI资讯
6524 点击    2024-12-31 14:49
又是来自浙大,“大模型届的拼多多”要刺破英伟达泡沫?

又是来自浙大,“大模型届的拼多多”要刺破英伟达泡沫?

又是来自浙大,“大模型届的拼多多”要刺破英伟达泡沫?

一个来自中国的开源模型,让整个AI圈再次惊呼“来自东方的神秘力量”。 昨天,国内知名大模型创业公司“深度求索”通过官方公众号宣布上线并同步开源 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。

来自主题: AI资讯
7196 点击    2024-12-29 10:50
大家都说通义大模型好,究竟好在哪?

大家都说通义大模型好,究竟好在哪?

大家都说通义大模型好,究竟好在哪?

都说国产大模型“通义千问”能打,到底是真强还是智商税?今天就带你看看,这个国产“AI猛将”凭什么火出圈! 2023年4月,阿里巴巴推出通义千问,选择了“全开源”的策略,成为全球开发者关注的焦点。而在2024年的云栖大会上,阿里云进一步发布了Qwen2.5系列,包括多个尺寸的大语言模型、多模态模型、数学模型和代码模型,涵盖从0.5B到72B的完整规模

来自主题: AI资讯
7942 点击    2024-12-25 08:52
LangChain《2024人工智能全景报告出炉》:OpenAI依旧是龙头 开源模型采用率上升(附PDF版)

LangChain《2024人工智能全景报告出炉》:OpenAI依旧是龙头 开源模型采用率上升(附PDF版)

LangChain《2024人工智能全景报告出炉》:OpenAI依旧是龙头 开源模型采用率上升(附PDF版)

OpenAI在LangSmith用户群中继续稳居最常使用的大语言模型供应商宝座,其使用率是排名第二的Ollama的六倍以上。开源模型的采用率有了显著增长,特别是Ollama和Groq两家公司,它们支持用户运行开源模型,并在今年成功跻身行业前五。

来自主题: AI资讯
8762 点击    2024-12-23 21:12