AI TNT— 让一部分先用AI实现商业化

Mistral AI两款全新7B模型宣战OpenAI，对标更长的代码分析和更高效的数学推理。

来自主题: AI资讯

3997 点击 2024-07-19 10:37

最近，7B小模型又成为了AI巨头们竞相追赶的潮流。继谷歌的Gemma2 7B后，Mistral今天又发布了两个7B模型，分别是针对STEM学科的Mathstral，以及使用Mamaba架构的代码模型Codestral Mamba。

来自主题: AI技术研报

8088 点击 2024-07-17 19:53

Meta首席人工智能科学家、深度学习之父Yann LeCun又开喷了。

来自主题: AI技术研报

6819 点击 2024-07-09 17:35

硅谷圈又双叒叕要地震了？

来自主题: AI资讯

9061 点击 2024-07-04 12:42

排名超过Llama-3-70B，英伟达Nemotron-4 340B问鼎竞技场最强开源模型！

来自主题: AI资讯

7854 点击 2024-06-20 10:02

在刚刚结束的全球开发者大会上，苹果宣布了 Apple intelligence，这是一款深度集成于 iOS 18、iPadOS 18 和 macOS Sequoia 的全新个性化智能系统。

来自主题: AI技术研报

3823 点击 2024-06-13 10:01

大模型执行图推理任务，我们是希望大模型仅仅给出结果，还是在给出准确答案的同时，输出详细的推理过程？

来自主题: AI技术研报

8065 点击 2024-06-11 16:09

大型语言模型（LLM）的一个主要特点是「大」，也因此其训练和部署成本都相当高，如何在保证 LLM 准确度的同时让其变小就成了非常重要且有价值的研究课题。

来自主题: AI技术研报

8054 点击 2024-06-11 10:06

一夜之间，全球最强开源模型再次易主。万众瞩目的Qwen2-72B一出世，火速杀进开源LLM排行榜第一，美国最强开源模型Llama3-70B直接被碾压！全球开发者粉丝狂欢：果然没白等。

来自主题: AI技术研报

8051 点击 2024-06-08 11:44

终于，AI大神李沐回来了！带着他的大模型创业最新成果——

来自主题: AI资讯

7806 点击 2024-06-06 17:40