AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
日本AI研究第一人这样评价Deepseek

日本AI研究第一人这样评价Deepseek

日本AI研究第一人这样评价Deepseek

中国初创企业DeepSeek(深度求索)开发的高性能、低成本生成式AI(人工智能)大规模语言模型(LLM)受到了全世界的关注。日本经济新闻(中文版:日经中文网)就如何评价该公司的最新AI模型、安全性方面的风险、以及对日本企业的影响等问题,采访了日本AI研究领域的第一人、东京大学教授松尾丰。

来自主题: AI资讯
9968 点击    2025-02-17 09:55
别再学那破提示词技巧了!

别再学那破提示词技巧了!

别再学那破提示词技巧了!

一直以来,学术与实际产品的 Prompt 完全脱节,真实场景下,很多产品都聚焦情感陪伴,文案生成等开放任务里。而学术上这些任务没有明确的指标,无法量化也就没办法被比较,于是绝大部分的 Prompt 优化工作都聚焦在“刷榜”,例如怎么提升一个模型的代码/数学能力。我们今天跑的项目叫 SPO,具体什么意思并不重要,重要的是它把之前的所有问题全部解决了。

来自主题: AI资讯
10145 点击    2025-02-17 09:39
Z Tech|对话Lecun和谢赛宁爱徒,00后OpenAI奖学金博士Peter Tong:揭秘多模态大模型的革命突破

Z Tech|对话Lecun和谢赛宁爱徒,00后OpenAI奖学金博士Peter Tong:揭秘多模态大模型的革命突破

Z Tech|对话Lecun和谢赛宁爱徒,00后OpenAI奖学金博士Peter Tong:揭秘多模态大模型的革命突破

近年来,多模态大模型(MLLM)在视觉理解领域突飞猛进,但如何让大语言模型(LLM)低成本掌握视觉生成能力仍是业界难题!

来自主题: AI资讯
6848 点击    2025-02-17 09:37
DeepSeek冲击之下,大模型六小强如何「回应」?

DeepSeek冲击之下,大模型六小强如何「回应」?

DeepSeek冲击之下,大模型六小强如何「回应」?

马上整整1个月了!这一个月以来,全球大模型市场受DeepSeek搅动,无不方寸大乱。中外大厂、初创公司都头好秃,全被追着问:你们对DeepSeek怎么看?DeepSeek出来你们怎么办?

来自主题: AI资讯
7855 点击    2025-02-16 13:50
马斯克:下周一发布比DeepSeek更厉害的AI模型

马斯克:下周一发布比DeepSeek更厉害的AI模型

马斯克:下周一发布比DeepSeek更厉害的AI模型

北京时间2月16日,马斯克宣布,将于太平洋时间周一晚上8点(北京时间2月18日12:00)发布Grok 3大模型,届时将进行现场演示。马斯克称Grok 3有非常强大的推理能力,在测试中的表现超越包括DeepSeek在内的所有已发布的AI大模型模型。5G与6G公众号(ID:angmobile)注意到马斯克表示Grok 3的某些能力之强“让人感到可怕”。

来自主题: AI资讯
9230 点击    2025-02-16 13:23
新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战

新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战

新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战

时隔两年,Sydney又回来了!奥特曼官宣了GPT-4o更新后,网友测试发现,ChatGPT不仅「戏精」附体,甚至能深入人心,让人感动落泪。

来自主题: AI资讯
9703 点击    2025-02-16 13:18
比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

自然语言 token 代表的意思通常是表层的(例如 the 或 a 这样的功能性词汇),需要模型进行大量训练才能获得高级推理和对概念的理解能力,

来自主题: AI技术研报
6183 点击    2025-02-16 13:12
真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中

真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中

真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中

一觉醒来,AI应用的天变了!而且据腾讯回应消息,接入的还是满血版 DeepSeek R1!微信正在灰度测试该模型,部分灰度到的用户可以内测相关的 AI 搜索功能。

来自主题: AI资讯
9267 点击    2025-02-16 11:22
人工智能热潮催生“GPU即服务”

人工智能热潮催生“GPU即服务”

人工智能热潮催生“GPU即服务”

利用闲置算力满足 AI 初创企业的需求。由于对运行 AI 模型的需求激增,对算力的需求也随之激增。世界各地的公司都在努力寻求运行更高级 AI 模型所需的 GPU。虽然 GPU 并非运行 AI 模型的唯一选择,但它们已成为首选的硬件,因为它们能够有效地同时处理多项操作,而这是开发深度学习模型时的一个关键特性。

来自主题: AI资讯
7956 点击    2025-02-16 11:13