AI资讯新闻榜单内容搜索-大模型

文生视频大模型，短视频的过弯点？

这次，快手又先字节一步。

来自主题: AI资讯

7481 点击 2024-07-30 12:08

LLaMA3：开源战胜闭源意味着什么？

LLaMA3-405B的模型效果已经赶上目前最好的闭源模型GPT-4o和Claude-3.5，这可能是未来大模型开源与闭源的拐点，这里就LLaMA3的模型结构、训练过程与未来影响等方面说说我的看法。

来自主题: AI技术研报

9950 点击 2024-07-30 12:03

“浙大系”杀入多模态

开发和应用大语言模型的杭州波形智能，正式杀入多模态领域。

来自主题: AI资讯

9930 点击 2024-07-30 10:59

ICML直击丨包揽最佳论文、现场发offer抢人…学术顶会变成了“大厂”顶会

7月27日，与ICLR（国际学习表示会议）、NeurIPS（神经信息处理系统会议）并称三大机器学习顶级会议的ICML（国际机器学习大会），在奥地利维也纳会展中心落下帷幕。

来自主题: AI技术研报

10933 点击 2024-07-29 20:35

关于大模型「越狱」的多种方式，有这些防御手段

随着人工智能（AI）技术的迅猛发展，特别是大语言模型（LLMs）如 GPT-4 和视觉语言模型（VLMs）如 CLIP 和 DALL-E，这些模型在多个技术领域取得了显著的进展。

来自主题: AI技术研报

11660 点击 2024-07-29 20:32

1890美元，就能从头训练一个还不错的12亿参数扩散模型

只用1890美元、3700 万张图像，就能训练一个还不错的扩散模型。

来自主题: AI技术研报

9975 点击 2024-07-29 20:28

日均tokens使用量超5000亿，AI生图玩法猛猛上新：豆包大模型为什么越来越「香」了？

2024 年的 AI 图像生成技术，又提升到了一个新高度。

来自主题: AI资讯

11625 点击 2024-07-29 20:26

GPT-4o mini凭什么登顶竞技场？OpenAI刷分秘诀被扒，原来奥特曼早有暗示

为啥GPT-4o mini能登顶大模型竞技场？？

来自主题: AI资讯

10553 点击 2024-07-29 19:47

上海交通大学温颖教授：打造“通才”Agent｜Agent Insights

解决问题：语言智能体的动作通常由 Token（令牌，语言模型中表示单词/短语/汉字的最小符号单元）序列组成，直接将强化学习用于语言智能体进行策略优化的过程中，一般需要预定义可行动作集合，同时忽略了动作内 Token 细粒度信用分配问题，团队将 Agent 优化从动作层分解到 Token 层，为每个动作内 Token 提供更精细的监督，可在语言动作空间不受约束的环境中实现可控优化复杂度

来自主题: AI资讯

3804 点击 2024-07-29 17:50

更小更强大的 GPT-4o mini 背后，AI 模型的未来不再是越大越好

不是大模型用不起，而是小模型更有性价比。

来自主题: AI资讯

6187 点击 2024-07-29 17:42