AI TNT— 让一部分先用AI实现商业化

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

KAN结合Transformer，真有团队搞出了解决扩展缺陷的KAT

KAN结合Transformer，真有团队搞出了解决扩展缺陷的KAT

Transformer 是现代深度学习的基石。传统上，Transformer 依赖多层感知器 (MLP) 层来混合通道之间的信息。

来自主题: AI资讯

3019 点击 2024-09-19 15:16

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

本论文第一作者倪赞林是清华大学自动化系 2022 级直博生，师从黄高副教授，主要研究方向为高效深度学习与图像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等国际会议上发表多篇学术论文。

来自主题: AI技术研报

5482 点击 2024-09-19 11:14

图像AI那么耗算力，问题出在 RGB 格式上？

图像AI那么耗算力，问题出在 RGB 格式上？

最近一直在想一个问题。为什么我们的图像 AI 模型那么耗算力？比如，现在多模态图文理解 AI 模型本地化部署一个节点，动不动就需要十几个 G 的显存资源。

来自主题: AI资讯

1594 点击 2024-09-18 15:49

通过打包 Flash Attention 来提升 Hugging Face 训练效率

通过打包 Flash Attention 来提升 Hugging Face 训练效率

现在，在 Hugging Face 中，使用打包的指令调整示例 (无需填充) 进行训练已与 Flash Attention 2 兼容，这要归功于一个最近的 PR 以及新的 DataCollatorWithFlattening。它可以在保持收敛质量的同时，将训练吞吐量提高多达 2 倍。继续阅读以了解详细信息！

来自主题: AI资讯

2356 点击 2024-09-18 15:44

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

OpenAI o1要跟，怎么跟？这个GitHub项目把解读、博客、相关论文一网打尽

优秀的 GitHub 项目啊！有关 OpenAI ο1 的一切都在这里

来自主题: AI技术研报

5722 点击 2024-09-17 23:19

港大新型图基础模型AnyGraph：挑战Scaling Law，精准建模多样化结构模式和特征空间

港大新型图基础模型AnyGraph：挑战Scaling Law，精准建模多样化结构模式和特征空间

新型图基础模型来了—— AnyGraph，基于图混合专家（MoE）架构，专门为实现图模型跨场景泛化而生。

来自主题: AI资讯

5496 点击 2024-09-17 21:57

o1突发内幕曝光？谷歌8月论文已揭示原理，大模型光有软件不存在护城河

o1突发内幕曝光？谷歌8月论文已揭示原理，大模型光有软件不存在护城河

发布不到1周，OpenAI最强模型o1的护城河已经没有了。

来自主题: AI资讯

7656 点击 2024-09-17 21:49

COLM 24 | 从正确中学习？大模型的自我纠正新视角

COLM 24 | 从正确中学习？大模型的自我纠正新视角

大型语言模型（LLMs）虽然进展很快，很强大，但是它们仍然存在会产生幻觉、生成有害内容和不遵守人类指令等问题。一种流行的解决方案就是基于【自我纠正】，大概就是看自己输出的结果，自己反思一下有没有错，如果有错就自己改正。目前自己纠正还是比较关注于让大模型从错误中进行学习。

来自主题: AI技术研报

7673 点击 2024-09-17 21:26

昂贵LLM的救星？Nature新研究提出新型忆阻器，比Haswell CPU高效460倍

昂贵LLM的救星？Nature新研究提出新型忆阻器，比Haswell CPU高效460倍

前些天，OpenAI 发布了 ο1 系列模型，它那「超越博士水平的」强大推理性能预示着其必将在人们的生产生活中大有作为。但它的使用成本也很高，以至于 OpenAI 不得不限制每位用户的使用量：每位用户每周仅能给 o1-preview 发送 30 条消息，给 o1-mini 发送 50 条消息。

来自主题: AI技术研报

4344 点击 2024-09-17 19:14

ECCV 2024 | 一眼临摹：瞥一眼就能模仿笔迹的AI

ECCV 2024 | 一眼临摹：瞥一眼就能模仿笔迹的AI

来自华南理工大学、新加坡国立大学、昆仑万维以及琶洲实验室的研究者们提出一种新的风格化手写文字生成方法，仅需提供单张参考样本即可临摹用户的书写风格，支持英文，中文和日文三种文字的临摹。

来自主题: AI资讯

9884 点击 2024-09-16 20:40

上一页当前第1页,共66页下一页