AI技术研报-这里有最前沿的人工智能技术解读

多数据中心训练：OpenAI 击败谷歌 Infra 的大计（两万字精校）

最近，国外的一份研究报告揭秘了 OpenAI、围绕和谷歌在 AI Infra 层的布局，我们将文章提炼出了核心观点，并进行精校翻译。

来自主题: AI技术研报

12592 点击 2024-09-10 11:24

重磅！DeepMind推出首个AI蛋白质设计模型，亲和力提升300倍！

DeepMind又闷声放大招了！

来自主题: AI技术研报

10839 点击 2024-09-09 21:56

分享一波，近期GitHub上有哪些免费的神级AI项目

之前已经分享过一次AI领域GitHub上那些神级项目，大家可以回顾下这篇文章《震撼来袭，盘点GitHub上那些免费的神级AI项目，建议立刻收藏！》。但是AI发展那么迅速，所以今天继续来给大家盘点一下近期在Github上，AI领域又有哪些神级的项目，最后一个特别推荐。

来自主题: AI技术研报

14398 点击 2024-09-09 21:53

上科大团队带来“双子座”模型，AI筛选药物如何实现“集百家之长”？| 上海国际计算生物学创新大赛

基于已有配体来开发新分子，药效会更好吗？

来自主题: AI技术研报

10046 点击 2024-09-09 21:51

智创未来·价值链接，第五届深圳国际人工智能展开幕

本次展会为广大人工智能企业、高校科研机构搭建技术交流、深化产业合作的重要平台，构筑供需对接、场景牵引的产业生态。

来自主题: AI技术研报

11009 点击 2024-09-09 21:16

DeepMind Alpha家族新成员：AlphaProteo蛋白质设计成功率破纪录

在大模型对话框之外，DeepMind 始终坚持做一些独特的工作。

来自主题: AI技术研报

9841 点击 2024-09-07 17:40

突破传统：AI如何应对心电图中的长尾挑战？

近日，上海交通大学、上海人工智能实验室和上海交通大学附属瑞金医院联合团队发布基于异常检测预训练的心电长尾诊断模型。

来自主题: AI技术研报

8826 点击 2024-09-07 17:35

名场面来了，李云龙、徐江、王多鱼同台飙戏，背后是小红书的AI

近日，来自小红书的技术团队 FireRed，提出了基于大语言模型的 FireRedTTS 语音合成系统，并分享了在短视频配音及聊天式语音对话等应用的一些实践。

来自主题: AI技术研报

8150 点击 2024-09-07 17:32

GPT-4结合SAM2：免训练多模态分割的全新解决方案！| 已开源

免训练多模态分割领域有了新突破！

来自主题: AI技术研报

6516 点击 2024-09-07 17:22

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」

提示工程师Riley Goodside小哥，依然在用「Strawberry里有几个r」折磨大模型们，GPT-4o在无限次PUA后，已经被原地逼疯！相比之下，Claude坚决拒绝PUA，是个大聪明。而谷歌最近的论文也揭示了本质原因：LLM没有足够空间，来存储计数向量。

来自主题: AI技术研报

7420 点击 2024-09-07 17:07

谷歌DeepMind祭出蛋白质设计新AI，有望攻克癌症！蛋白亲和力暴增300倍

今天，DeepMind又发布了Alpha模型家族的新成员，堪称是「专精版」的AlphaFold，专注于设计蛋白质结合剂，将大幅减少所需的实验室工作，提升开发效率。

来自主题: AI技术研报

7368 点击 2024-09-07 11:30

PyTorch官宣：告别CUDA，GPU推理迎来Triton加速新时代

用英伟达的GPU，但可以不用CUDA？PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。

来自主题: AI技术研报

6203 点击 2024-09-07 11:26

Nature子刊：AI模型测「大脑年龄」，究竟哪些因素会加速大脑衰老？

Nature子刊新研究「大脑时钟」可以判断一个人的大脑衰老速度是否快于实际年龄。结果显示，女性、不平等现象严重的国家和拉丁美洲国家的人，大脑衰老速度更快。

来自主题: AI技术研报

5947 点击 2024-09-07 11:19

用60%成本干80%的事，DeepSeek分享沉淀多年的高性能深度学习架构

硬件发展速度跟不上 AI 需求，就需要精妙的架构和算法。

来自主题: AI技术研报

7659 点击 2024-09-07 11:08

让大模型能听会说，国内机构开源全球首个端到端语音对话模型Mini-Omni

本文出自启元世界多模态算法组，共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。

来自主题: AI技术研报

10101 点击 2024-09-07 11:04

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

视频理解仍然是计算机视觉和人工智能领域的一个主要挑战。最近在视频理解上的许多进展都是通过端到端地训练多模态大语言模型实现的[1,2,3]。然而，当这些模型处理较长的视频时，内存消耗可能会显著增加，甚至变得难以承受，并且自注意力机制有时可能难以捕捉长程关系 [4]。这些问题阻碍了将端到端模型进一步应用于视频理解。

来自主题: AI技术研报

10133 点击 2024-09-06 11:59

北大领衔，多智能体强化学习研究登上Nature子刊

近日，由北京大学人工智能研究院杨耀东课题组牵头完成的研究成果 ——「大规模多智能体系统的高效强化学习」在人工智能顶级学术期刊 Nature Machine Intelligence 上发表。

来自主题: AI技术研报

9190 点击 2024-09-06 11:55

吴恩达，对 Agentic Workflow 持续兴奋

继吴恩达在今年 4 月红杉 AI 峰会演讲过去之后，Agent > GPT5？吴恩达最新演讲：四种 Agent 设计范式（通俗易懂版）。

来自主题: AI技术研报

8748 点击 2024-09-06 11:48

Tweedie 公式：一个公式统治所有扩散模型！

今天的内容有点烧脑但绝对干货满满！

来自主题: AI技术研报

11183 点击 2024-09-05 22:04

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

训练代码、中间 checkpoint、训练日志和训练数据都已经开源。

来自主题: AI技术研报

10772 点击 2024-09-05 22:02

MemLong: 长文本的新记忆大师，可将上下文长度从4k提升到80k！

这篇文章介绍了一个名为MemLong的模型，它通过使用外部检索器来增强长文本建模的能力。

来自主题: AI技术研报

8751 点击 2024-09-05 16:33

融资1000万美金，最近海外这款AI+视觉工具爆火，旨在将复杂想法可视化

在信息过载的时代，快速而准确地传达信息显得尤为重要。

来自主题: AI技术研报

9543 点击 2024-09-05 15:43

3天把Llama训成Mamba，性能不降，推理更快！

近日，Mamba方面又搞出了有意思的研究：来自康奈尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。

来自主题: AI技术研报

9412 点击 2024-09-05 15:31

Ilya三个月肝出50亿美金独角兽！SSI 10人团队不走OpenAI老路

就在刚刚，Ilya创业新公司SSI完成一笔10亿美元融资。公司仅仅成立3个月，10位成员，如此神速地拿到巨额融资。目前，公司估值高达50亿美金。

来自主题: AI技术研报

9607 点击 2024-09-05 15:26

全球最大，马斯克4个月建成10万张H100超算集群！xAI算力超越OpenAI，奥特曼怕了

两天前，马斯克得意自曝：团队仅用122天，就建成了10万张H100的Colossus集群，未来还会扩展到15万张H100和5万张H200。此消息一出，奥特曼都被吓到了：xAI的算力已经超过OpenAI了，还给员工承诺了价值2亿期权，这是要上天？

来自主题: AI技术研报

8516 点击 2024-09-05 15:20

刚刚，Ilya 新公司融资 10 亿，员工仅 10 人：AGI 成功前，不发布任何产品

Ilya Sutskever新创公司SSI筹资10亿美元。

来自主题: AI技术研报

7673 点击 2024-09-05 15:10

极光发布《AI生产力工具暑期发展报告》夸克新增用户数量领跑行业

报告显示，目前国内生成式AI应用快速发展，预计市场规模有望达到4000亿元。 9月3日，极光旗下月狐数据发布《AI生产力工具暑期发展报告》。数据显示，AI生产力工具在用户侧呈现高速增长态势，总体月活跃用户数量达1.7亿。其中，夸克APP实现暑期新增用户数量行业第一，凭借大模型、数据、场景等优势，让更多用户享受到一站式AI服务。

来自主题: AI技术研报

6417 点击 2024-09-05 09:10

大模型走向物理世界，TeleAI 发布大模型驱动的具身智能综述，覆盖300篇文献

近年来，大模型在人工智能领域掀起了一场革命，各种文本、图像、多模态大模型层出不穷，已经深深地改变了人们的工作和生活方式。

来自主题: AI技术研报

9375 点击 2024-09-04 23:24

Meta：大语言模型可以通过自我批判取得大幅提升！

论文的审稿模式想必大家都不会陌生，一篇论文除了分配多个评审，最后还将由PC综合评估各位审稿人的reviews撰写meta-review。

来自主题: AI技术研报

8330 点击 2024-09-04 23:07

人工智能史上最重磅的19篇论文，系统展示AI如何从象牙塔走进生活！

身边有人说，AI好像是前两年突然火起来的，一下子就成了我们今天熟悉的产品的模样。

来自主题: AI技术研报

8927 点击 2024-09-04 22:40

AI技术研报-这里有最前沿的人工智能技术解读

多数据中心训练：OpenAI 击败谷歌 Infra 的大计（两万字精校）

重磅！DeepMind推出首个AI蛋白质设计模型，亲和力提升300倍！

分享一波，近期GitHub上有哪些免费的神级AI项目

上科大团队带来“双子座”模型，AI筛选药物如何实现“集百家之长”？| 上海国际计算生物学创新大赛

智创未来·价值链接，第五届深圳国际人工智能展开幕

DeepMind Alpha家族新成员：AlphaProteo蛋白质设计成功率破纪录

突破传统：AI如何应对心电图中的长尾挑战？

名场面来了，李云龙、徐江、王多鱼同台飙戏，背后是小红书的AI

GPT-4结合SAM2：免训练多模态分割的全新解决方案！| 已开源

GPT-4o不会数r，被外国小哥原地逼疯！ 谷歌论文揭秘Transformer「数不到n」

谷歌DeepMind祭出蛋白质设计新AI，有望攻克癌症！蛋白亲和力暴增300倍

PyTorch官宣：告别CUDA，GPU推理迎来Triton加速新时代

Nature子刊：AI模型测「大脑年龄」，究竟哪些因素会加速大脑衰老？

用60%成本干80%的事，DeepSeek分享沉淀多年的高性能深度学习架构

让大模型能听会说，国内机构开源全球首个端到端语音对话模型Mini-Omni

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

北大领衔，多智能体强化学习研究登上Nature子刊

吴恩达，对 Agentic Workflow 持续兴奋

Tweedie 公式：一个公式统治所有扩散模型！

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

MemLong: 长文本的新记忆大师，可将上下文长度从4k提升到80k！

融资1000万美金，最近海外这款AI+视觉工具爆火，旨在将复杂想法可视化

3天把Llama训成Mamba，性能不降，推理更快！

Ilya三个月肝出50亿美金独角兽！SSI 10人团队不走OpenAI老路

全球最大，马斯克4个月建成10万张H100超算集群！xAI算力超越OpenAI，奥特曼怕了

刚刚，Ilya 新公司融资 10 亿，员工仅 10 人：AGI 成功前，不发布任何产品

极光发布《AI生产力工具暑期发展报告》 夸克新增用户数量领跑行业

大模型走向物理世界，TeleAI 发布大模型驱动的具身智能综述，覆盖300篇文献

Meta：大语言模型可以通过自我批判取得大幅提升！

人工智能史上最重磅的19篇论文，系统展示AI如何从象牙塔走进生活！

GPT-4o不会数r，被外国小哥原地逼疯！谷歌论文揭秘Transformer「数不到n」

极光发布《AI生产力工具暑期发展报告》夸克新增用户数量领跑行业