AI TNT— 让一部分先用AI实现商业化

OpenAI o1 在数学、代码、长程规划等问题取得显著的进步。一部分业内人士分析其原因是由于构建足够庞大的逻辑数据集 <问题，明确的正确答案> ，再加上类似 AlphaGo 中 MCTS 和 RL 的方法直接搜索，只要提供足够的计算量用于搜索，总可以搜到最后的正确路径。然而，这样只是建立起问题和答案之间的更好的联系，如何泛化到更复杂的问题场景，技术远不止这么简单。

来自主题: AI技术研报

5533 点击 2024-09-15 14:41

华为诺亚联合中科大发布工具调用模型ToolACE，效果持平GPT-4获开源第一

大语言模型（如 GPT-4）具备强大的语言处理能力，但其独立运作时仍存在局限性，如无法进行复杂计算，获取不到实时信息，难以提供专业定制化功能等。而大语言模型的工具调用能力使其不仅限于文字处理，更能提供全面、实时、精确的服务，极大地扩展了其应用范围和实际价值。

来自主题: AI技术研报

6581 点击 2024-09-15 14:32

南加大提出全新「通用时间序列」基础模型TimeDiT！基于扩散模型创新物理约束机制

随着近年来在文本和视频数据上构建基础模型的进展，学术界对时间序列的基础模型也表现出浓厚的兴趣。时间序列分析在许多关键领域中具有重要性，能够影响从科学研究到经济决策的广泛应用。

来自主题: AI资讯

3713 点击 2024-09-14 16:21

首次！用合成人脸数据集训练的识别模型，性能高于真实数据集

一个高质量的人脸识别训练集要求身份 (ID) 有高的分离度（Inter-class separability）和类内的变化度（Intra-class variation）。

来自主题: AI技术研报

5246 点击 2024-09-14 16:11

阿里8B模型拿下多页文档理解新SOTA，324个视觉token表示一页，缩减80%

高效多页文档理解，阿里通义实验室mPLUG团队拿下新SOTA。

来自主题: AI技术研报

5664 点击 2024-09-13 21:27

边缘智能的新时代：端侧大模型的研究进展综述

Jiajun Xu : Meta AI科学家，专注大模型和智能眼镜开发。南加州大学博士，Linkedin Top AI Voice，畅销书作家。他的AI科普绘本AI for Babies (“宝宝的人工智能”系列，双语版刚在国内出版) 畅销硅谷，曾获得亚马逊儿童软件、编程新书榜榜首。

来自主题: AI技术研报

3390 点击 2024-09-13 10:29

面向软件工程的AI智能体最新进展，复旦、南洋理工、UIUC联合发布全面综述

本篇综述的作者包括来自复旦大学 CodeWisdom 团队的研究生刘俊伟、王恺欣、陈逸轩和彭鑫教授、娄一翎青年副研究员，以及南洋理工大学的陈震鹏研究员和伊利诺伊大学厄巴纳 - 香槟分校（UIUC）的张令明教授。

来自主题: AI技术研报

4409 点击 2024-09-13 10:26

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确率

近日，在 2024 Inclusion・外滩大会 “超越平面思维，图计算让 AI 洞悉复杂世界” 见解论坛上，蚂蚁集团知识图谱负责人梁磊分享了 “构建知识增强的专业智能体” 相关工作，并带来了知识图谱与大模型结合最新研发成果 —— 知识增强大模型服务框架 KAG。

来自主题: AI资讯

3486 点击 2024-09-12 14:33

LLM对齐综述｜迈向可扩展的大模型自动对齐，中科院软件所&阿里千问发布

近年来，大模型的高速发展极大地改变了人工智能的格局。对齐（Alignment）是使大模型的行为符合人类意图和价值观，引导大模型按照人类的需求和期望进化的核心步骤，因此受到学术界和产业界的高度关注。

来自主题: AI资讯

6158 点击 2024-09-12 10:10

JHU上交等提出首个可渲染X光3DGS！推理速度73倍NeRF，性能提升6.5dB | ECCV 2024

X-Gaussian是一种新型的3D Gaussian Splatting框架，专为X光新视角合成而设计，以减少医疗成像中的X光辐射剂量，通过高效的渲染技术，能够在保持图像质量的同时显著减少训练时间和提升推理速度。

来自主题: AI技术研报

7463 点击 2024-09-11 17:42