AI资讯新闻榜单内容搜索-机器学习

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 机器学习
从少样本到千样本!MachineLearningLM给大模型上下文学习装上「机器学习引擎」

从少样本到千样本!MachineLearningLM给大模型上下文学习装上「机器学习引擎」

从少样本到千样本!MachineLearningLM给大模型上下文学习装上「机器学习引擎」

这项名为 MachineLearningLM 的新研究突破了这一瓶颈。该研究提出了一种轻量且可移植的「继续预训练」框架,无需下游微调即可直接通过上下文学习上千条示例,在金融、健康、生物信息、物理等等多个领域的二分类 / 多分类任务中的准确率显著超越基准模型(Qwen-2.5-7B-Instruct)以及最新发布的 GPT-5-mini。

来自主题: AI技术研报
6969 点击    2025-09-17 09:30
断供?会“刻意练习”的Qwen2.5-3B,竟然超越Claude3.5!斯坦福最新

断供?会“刻意练习”的Qwen2.5-3B,竟然超越Claude3.5!斯坦福最新

断供?会“刻意练习”的Qwen2.5-3B,竟然超越Claude3.5!斯坦福最新

来自斯坦福的研究者们最近发布的一篇论文(https://arxiv.org/abs/2509.01684)直指RL强化学习在机器学习工程(Machine Learning Engineering)领域的两个关键问题,并克服了它们,最终仅通过Qwen2.5-3B便在MLE任务上超越了仅依赖提示(prompting)的、规模更大的静态语言模型Claude3.5。

来自主题: AI资讯
6312 点击    2025-09-06 11:35
OpenAI大神:人工智能导论课程停在15年前,本科首选该是机器学习导论

OpenAI大神:人工智能导论课程停在15年前,本科首选该是机器学习导论

OpenAI大神:人工智能导论课程停在15年前,本科首选该是机器学习导论

如今,人工智能已经成为科技发展的主流,尤其是 ChatGPT 问世以来,大语言模型(LLM)正在深刻影响社会、企业和个人的方方面面。

来自主题: AI资讯
7601 点击    2025-09-02 11:45
数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!

数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!

数据科学新风口?三大环节搞定ML「资产」管理,VLDB'25最新教程抢先看!

在大模型时代,机器学习资产(如模型、数据和许可证)数量激增,但大多缺乏规范管理,严重阻碍了AI应用效率。研究人员将在VLDB 2025系统介绍如何整理、发现和利用这些资产,使其更易查找、复用且符合规范,从而提升开发效率与协作质量。

来自主题: AI技术研报
6837 点击    2025-08-29 12:27
三个月、零基础手搓一块TPU,能推理能训练,还是开源的

三个月、零基础手搓一块TPU,能推理能训练,还是开源的

三个月、零基础手搓一块TPU,能推理能训练,还是开源的

对于计算任务负载来说,越是专用,效率就越高,谷歌的 TPU 就是其中的一个典型例子。它自 2015 年开始在谷歌数据中心部署后,已经发展到了第 7 代。目前的最新产品不仅使用了最先进的制程工艺打造,也在架构上充分考虑了对于机器学习推理任务的优化。TPU 的出现,促进了 Gemini 等大模型技术的进展。

来自主题: AI资讯
6686 点击    2025-08-25 12:23
“最大的障碍来自物理学界”,MIT物理学家反思AI与物理的结合

“最大的障碍来自物理学界”,MIT物理学家反思AI与物理的结合

“最大的障碍来自物理学界”,MIT物理学家反思AI与物理的结合

在一次采访中,美国国家科学基金会(NSF)人工智能和基本相互作用研究所(IAIFI)主任杰西·塞勒(Jesse Thaler)畅谈了AI和物理学富有成效的交叉。他分享了自己从机器学习怀疑者转变为倡导者的思想转变经历,并分析了AI与物理学双向互动可能带来新发现的潜在路径。

来自主题: AI资讯
7394 点击    2025-08-20 16:31
告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生

告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生

告别Transformer,重塑机器学习范式:上海交大首个「类人脑」大模型诞生

当前 GPT 类大语言模型的表征和处理机制,仅在输入和输出接口层面对语言元素保持可解释的语义映射。相比之下,人类大脑直接在分布式的皮层区域中编码语义,如果将其视为一个语言处理系统,它本身就是一个在全局上可解释的「超大模型」。

来自主题: AI技术研报
6734 点击    2025-08-14 11:11
北大、蚂蚁三个维度解构高效隐私保护机器学习:前沿进展+发展方向

北大、蚂蚁三个维度解构高效隐私保护机器学习:前沿进展+发展方向

北大、蚂蚁三个维度解构高效隐私保护机器学习:前沿进展+发展方向

在数据隐私日益重要的 AI 时代,如何在保护用户数据的同时高效运行机器学习模型,成为了学术界和工业界共同关注的难题。

来自主题: AI技术研报
5739 点击    2025-08-06 11:53
AI 智能体,让每个人可以像科学家一样工作和思考

AI 智能体,让每个人可以像科学家一样工作和思考

AI 智能体,让每个人可以像科学家一样工作和思考

科研是 AI 最早实现广泛落地的行业之一。在 ChatGPT 掀起这一轮生成式 AI 热潮之前,甚至可以追溯到上一轮由机器学习主导的技术浪潮中,AI 就已被用于气候模型参数校准、分子动力学模拟加速等科研任务。尤其在 2018 年前后,DeepMind 推出的 AlphaFold 在蛋白质结构预测方面实现突破,不仅引发了医药行业的技术革命,更被《自然》杂志评价为「解决了生物学五十年来的重大挑战」。

来自主题: AI资讯
6180 点击    2025-07-31 11:58
一个“蠢问题”改写模型规则!Anthropic联创亲曝:瞄准Claude 5开发爆款应用,最强模型的价值会让人忽略成本负担

一个“蠢问题”改写模型规则!Anthropic联创亲曝:瞄准Claude 5开发爆款应用,最强模型的价值会让人忽略成本负担

一个“蠢问题”改写模型规则!Anthropic联创亲曝:瞄准Claude 5开发爆款应用,最强模型的价值会让人忽略成本负担

Anthropic 联合创始人 Jared Kaplan 是一名理论物理学家,研究兴趣广泛,涉及有效场论、粒子物理、宇宙学、散射振幅以及共形场论等。过去几年,他还与物理学家、计算机科学家们合作开展机器学习研究,包括神经模型以及 GPT-3 语言模型的 Scaling Law。

来自主题: AI资讯
6533 点击    2025-07-31 11:05