AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
AAAI'26 Oral:小样本对齐人类认知,LLM不再模仿答案

AAAI'26 Oral:小样本对齐人类认知,LLM不再模仿答案

AAAI'26 Oral:小样本对齐人类认知,LLM不再模仿答案

GEM框架利用认知科学原理,从少量人类偏好中提取多维认知评估,让AI在极少标注下精准理解人类思维,提高了数据效率,在医疗等专业领域表现优异,为AI与人类偏好对齐提供新思路。

来自主题: AI技术研报
8849 点击    2026-01-23 10:14
喝点VC|a16z复盘消费级AI:为什么还没有AI社交软件?2026年多模态与应用生成为破局关键

喝点VC|a16z复盘消费级AI:为什么还没有AI社交软件?2026年多模态与应用生成为破局关键

喝点VC|a16z复盘消费级AI:为什么还没有AI社交软件?2026年多模态与应用生成为破局关键

目前已经出现了一些早期迹象,通用LLM助手领域的市场格局,正朝着“赢家通吃”,至少是“赢家通吃大部分市场”的趋势发展。在ChatGPT、Gemini、Claude 3和Cursor这几款产品中,仅有9%的用户会为一款以上的产品付费。

来自主题: AI资讯
10222 点击    2026-01-23 10:13
拒绝成为落后的开发者:用TRAE Skills构建你的10倍效能工具箱

拒绝成为落后的开发者:用TRAE Skills构建你的10倍效能工具箱

拒绝成为落后的开发者:用TRAE Skills构建你的10倍效能工具箱

比如前些天,Vercel 创始人 Guillermo Rauch 推出了所谓的「AI skill 的 npm」,让用户仅需一个简单命令 npx skills add [package],就能为自己的 AI 智能体轻松注入专业能力。

来自主题: AI资讯
10100 点击    2026-01-22 12:36
AgentIF-OneDay 发布,评估全场景长时复杂任务

AgentIF-OneDay 发布,评估全场景长时复杂任务

AgentIF-OneDay 发布,评估全场景长时复杂任务

随着大模型在单点推理上日益逼近 PhD 水平,Agent 领域迎来了新的分水岭:短程任务表现惊艳,长程任务却显乏力。为精准评估大模型的多模态理解与复杂问题解决能力,红杉中国在两周内连续发布两篇论文,旨在通过构建更科学的评估基准,预判技术演进的未来方向。

来自主题: AI技术研报
8123 点击    2026-01-22 10:06
从入门到用好 Agent Skills,看这一篇就足够了

从入门到用好 Agent Skills,看这一篇就足够了

从入门到用好 Agent Skills,看这一篇就足够了

Claude Skill 很火,甚至已经超越 MCP 了,如今各家的 cli 客户端基本也都支持,扣子、MiniMax 的 agent 产品也都上架了类 Skill 的产品。而且不仅仅是对普通用户有用,从开发者视角来看,通用 Agent 内核,只靠 Skills 设计,也能低成本创造具有通用 AI 智能上限的垂直 Agent 应用。

来自主题: AI资讯
6863 点击    2026-01-21 17:25