AI资讯新闻榜单内容搜索-GE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GE
OpenAI 官方博客:用技能(Skills)加速开源项目维护

OpenAI 官方博客:用技能(Skills)加速开源项目维护

OpenAI 官方博客:用技能(Skills)加速开源项目维护

我们用 Codex 改变了维护 OpenAI Agents SDK[1] 仓库的方式。仓库本地的技能(skills)、AGENTS.md 文件和 GitHub Actions,让我们把反复出现的工程工作——验证、发布准备、示例集成测试、PR 审查,变成了可重复执行的工作流。

来自主题: AI技术研报
7241 点击    2026-03-17 10:07
深度|暗壳AI Agent2.0:破局人居行业,链接“设计与交易”的一站式创作生态平台

深度|暗壳AI Agent2.0:破局人居行业,链接“设计与交易”的一站式创作生态平台

深度|暗壳AI Agent2.0:破局人居行业,链接“设计与交易”的一站式创作生态平台

当AI的生成能力逐渐成为标配时,设计AI的竞争核心已不再是谁更会出图,而是谁能真正接管设计师从创意沟通到商业落地的完整工作流,将设计、协同与产业生态整合成一个无缝的系统。这预示着一场范式转移,而最近发布的暗壳AI Agent2.0,或将成为万亿人居产业的生态破局者。

来自主题: AI资讯
7591 点击    2026-03-17 08:50
龙虾之后,骡子来了!骡子快跑发布MuleRun 2.0,个人AI开启自我进化模式

龙虾之后,骡子来了!骡子快跑发布MuleRun 2.0,个人AI开启自我进化模式

龙虾之后,骡子来了!骡子快跑发布MuleRun 2.0,个人AI开启自我进化模式

今天上午,AI Agent创企MuleRun(骡子快跑)团队发布MuleRun 2.0,该产品是一个可自我进化的个人AI Agent助手。Mulerun创始人兼CEO陈宇森分享称,MuleRun的上手门槛更低,可以在给定目标的前提下主动工作,具有0门槛使用、极高安全性、稳定性、售后完善、自进化能力、24小时在线、主动性等优势。

来自主题: AI资讯
9714 点击    2026-03-16 17:47
500行极简开源框架,硬刚GPT/Gemini视觉极限!

500行极简开源框架,硬刚GPT/Gemini视觉极限!

500行极简开源框架,硬刚GPT/Gemini视觉极限!

多模态模型代码写得像老司机,却在数手指、量柱子时频频翻车?UniPat AI用五百行代码打造的SWE-Vision,让模型「掏出Python尺子」自我验证,一举拿下五大视觉相关基准SOTA。

来自主题: AI资讯
7795 点击    2026-03-16 15:08
Mulerun借假修真,Agent市场明牌竞争

Mulerun借假修真,Agent市场明牌竞争

Mulerun借假修真,Agent市场明牌竞争

半年前我对MuleRun的结论是,阿里老哥拿出了看家的电商心法,要做AI淘宝,供给侧改革,思路典中典。那篇文章最后一句话是等大来——你去喝两瓶假酒一觉睡到明年什么都没错过。

来自主题: AI资讯
9003 点击    2026-03-16 15:08
从多模态大模型中「拆」出音频向量模型

从多模态大模型中「拆」出音频向量模型

从多模态大模型中「拆」出音频向量模型

Google 最近发了 Gemini Embedding 2,他们第一个原生多模态向量模型。文本、图像、视频、音频、文档,全部映射到同一个 3072 维向量空间。这是 Omni Embedding(全模态向量模型)的大趋势:一个架构吃下所有模态,从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5,大家都在往这个方向收敛。

来自主题: AI技术研报
5344 点击    2026-03-16 15:06
ICLR 2026|多模态大模型真的理解情绪吗?MME-Emotion给出了系统答案

ICLR 2026|多模态大模型真的理解情绪吗?MME-Emotion给出了系统答案

ICLR 2026|多模态大模型真的理解情绪吗?MME-Emotion给出了系统答案

近年来,多模态大模型(Multimodal Large Language Models, MLLMs)正在迅速改变人工智能的能力边界。从图像理解到视频分析,从语音对话到复杂推理,大模型正在逐步具备类似人类的综合感知能力。但一个关键问题仍然没有得到充分回答:这些模型真的能够理解人类情绪吗?

来自主题: AI技术研报
6496 点击    2026-03-16 14:27
AI读不懂文档结构?计算所重构Agentic RAG文档推理能力

AI读不懂文档结构?计算所重构Agentic RAG文档推理能力

AI读不懂文档结构?计算所重构Agentic RAG文档推理能力

DeepRead让AI像人一样阅读文档:利用OCR识别章节结构,先精准定位相关段落,再完整读取上下文,避免碎片化检索。实验显示,其长文档问答准确率提升17%,能自动跳过冗余信息,精准提取财报、论文等复杂内容,无需额外知识图谱,轻量高效。

来自主题: AI资讯
8202 点击    2026-03-16 14:26