AI资讯新闻榜单内容搜索-人机交互

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 人机交互
独家!哈工大斩获AI顶会ACL评审阶段最高分,让AI领略汉字之美

独家!哈工大斩获AI顶会ACL评审阶段最高分,让AI领略汉字之美

独家!哈工大斩获AI顶会ACL评审阶段最高分,让AI领略汉字之美

哈工大论文斩获ACL评审阶段已知最高分!考虑到英文键盘难以适配汉字特点及文化内涵,团队通过传感器捕捉手部书写,实现汉字的自然输入与识别;独创的中文字形编码使AI能深入理解汉字形态而非仅关注词义,推动AI从「识字」迈向「解字」。该研究革新了中文人机交互,推动了汉字文化传播与传承,更为AI深度理解汉字智慧开辟了新道路。

来自主题: AI资讯
7686 点击    2025-06-01 11:23
微软正式开源UFO²,Windows桌面迈入「AgentOS 时代」

微软正式开源UFO²,Windows桌面迈入「AgentOS 时代」

微软正式开源UFO²,Windows桌面迈入「AgentOS 时代」

近年来,图形用户界面(GUI)自动化技术正在逐步改变人机交互和办公自动化的生态。然而,以 Robotic Process Automation(RPA)为代表的传统自动化工具通常依赖固定脚本进行操作,存在界面变化敏感、维护成本高昂、用户体验欠佳等明显问题。

来自主题: AI技术研报
9007 点击    2025-05-08 10:21
Z Product|被Meta收购后再创业,Sesame突破语音“恐怖谷”,a16z押注,“让AI听懂人心,让沟通回归自然”

Z Product|被Meta收购后再创业,Sesame突破语音“恐怖谷”,a16z押注,“让AI听懂人心,让沟通回归自然”

Z Product|被Meta收购后再创业,Sesame突破语音“恐怖谷”,a16z押注,“让AI听懂人心,让沟通回归自然”

Sasame公司怀揣着“让AI听懂人心,让沟通回归自然”的愿景,致力于打造一种全新的、自然流程的人机交互体验,解决现有语音交互中理解不准确、沟通不流畅、应用场景受限等问题,通过可穿戴设备提供高品质音频,让AI伴侣观察世界,实现用户与AI的真实、自然交互。

来自主题: AI资讯
7453 点击    2025-05-06 09:49
「X-ORIGIN-AI」完成近亿元Pre-A轮融资,以“人机交互情感化”为核心,塑造AI硬件新生态 | 阿尔法Family

「X-ORIGIN-AI」完成近亿元Pre-A轮融资,以“人机交互情感化”为核心,塑造AI硬件新生态 | 阿尔法Family

「X-ORIGIN-AI」完成近亿元Pre-A轮融资,以“人机交互情感化”为核心,塑造AI硬件新生态 | 阿尔法Family

消费级AI机器人公司「X-ORIGIN-AI」(玄源科技)宣布完成近亿元Pre-A轮融资,本轮由东方富海领投,金鼎资本与联想之星跟投,仁辰资本担任财务顾问。本轮融资距离X-ORIGIN-AI的天使轮融资仅有不到一季度时间,此前的数千万元天使轮由阿尔法公社领投,多名产业投资人跟投。

来自主题: AI资讯
6955 点击    2025-04-18 15:27
CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。所谓 3D Affordance Learning,就是希望模型能够根据视觉和语言线索,自动推理出物体可供哪些操作、以及可交互区域的空间位置,从而为机器人或人工智能系统提供对物体潜在操作方式的理解。

来自主题: AI技术研报
4721 点击    2025-04-11 09:55
车企抢抱DeepSeek大腿,中国车企要靠AI“换道超车”?

车企抢抱DeepSeek大腿,中国车企要靠AI“换道超车”?

车企抢抱DeepSeek大腿,中国车企要靠AI“换道超车”?

当ChatGPT用对话颠覆人机交互时,车企们早已嗅到了AI大模型的潜力——从语音助手到自动驾驶,从情感陪伴到场景决策,智能座舱的体验边界正被重新定义。

来自主题: AI资讯
7913 点击    2025-02-10 11:04
引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

图形用户界面(Graphical User Interface, GUI)作为数字时代最具代表性的创新之一,大幅简化了人机交互的复杂度。

来自主题: AI技术研报
7500 点击    2025-01-09 14:39
Hume AI发布全能语音引擎OCTAVE:文本秒变真人声,克隆人格特征

Hume AI发布全能语音引擎OCTAVE:文本秒变真人声,克隆人格特征

Hume AI发布全能语音引擎OCTAVE:文本秒变真人声,克隆人格特征

Hume AI近日推出了一款名为OCTAVE的全新文本与语音引擎,该引擎能够仅凭简单的文本描述或一段5秒的语音录音,即可生成或克隆出逼真的语音和人格特质,为虚拟角色和人机交互带来了无限可能。

来自主题: AI资讯
7245 点击    2024-12-25 09:44