
英伟达愚人节彩蛋成真,可AI游戏助手注定是“花瓶”
英伟达愚人节彩蛋成真,可AI游戏助手注定是“花瓶”一个绝大多数用户都无法使用的功能,至少现阶段根本就没有意义。
一个绝大多数用户都无法使用的功能,至少现阶段根本就没有意义。
在人工智能技术日新月异的今天,语音合成(TTS)领域正经历着一场前所未有的技术革命。最新一代文本转语音系统不仅能够生成媲美真人音质的高保真语音,更实现了「只听一次」就能完美复刻目标音色的零样本克隆能力。
AI智商再创新高!OpenAI o3以惊人的136分刷新门萨智商测试纪录,超越不久前登顶的Gemini 2.5 Pro。更令人瞩目的是其强大的图像理解能力:仅凭一张无EXIF信息的菜单或风景照,o3就能精准推理并反向定位拍摄地点,引发了用AI玩「照片寻址(GeoGuessr)」的新热潮。
Two Heads are Better Than One"(两个脑袋比一个好/双Agent更优)源自英语中的一句古老谚语。MAS-TTS框架的研究者将这一朴素智慧应用到LLM中,创造性地让多个智能体协同工作,如同专家智囊团。
知道大模型接下来要卷视觉推理,但没想到这么卷——数学试卷都快要不够用了。
既想当说走就走的酷盖,又怕踩坑当大冤种。
坐标深圳,又有新机器人诞生了——智平方新一代通用智能机器人AlphaBot 2(爱宝 2)。
当战略航向尚未明朗时,选对人常常是掌舵者的第一战略。这是我们第二期关于大厂AI进化论观察系列。
小红书一向擅长把生活变成内容,而现在,它想进一步把生活变成产品。
消费级AI机器人公司「X-ORIGIN-AI」(玄源科技)宣布完成近亿元Pre-A轮融资,本轮由东方富海领投,金鼎资本与联想之星跟投,仁辰资本担任财务顾问。本轮融资距离X-ORIGIN-AI的天使轮融资仅有不到一季度时间,此前的数千万元天使轮由阿尔法公社领投,多名产业投资人跟投。
一股由ChatGPT引爆的AI玩偶热潮正在席卷全球社交媒体!从领英到TikTok,人人都在将自己变成可爱玩偶,搭配个性配饰,装进精美包装盒。你准备好了吗?
公考行测中的逻辑推理题,是不少考生的噩梦,这次,CMU团队就此为基础,打造了一套逻辑谜题挑战。实测后发现,o1、Gemini-2.5 Pro、Claude-3.7-Sonnet这些顶尖大模型全部惨败!最强的AI正确率也只有57.5%,而人类TOP选手却能接近满分。
对于AI视觉多模态大模型只关注显著信息这一根本性缺陷,哈工大GiVE实现突破!
想必各位开发者、产品经理或一些有想法的非程序员人士,已经使用了 Cursor 来协助完成一些开发任务,但是由于额度和有效期的问题,每次刚学会几招 Cursor 的使用方式,就用不了了。
Perplexity AI 公司正与三星电子商讨在其设备上集成虚拟助手事宜,并已与联想集团旗下摩托罗拉达成此类合作协议。
在能源AI这个高门槛赛道,中科类脑完成了一场从技术攻坚到商业变现的深度突围。
Llama 4 或许只是冰山一角。
4 月 14 日,谷歌首席科学家 Jeff Dean 在苏黎世联邦理工学院举办的信息学研讨会上发表了一场演讲,主题为「AI 的重要趋势:我们是如何走到今天的,我们现在能做什么,以及我们如何塑造 AI 的未来?」
经历了 2025 年初 DeepSeek、Manus 们的冲击,大厂正在重新明确自己下一步的战略。
前天晚上人还在参加着英伟达的合作伙伴大会晚宴。
据知情人士透露,过去一年中,Meta Platforms 曾请求微软、亚马逊等公司协助承担其旗舰大语言模型 Llama 的训练成本。该想法反映出对 AI 开发成本激增日益加剧的担忧,企业对资助开源软件犹豫不决。
具身智能机器人企业智平方在深圳发布新一代通用智能机器人AlphaBot 2(爱宝2)。
替代中医的不是AI,而是会用AI的中医。
谷歌发布首款混合推理模型Gemini 2.5 Flash,引入了革命性「思考预算」,可灵活控制推理深度,性能一举击败Claude 3.7,比肩o4-mini。而且,关闭思考模式成本直降600%。
根据彭博社消息,广受欢迎的 AI 编程助手 Windsurf 的开发商正与 OpenAI 洽谈收购事宜,交易金额约为 30 亿美元。
悬疑小说的最后一页,隐藏着罪犯的真相。《逆转裁判》的法庭上,真凶在谎言中露出破绽。UCSD研究团队以这款经典游戏为舞台,o1、Gemini 2.5 Pro等模型化身「侦探」,测试AI的推理极限。
4月17日据《金融时报》周四报道,OpenAI和Oracle(ORCL.N)为其重要项目“星际之门”权衡英国未来投资,因为它正在探索海外地点以建立人工智能基础设施。
作为玩家基数庞大的60级显卡新品,RTX 5060 Ti带来了显著的性能飞跃。得益于强大的DLSS 4多帧生成黑科技,它不仅能在合理设置下以4K运行大型3A游戏,而且还能轻松跑通本地AI大模型。
2025年4月16日,Cohere 发布了其最新一代多模态搜索模型 Embed 4,在多模态数据处理、长文本建模和跨模态检索能力上实现了显著提升,进一步巩固了其在企业级 AI 搜索领域的领先地位。
视频人物抠像技术在电影、游戏、短视频制作和实时视频通讯中具有广泛的应用价值,但面对复杂背景和多目标干扰时,如何实现一套兼顾发丝级细节精度及分割级语义稳定的视频抠图系统,始终是个挑战。