AI资讯新闻榜单内容搜索-GPT-4o

完全透明开源的共情语音大模型，三阶段训练，四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力，但它们的技术体系完全闭源。

来自主题: AI技术研报

9945 点击 2025-07-16 16:30

10项评测痛打GPT-4o！智源重磅开源全球最强具身智能大脑

最强具身大脑，宝座易主！在10项评测中，国产RoboBrain 2.0全面超越GPT-4o。这次，智源研究院开源了具身大脑RoboBrain 2.0 32B版本以及跨本体大小脑协同框架RoboOS 2.0单机版。不仅问鼎评测基准SOTA，还成功刷新跨本体多机协作技术范式！

来自主题: AI技术研报

10176 点击 2025-07-14 16:12

ICML 2025 Oral！北大和腾讯优图破解AI生成图像检测泛化难题：正交子空间分解

随着 OpenAI 推出 GPT-4o 的图像生成功能，AI 生图能力被拉上了一个新的高度，但你有没有想过，这光鲜亮丽的背后也隐藏着严峻的安全挑战：如何区分生成图像和真实图像？

来自主题: AI技术研报

7983 点击 2025-07-13 11:30

刚刚，「吉卜力狂欢」GPT-4o功臣被Meta挖走！华南理工女学霸曾与奥特曼同台

GPT-4o引爆全球「吉卜力风格」风潮后，其核心成员——华南理工学霸Lu Liu与伯克利博士Allan Jabri——双双跳槽Meta，两人曾在OpenAI主导多模态AI研究，与奥特曼同台展示关键功能。此次挖角再次凸显OpenAI内部动荡后的人才流失危机。

来自主题: AI资讯

9526 点击 2025-07-12 19:19

集成20+先进算法，优于GPT-4o，自主因果分析智能体来了

想象这样一个场景：你是一位生物学家，手握基因表达数据，直觉告诉你某些基因之间存在调控关系，但如何科学地验证这种关系？你听说过 "因果发现" 这个词，但对于具体算法如 PC、GES 就连名字都非常陌生。

来自主题: AI技术研报

9298 点击 2025-07-07 10:22

图像界的DeepSeek！12B参数对标GPT-4o，5秒出图，消费级硬件就能玩转编辑生成

图像模型开源还得是FLUX！Black Forest Labs刚刚宣布开源旗舰图像模型FLUX.1 Kontext[dev]，专为图像编辑打造，还能直接在消费级芯片上运行。

来自主题: AI技术研报

8127 点击 2025-06-30 14:29

航空发动机用上大模型：解决复杂时序问题，性能超越ChatGPT-4o实现SOTA｜上交创智复旦

时序数据分析在工业监控、医疗诊断等领域至关重要。比如航空发动机监控这个复杂工业场景中，工程师需分析海量多通道传感器数据，以判断设备状态并制定维护决策。

来自主题: AI技术研报

8174 点击 2025-06-28 17:00

阿里发布信息检索Agent，可自主上网查资料，GAIA基准超越GPT-4o | 模型&数据开源

Agent能“看懂网页”，像人类一样上网？阿里发布WebDancer，就像它的名字一样，为“网络舞台”而生。

来自主题: AI技术研报

8497 点击 2025-06-27 15:54

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

前段时间，沉寂了很久的Flux官方团队Black Forest Labs发布了新模型：FLUX.1 Kontext，这是一套支持生成与编辑图像的流匹配（flow matching）模型。FLUX.1 Kontext不仅支持文生图，还实现了上下文图像生成功能，可以同时使用文本和图像作为提示词，并能无缝提取修改视觉元素，生成全新且协调一致的画面。

来自主题: AI技术研报

10965 点击 2025-06-27 12:36

开源版MetaQuery来了！OpenUni用1.1B参数媲美BLIP3-o-8B，数据代码完全开源

随着 GPT-4o 展现出令人印象深刻的多模态能力，将视觉理解和图像生成统一到单一模型中已成为 AI 领域的研究趋势（如MetaQuery 和 BLIP3-o ）。

来自主题: AI技术研报

8547 点击 2025-06-22 16:39