AI资讯新闻榜单内容搜索-多模态

抢跑OpenAI！谷歌Gemini 2.0震撼登场：全面转向Agent，多模态输入输出，免费随便玩

谷歌放大招推出 Gemini 2.0 Flash 模型，抢跑外加狙击OpenAI，正式开启Agent时代，诚意十足，全部免费使用

来自主题: AI资讯

3611 点击 2024-12-12 12:12

继量子芯片之后，谷歌又来抢“OpenAI双12直播”的流量了！就在刚刚，谷歌新一代大模型Gemini 2.0突然登场，再次由谷歌CEO皮猜亲自官宣。

来自主题: AI资讯

6982 点击 2024-12-12 09:14

多模态大模型在听觉上，居然也出现了「9.11>9.8」的现象，音量大小这种简单问题都识别不了！港中文、斯坦福等大学联合发布的AV-Odyssey基准测试，包含26个视听任务，覆盖了7种声音属性，跨越了10个不同领域，确保测试的深度和广度。

来自主题: AI技术研报

7487 点击 2024-12-11 16:46

Cell Reports Medicine近期的研究结合CT和病理图像，提出一种可解释的人工智能框架用于预测胃癌患者新辅助化疗的疗效。

来自主题: AI技术研报

7719 点击 2024-12-09 10:58

以 GPT4V 为代表的多模态大模型（LMMs）在大语言模型（LLMs）上增加如同视觉的多感官技能，以实现更强的通用智能。虽然 LMMs 让人类更加接近创造智慧，但迄今为止，我们并不能理解自然与人工的多模态智能是如何产生的。

来自主题: AI技术研报

7466 点击 2024-12-07 15:02

在 Minecraft 中构造一个能完成各种长序列任务的智能体，颇有挑战性。现有的工作利用大语言模型 / 多模态大模型生成行动规划，以提升智能体执行长序列任务的能力。

来自主题: AI技术研报

7623 点击 2024-12-06 17:58

就在刚刚，满血版o1震撼上线了！它首次将多模态和新的推理范式结合起来，更智能、更快速。同时推出的还有200美元/月的专业版ChatGPT Pro。奥特曼亲自和Jason Wei等人做了演示，同时放出的，还有49页完整论文。据网友预测，GPT-4.5可能也要来了。

来自主题: AI资讯

10484 点击 2024-12-06 08:06

近日，眼科医学领域迎来了一项重大突破，由北京同仁眼科中心主任、河南省医学科学院院长王宁利教授领衔的科研团队携手成都中医药大学眼科学院/附属银海眼科医院段俊国教授科研团队等多个团队共同研发出了国内首个多模态、多任务眼科AI大模型——“伏羲慧眼”。

来自主题: AI资讯

7029 点击 2024-12-05 09:11

多模态检索增强生成（mRAG）也有o1思考推理那味儿了！阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch，它能模拟人类解决问题的思维方式，将复杂问题逐步拆解进行智能检索规划。

来自主题: AI资讯

8156 点击 2024-12-04 16:57

围剿英伟达，数十万颗自研二代芯片超算在建！亚马逊祭出地表最强全家桶，多模态Nova击败GPT-4o。

来自主题: AI资讯

6475 点击 2024-12-04 16:06