AI资讯新闻榜单内容搜索-大模

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大模

Deepseek多模态大模型Janus-Pro-7B在医疗领域的简单应用可行性测试

Deepseek多模态大模型Janus-Pro-7B在医疗领域的简单应用可行性测试

Deepseek多模态大模型Janus-Pro-7B在医疗领域的简单应用可行性测试

就在除夕前的晚上（2025 年 1 月 27 日），Deepseek 发布了多模态模型 Janus-Pro-7B，该模型在图像生成和多模态理解方面都超过了OpenAI的DALL-E 3（虽然也一般般），我相信能文生图功能一定很优秀了，今天搞点特殊的，测试下图像理解能力对专业的医学影像有没有应用的可行性，以下是常见的五种医学影像测试。

来自主题: AI资讯

9128 点击 2025-02-01 19:58

豆包团队视频生成新突破：无需语言模型，仅凭“视觉”就能学习复杂任务

豆包团队视频生成新突破：无需语言模型，仅凭“视觉”就能学习复杂任务

豆包团队视频生成新突破：无需语言模型，仅凭“视觉”就能学习复杂任务

现在，豆包大模型团队联合北京交通大学、中国科学技术大学提出了VideoWorld。

来自主题: AI技术研报

8371 点击 2025-01-31 13:53

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

首个FP4精度的大模型训练框架来了，来自微软研究院！

来自主题: AI技术研报

8980 点击 2025-01-30 15:11

清华翟季冬：DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬：DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬：DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025 年伊始，全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划，Meta 在建规模超 130 万 GPU 的数据中心时，这个来自中国的团队打破了大模型军备竞赛的既定逻辑：用 2048 张 H800 GPU，两个月训练出了一个媲美全球顶尖水平的模型。

来自主题: AI资讯

7668 点击 2025-01-30 14:58

梁文锋就是AI界的黄峥

梁文锋就是AI界的黄峥

梁文锋就是AI界的黄峥

梁文锋带领着DeepSeek，还在继续搅动大模型行业。继用R1模型炸场之后，1月28日凌晨，除夕夜前一晚，DeepSeek又开源了其多模态模型Janus-Pro-7B，宣布在GenEval和DPG-Bench基准测试中击败了DALL-E 3（来自 OpenAI）和Stable Diffusion。

来自主题: AI资讯

8798 点击 2025-01-30 12:40

美国对DeepSeek下手了：美国海军禁止使用DeepSeek模型，并以安全为由展开调查

美国对DeepSeek下手了：美国海军禁止使用DeepSeek模型，并以安全为由展开调查

美国对DeepSeek下手了：美国海军禁止使用DeepSeek模型，并以安全为由展开调查

据参考消息援引美媒报道，美国海军基于“潜在安全和道德问题”，已要求人员避免以任何形式使用中国公司的DeepSeek模型。另据@玉渊潭天消息，当地时间1月28日，美国多名官员回应DeepSeek对美国的影响，表示DeepSeek是“偷窃”，正对其影响开展国家安全调查。

来自主题: AI资讯

8447 点击 2025-01-29 17:46

阿里云昨夜春晚首秀，随后上线AI重磅，透露哪些信号？

阿里云昨夜春晚首秀，随后上线AI重磅，透露哪些信号？

阿里云昨夜春晚首秀，随后上线AI重磅，透露哪些信号？

时隔7年，阿里巴巴再次成为春晚上“最靓的仔”。据了解，阿里云主要为春晚提供两部分技术支持：一是阿里云云转播技术支持全球华人云上看春晚，二是阿里云通义大模型技术支持春晚节目创新，创造全新的视听效果。此前，阿里云已连续多年为央视总台提供护航服务，保障春晚稳定直播。

来自主题: AI资讯

8923 点击 2025-01-29 15:55

UC伯克利等最新实锤：LLM就是比人类啰嗦，「提问的艺术」仍难参透

UC伯克利等最新实锤：LLM就是比人类啰嗦，「提问的艺术」仍难参透

UC伯克利等最新实锤：LLM就是比人类啰嗦，「提问的艺术」仍难参透

基于一段文本提问时，人类和大模型会基于截然不同的思维模式给出问题。大模型喜欢那些需要详细解释才能回答的问题，而人类倾向于提出更直接、基于事实的问题。

来自主题: AI技术研报

5503 点击 2025-01-29 13:32

原来，这些顶级大模型都是蒸馏的

原来，这些顶级大模型都是蒸馏的

原来，这些顶级大模型都是蒸馏的

「除了 Claude、豆包和 Gemini 之外，知名的闭源和开源 LLM 通常表现出很高的蒸馏度。」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。

来自主题: AI技术研报

9605 点击 2025-01-29 13:26

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

昨晚，杭州大模型又双叒不睡，给大伙儿拜年啦～就在春晚直播进行时，阿里通义Qwen发布新春节礼第三弹：Qwen2.5-Max来袭，多个基准测试中超越当红炸子鸡DeepSeek V3。

来自主题: AI资讯

7658 点击 2025-01-29 12:40

上一页当前第189页,共507页下一页