AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
了解GRPO,你可能会反思Deepseek R1的提示词方法,看AI顿悟《了凡四训》后的Aha时刻

了解GRPO,你可能会反思Deepseek R1的提示词方法,看AI顿悟《了凡四训》后的Aha时刻

了解GRPO,你可能会反思Deepseek R1的提示词方法,看AI顿悟《了凡四训》后的Aha时刻

"Deepseek R1不就是一个参数更大的语言模型吗?随便问问题就行了,还需要什么特殊技巧?"——当你说出这句话时,是否意识到自己正像《西游记》里高举紫金葫芦的妖怪,对着齐天大圣叫嚣:"我叫你的名字,你敢答应吗?"

来自主题: AI技术研报
10963 点击    2025-01-30 13:53
最新研究揭示AI数据之殇:科技巨头垄断权力,「西方中心」数据加剧模型偏见

最新研究揭示AI数据之殇:科技巨头垄断权力,「西方中心」数据加剧模型偏见

最新研究揭示AI数据之殇:科技巨头垄断权力,「西方中心」数据加剧模型偏见

相比LLM和Agent领域日新月异、高度成熟的进展相比,数据收集方面的规范有明显滞后。由超过50名研究人员组成的「数据溯源计划」(DPI)旨在回答这样一个问题:AI训练所需的数据究竟来自何处?

来自主题: AI技术研报
7400 点击    2025-01-30 13:00
AI“硬控”拜年

AI“硬控”拜年

AI“硬控”拜年

这个春节,国产AI引发全球轰动,一家叫做DeepSeek的初创科技公司发布了一款推理模型,不仅能力不输OpenAI的o1,训练成本也远低于国外,各行各业更是跟风尝试。1月27日,DeepSeek超过ChatGPT,成为苹果商店美国区免费应用榜单第一,也登顶中国区免费榜,由于用户突然涌入太多,还出现了短暂宕机。

来自主题: AI资讯
7917 点击    2025-01-30 12:46
梁文锋就是AI界的黄峥

梁文锋就是AI界的黄峥

梁文锋就是AI界的黄峥

梁文锋带领着DeepSeek,还在继续搅动大模型行业。继用R1模型炸场之后,1月28日凌晨,除夕夜前一晚,DeepSeek又开源了其多模态模型Janus-Pro-7B,宣布在GenEval和DPG-Bench基准测试中击败了DALL-E 3(来自 OpenAI)和Stable Diffusion。

来自主题: AI资讯
8470 点击    2025-01-30 12:40
美国对DeepSeek下手了:美国海军禁止使用DeepSeek模型,并以安全为由展开调查

美国对DeepSeek下手了:美国海军禁止使用DeepSeek模型,并以安全为由展开调查

美国对DeepSeek下手了:美国海军禁止使用DeepSeek模型,并以安全为由展开调查

据参考消息援引美媒报道,美国海军基于“潜在安全和道德问题”,已要求人员避免以任何形式使用中国公司的DeepSeek模型。另据@玉渊潭天 消息,当地时间1月28日,美国多名官员回应DeepSeek对美国的影响,表示DeepSeek是“偷窃”,正对其影响开展国家安全调查。

来自主题: AI资讯
8383 点击    2025-01-29 17:46
阿里云昨夜春晚首秀,随后上线AI重磅,透露哪些信号?

阿里云昨夜春晚首秀,随后上线AI重磅,透露哪些信号?

阿里云昨夜春晚首秀,随后上线AI重磅,透露哪些信号?

时隔7年,阿里巴巴再次成为春晚上“最靓的仔”。据了解,阿里云主要为春晚提供两部分技术支持:一是阿里云云转播技术支持全球华人云上看春晚,二是阿里云通义大模型技术支持春晚节目创新,创造全新的视听效果。此前,阿里云已连续多年为央视总台提供护航服务,保障春晚稳定直播。

来自主题: AI资讯
8488 点击    2025-01-29 15:55
我们用DeepSeek分析迅雷5亿收购虎扑,结果……

我们用DeepSeek分析迅雷5亿收购虎扑,结果……

我们用DeepSeek分析迅雷5亿收购虎扑,结果……

DeepSeek、迅雷、虎扑其实都在思考同一个问题:数字时代发展到当下,科技行业应该何去何从?龙年年底,科技界和体育界分别迎来两宗大事件——2025年1月20日,DeepSeek-R1开源人工智能模型发布;2025年1月27日,迅雷宣布作价5亿元人民币收购体育媒体及数据平台虎扑。

来自主题: AI资讯
6419 点击    2025-01-29 14:20
DeepSeek独立发现o1核心思路,OpenAI首席研究官亲自证实!奥特曼被迫发声

DeepSeek独立发现o1核心思路,OpenAI首席研究官亲自证实!奥特曼被迫发声

DeepSeek独立发现o1核心思路,OpenAI首席研究官亲自证实!奥特曼被迫发声

DeeSeek R1横空出世撼动了整个硅谷,这波AI恐惧仍在蔓延扩散。奥特曼、OpenAI首席研究官不得不发文承认DeeSeek的技术突破,预告未来会加快新模型的发布。与此同时,研究人员们也纷纷展开了对DeepSeek技术的深入分析。

来自主题: AI资讯
7521 点击    2025-01-29 14:10
UC伯克利等最新实锤:LLM就是比人类啰嗦,「提问的艺术」仍难参透

UC伯克利等最新实锤:LLM就是比人类啰嗦,「提问的艺术」仍难参透

UC伯克利等最新实锤:LLM就是比人类啰嗦,「提问的艺术」仍难参透

基于一段文本提问时,人类和大模型会基于截然不同的思维模式给出问题。大模型喜欢那些需要详细解释才能回答的问题,而人类倾向于提出更直接、基于事实的问题。

来自主题: AI技术研报
5395 点击    2025-01-29 13:32
原来,这些顶级大模型都是蒸馏的

原来,这些顶级大模型都是蒸馏的

原来,这些顶级大模型都是蒸馏的

「除了 Claude、豆包和 Gemini 之外,知名的闭源和开源 LLM 通常表现出很高的蒸馏度。」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。

来自主题: AI技术研报
9369 点击    2025-01-29 13:26