AI资讯新闻榜单内容搜索-3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 3
3700次预训练总结超参规律,开源海量实验,告别盲猜

3700次预训练总结超参规律,开源海量实验,告别盲猜

3700次预训练总结超参规律,开源海量实验,告别盲猜

近年来,大语言模型 LLMs 在多种任务上的卓越表现已得到广泛认可。然而,要实现其高效部署,精细的超参数优化至关重要。为了探究最佳超参数的规律,我们开展了大规模的实证研究,通过在不同配置上进行网格搜索,我们揭示了一套通用的最优超参数缩放定律(Optimal Hyperparameter Scaling Law)。

来自主题: AI技术研报
8575 点击    2025-03-13 15:15
长链推理表象下,大模型精细表征张冠李戴的本质

长链推理表象下,大模型精细表征张冠李戴的本质

长链推理表象下,大模型精细表征张冠李戴的本质

近些年,大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始,到 2022 年底的 GPT-3,再到现在国内外大模型的「百模争锋」,DeepSeek 异军突起,各类大模型应用层出不穷。

来自主题: AI技术研报
9387 点击    2025-03-13 14:41
Open-Sora 2.0正式发布,11B模型拿下开源视频生成新SOTA!仅用224张GPU训练,训练成本省10倍

Open-Sora 2.0正式发布,11B模型拿下开源视频生成新SOTA!仅用224张GPU训练,训练成本省10倍

Open-Sora 2.0正式发布,11B模型拿下开源视频生成新SOTA!仅用224张GPU训练,训练成本省10倍

224张GPU,训出开源视频生成新SOTA!Open-Sora 2.0正式发布。 11B参数规模,性能可直追HunyuanVideo和Step-Video(30B)。

来自主题: AI资讯
7514 点击    2025-03-13 13:58
SQL 开发者们,终于有了自己的“Cursor”

SQL 开发者们,终于有了自己的“Cursor”

SQL 开发者们,终于有了自己的“Cursor”

四个月前,我们采访了 Chat2DB 创始人姬朋飞,文章里讲述了他从大厂离职后的创业历程。而最近 Cha2DB 针对 SQL 开发者的普遍痛点,发布了全新的 3.0 版本。

来自主题: AI技术研报
6383 点击    2025-03-13 12:12
又一位字节AI大将离职

又一位字节AI大将离职

又一位字节AI大将离职

3月12日,华尔街见闻获悉,原字节跳动AI大将、火山引擎高管骆怡航于近日加入生数科技,担任CEO一职。去年底,字节TikTok算法负责人陈志杰也被曝出离职创业。

来自主题: AI资讯
5264 点击    2025-03-13 11:51
AI视频渗透老年朋友圈:“一天起号,快速变现”

AI视频渗透老年朋友圈:“一天起号,快速变现”

AI视频渗透老年朋友圈:“一天起号,快速变现”

“发财了,一个视频回本,收益300多。”一位群友在群里发布了自己的视频号截图。另一位群友不语,只是发布了自己同话题的视频,显示收益800多。

来自主题: AI资讯
9675 点击    2025-03-13 10:47