AI资讯新闻榜单内容搜索-Face

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Face
10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一

10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一

10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一

DiffRhythm是一款新型AI音乐生成模型,能在10秒内生成长达4分45秒的完整歌曲,包含人声和伴奏。它采用简单高效的全diffusion架构,仅需歌词和风格提示即可创作,还支持本地部署,最低只需8G显存。

来自主题: AI技术研报
3882 点击    2025-03-12 15:59
全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻

全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻

全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻

就在刚刚,网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现,只用强化学习,没有监督微调,30美元就能见证「啊哈时刻」!全球AI大模型,或许正在进入下一分水岭。

来自主题: AI资讯
7771 点击    2025-01-26 13:30
选择/杂交/突变,DeepMind将自然选择引入LLM思维,实现心智进化

选择/杂交/突变,DeepMind将自然选择引入LLM思维,实现心智进化

选择/杂交/突变,DeepMind将自然选择引入LLM思维,实现心智进化

今天是个好日子,DeepSeek 与 Kimi 都更新了最新版的推理模型,吸引了广泛关注。与此同时,谷歌 DeepMind、加州大学圣地亚哥分校、阿尔伯塔大学的一篇新的研究论文也吸引了不少眼球,并直接冲上了 Hugging Face 每日论文榜第一(1 月 20 日)。

来自主题: AI技术研报
6200 点击    2025-01-23 10:58
引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述

图形用户界面(Graphical User Interface, GUI)作为数字时代最具代表性的创新之一,大幅简化了人机交互的复杂度。

来自主题: AI技术研报
7596 点击    2025-01-09 14:39
从2019年到现在,是时候重新审视Tokenization了

从2019年到现在,是时候重新审视Tokenization了

从2019年到现在,是时候重新审视Tokenization了

2019 年问世的 GPT-2,其 tokenizer 使用了 BPE 算法,这种算法至今仍很常见,但这种方式是最优的吗?来自 HuggingFace 的一篇文章给出了解释。

来自主题: AI技术研报
8142 点击    2025-01-04 14:20
北大发布ConsisID:无需训练Lora,就可以定制化个人视频写真!

北大发布ConsisID:无需训练Lora,就可以定制化个人视频写真!

北大发布ConsisID:无需训练Lora,就可以定制化个人视频写真!

这两天,北京大学等研究团队发布了一个视频生成的可控生成工作:ConsisID。ConsisID可以实现无需训练Lora的保持参考人脸一致性的文生视频,类似之前图像生成的IP-Adapter-Face和InstantID等工作。虽然之前也有类似的工作,但是ConsisID在效果更上一个台阶。

来自主题: AI技术研报
5974 点击    2024-12-06 09:25