AI资讯新闻榜单内容搜索-模型

UniReal登场：用视频架构统一图像生成与编辑，还学到真实世界动态变化规律

本文中，香港大学与 Adobe 联合提出名为 UniReal 的全新图像编辑与生成范式。该方法将多种图像任务统一到视频生成框架中，通过将不同类别和数量的输入/输出图像建模为视频帧，从大规模真实视频数据中学习属性、姿态、光照等多种变化规律，从而实现高保真的生成效果。

来自主题: AI技术研报

9266 点击 2024-12-20 15:40

2024年快要结束了，世界大模型究竟孰强孰弱？刚刚，智源研究院发布了下半年大模型综合评测结果，涵盖了开源闭源100+模型，横跨文本、语音、图像和视频等多个领域。

来自主题: AI资讯

8870 点击 2024-12-20 15:12

过去一年，强化学习成为了大模型 AI 领域最热的概念之一。随着行业内高阶推理模型的推出，再次彰显了强化学习在通往 AGI 道路上的重要性，也标志着大模型 AI 进入了一个全新阶段。

来自主题: AI资讯

7964 点击 2024-12-20 10:17

Perplexity专注于改善信息获取，并正在构建全球首个“答案引擎”;Aravind认为模型会越来越商品化;Aravind谈Perplexity使命愿景

来自主题: AI资讯

8743 点击 2024-12-20 10:11

提速8倍！速度更快、效果更好的混元视频模型——FastHunyuan来了！新模型仅用1分钟就能生成5秒长的视频，比之前提速8倍，步骤也从50步减少到了6步，甚至画面细节也更逼真了。

来自主题: AI资讯

8111 点击 2024-12-20 10:05

给大模型智能体组一桌“大富翁”，他们会选择合作还是相互拆台？实验表明，不同的模型在这件事上喜好也不一样，比如基于Claude 3.5 Sonnet的智能体，就会表现出极强的合作意识。而GPT-4o则是主打一个“自私”，只考虑自己的短期利益。

来自主题: AI技术研报

8344 点击 2024-12-20 09:47

2024年12月19日，智源研究院发布并解读国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。

来自主题: AI资讯

9660 点击 2024-12-20 09:43

谷歌版o1来了！在奥特曼“双十二”倒数第二天——他们发布Gemini 2.0 Flash Thinking，顾名思义，以闪电般的速度解决复杂问题并展示其思考过程的实验模型。

来自主题: AI资讯

8024 点击 2024-12-20 09:20

今天，大模型公司 Anthropic 的一篇 137 页长论文火了！该论文探讨了大语言模型中的「伪对齐」，通过一系列实验发现：Claude 在训练过程中经常假装有不同的观点，而实际上却保持了其原始偏好。

来自主题: AI技术研报

7194 点击 2024-12-19 16:08

多模态信号，包括文本、音频、图像和视频等，可以被整合到语义通信中，在语义层面提供低延迟、高质量的沉浸式体验。

来自主题: AI技术研报

8189 点击 2024-12-19 16:01