AI资讯新闻榜单内容搜索-Gen

RTE年度场景三强专访：实时语音、多模态Agent，创业机会在哪里？

10 月 25 日， RTE 年度场景 Showcase 暨第四届 RTE 创新大赛，Founder Park 作为核心生态合作伙伴应邀出席。

来自主题: AI资讯

4504 点击 2024-11-01 10:26

3D大模型助力，15分钟即可训练高质量、个性化的数字人模型，代码已开放

个性化精品数字人（Personalized Talking Face Generation）强调合成的数字人视频在感官上与真人具有极高的相似性（不管是说话人的外表还是神态）。

来自主题: AI技术研报

5690 点击 2024-10-31 15:09

红点创投对话HeyGen创始人，谈TikTok的GenAI困境及通往互动虚拟形象的道路

HeyGen是一个帮助人们创建、本地化和个性化视频的AI平台。解决问题的关键在于提升AI的质量，让视频与实际内容更加匹配、更加引人入胜、更能传递信息。

来自主题: AI资讯

8040 点击 2024-10-31 12:01

一个真正意义上的实时多模态智能体框架，TEN Framework 为构建下一代 AI Agent 而生

有了 TEN（Transformative Extensions Network，变革性扩展网络），开发者们终于不用再「绞尽脑汁」了！TEN 是全球首个真正实现实时多模态智能体的框架，不仅能减少开发痛点，还让你轻松从头开始构建下一代 AI 应用。

来自主题: AI资讯

7309 点击 2024-10-30 15:55

统一图像生成，无需繁杂插件！智源发布扩散模型框架OmniGen

多模态模型，统一图像生成。

来自主题: AI资讯

7377 点击 2024-10-30 13:39

4个专业Agent帮你出海，00后跨境做起婚庆，在阿里国际跑通全流程

00后搞起出海，做跨境婚庆用品，分享了两个理由：一是外国人人均结婚次数比较多（doge）；另一个就是AI浪潮汹涌澎湃，外贸B2B的门槛又又又低了。

来自主题: AI资讯

10442 点击 2024-10-29 18:29

一个模型走天下！智源提出全新扩散架构OmniGen，AI生图进入「一键生成」时代

LLM统一了语言生成任务，图像生成可以吗？就在刚刚，智源推出了全新扩散模型架构OmniGen，单个模型就能生成图像，彻底告别繁琐工作流！

来自主题: AI技术研报

5389 点击 2024-10-29 14:38

PUMA：商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA（emPowering Unified MLLM with Multi-grAnular visual generation）是一项创新的多模态大型语言模型（MLLM），由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示，巧妙地平衡了视觉生成任务中的多样性与可控性。

来自主题: AI技术研报

5172 点击 2024-10-29 14:32

苹果AI上线，ChatGPT免费用！首款M4 Mac诞生，库克：这是全世界最佳AI一体机

首款M4 Mac、「全世界最好的AI一体机」终于来了！同时，苹果AI也正式上线，iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1用户，已经可以体验首批Apple Intelligence功能了……库克直呼：激动人心的新时代开始了！

来自主题: AI资讯

4831 点击 2024-10-29 13:53

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

大型语言模型（LLM）的出现统一了语言生成任务，并彻底改变了人机交互。然而，在图像生成领域，能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日，智源推出了新的扩散模型架构 OmniGen，一种新的用于统一图像生成的多模态模型。

来自主题: AI技术研报

11734 点击 2024-10-29 13:38