AI资讯新闻榜单内容搜索-数据集

李飞飞、吴佳俊团队新作：不需要卷积和GAN，更好的图像tokenizer来了

当我们看到一张猫咪照片时，大脑自然就能识别「这是一只猫」。但对计算机来说，它看到的是一个巨大的数字矩阵 —— 假设是一张 1000×1000 像素的彩色图片，实际上是一个包含 300 万个数字的数据集（1000×1000×3 个颜色通道）。每个数字代表一个像素点的颜色深浅，从 0 到 255。

来自主题: AI技术研报

10021 点击 2025-03-20 16:51

无需百卡集群！港科等开源LightGen: 极低成本文生图方案媲美SOTA模型

文本到图像（Text-to-Image, T2I）生成任务近年来取得了飞速进展，其中以扩散模型（如 Stable Diffusion、DiT 等）和自回归（AR）模型为代表的方法取得了显著成果。然而，这些主流的生成模型通常依赖于超大规模的数据集和巨大的参数量，导致计算成本高昂、落地困难，难以高效地应用于实际生产环境。

来自主题: AI技术研报

8405 点击 2025-03-20 09:18

首次，6人7天真人秀！南洋理工等发布第一视角AI生活管家数据EgoLife

通过收集六名志愿者一周的多模态生活数据，研究人员构建了300小时的第一视角数据集EgoLife，旨在开发一款基于智能眼镜的AI生活助手。项目提出了EgoButler系统，包含EgoGPT和EgoRAG两个模块，分别用于视频理解与长时记忆问答，助力AI深入理解日常生活并提供个性化帮助。

来自主题: AI技术研报

8928 点击 2025-03-19 09:31

Dify v1.1.0 发布：用元数据给知识库"贴标签"，RAG 检索效率翻倍

我是 Dify 产品团队的 Yawen。今天，我们很高兴地宣布发布 Dify v1.1.0，并推出了以“元数据”作为知识过滤器的新功能。通过利用自定义的元数据属性，元数据过滤能够提升知识库中相关数据的检索效率和准确度。过去，用户只能在庞大的数据集中进行搜索，无法根据特定需求进行筛选或控制访问，难以快速锁定最相关的信息。、

来自主题: AI技术研报

11454 点击 2025-03-18 21:13