AI TNT— 让一部分先用AI实现商业化

让 AI 一探究竟：任何行业现在都能搜索和汇总大量视觉数据

为提高生产力、优化流程和创造更加安全的空间，埃森哲、戴尔科技和联想等公司正在使用全新 NVIDIA AI Blueprint 开发视觉 AI 智能体。

来自主题: AI资讯

3043 点击 2024-11-09 10:14

我在淘天做算法｜十年拍立淘，一部视觉算法技术演变史

计算机视觉(Computer Vision)的工作原理与人类视觉类似，但需要机器依靠摄像头、数据和算法在很短的时间内完成任务。

来自主题: AI资讯

3255 点击 2024-11-07 20:22

PUMA：商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA（emPowering Unified MLLM with Multi-grAnular visual generation）是一项创新的多模态大型语言模型（MLLM），由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示，巧妙地平衡了视觉生成任务中的多样性与可控性。

来自主题: AI技术研报

2989 点击 2024-10-29 14:32

谷歌&MIT何恺明团队：视觉大模型像LLM一样高效Scaling，指路连续token+随机生成顺序

来自主题: AI技术研报

3774 点击 2024-10-20 17:34

从数据增强的隐藏作用出发，揭示视觉强化学习可塑性损失的独特机制

Sutton 等研究人员近期在《Nature》上发表的研究《Loss of Plasticity in Deep Continual Learning》揭示了一个重要发现：在持续学习环境中，标准深度学习方法的表现竟不及浅层网络。研究指出，这一现象的主要原因是 "可塑性损失"（Plasticity Loss）：深度神经网络在面对非平稳的训练目标持续更新时，会逐渐丧失从新数据中学习的能力。

来自主题: AI资讯

3180 点击 2024-09-29 14:39

GPT-4o能玩《黑神话》！精英怪胜率超人类，无强化学习纯大模型方案

AI玩黑神话，第一个精英怪牯护院轻松拿捏啊。

来自主题: AI技术研报

6762 点击 2024-09-23 15:42

格灵深瞳：“AI之眼”商业化前路几何？

作为A股第一家AI计算机视觉上市公司，格灵深瞳在多个人工智能细分应用领域中较早完成了产品布局，目前尚处于产业化与市场拓展的发展阶段，未来能否在新应用领域实现业务拓展，将成为企业“生死存亡”的关键。

来自主题: AI资讯

8885 点击 2024-09-11 10:13

融资1000万美金，最近海外这款AI+视觉工具爆火，旨在将复杂想法可视化

在信息过载的时代，快速而准确地传达信息显得尤为重要。

来自主题: AI技术研报

6683 点击 2024-09-05 15:43

为边缘开发由生成式 AI 赋能的视觉 AI 智能体

视觉语言模型（VLM）这项 AI 技术所取得的突破令人振奋。它提供了一种更加动态、灵活的视频分析方法。VLM 使用户能够使用自然语言与输入的图像和视频进行交互，因此更加易于使用且更具适应性。这些模型可以通过 NIM 在 NVIDIA Jetson Orin 边缘 AI 平台或独立 GPU 上运行。本文将探讨如何构建基于 VLM 的视觉 AI 智能体，这些智能体无论是在边缘抑或是在云端都能运行。

来自主题: AI技术研报

6765 点击 2024-09-04 16:04

阿里开源视觉大模型Qwen2-VL：可理解20分钟长视频，性能比肩GPT-4o

还能玩纸牌游戏。

来自主题: AI资讯

5998 点击 2024-09-01 11:31