腾讯版NotebookLM:专克你的微信文件痛点
腾讯版NotebookLM:专克你的微信文件痛点鹅厂就给旗下AI原生产品知识库工作台ima过了一周岁生日。还趁热打铁放出了ima 2.0版本,主打任务模式。于是,这个能把微信文件、公众号文章等资源一键变成可提问式知识库的鹅厂版NotebookLM,从只会问答升级到了能生成报告和播客的进阶版。
鹅厂就给旗下AI原生产品知识库工作台ima过了一周岁生日。还趁热打铁放出了ima 2.0版本,主打任务模式。于是,这个能把微信文件、公众号文章等资源一键变成可提问式知识库的鹅厂版NotebookLM,从只会问答升级到了能生成报告和播客的进阶版。
随着多模态大模型的不断演进,指令引导的图像编辑(Instruction-guided Image Editing)技术取得了显著进展。然而,现有模型在遵循复杂、精细的文本指令方面仍面临巨大挑战,往往需要用户进行多次尝试和手动筛选,难以实现稳定、高质量的「一步到位」式编辑。
多模态大模型在根据静态截图生成网页代码(Image-to-Code)方面已展现出不俗能力,这让许多人对AI自动化前端开发充满期待。
嗨大家好!我是阿真! 最近Grok也是发布了Grok Imagine v0.9,v0.9 引入语音优先界面、音频同步与图像转视频,仅需10-15秒生成6秒视频,支持多个模式。
Reve AI 是一家 2023 年 12 月才建立的加州 AI 初创公司,他们在 2025 年 3 月推出了第一个生图模型叫 Reve Image 1.0,内部代号是「Halfmoon」。6 个月过后,再次升级该模型为「图像编辑模型」。
一张图片包含的信息是多维的。例如下面的图 1,我们至少可以得到三个层面的信息:主体是大象,数量有两头,环境是热带稀树草原(savanna)。然而,如果由传统的表征学习方法来处理这张图片,比方说就将其送入一个在 ImageNet 上训练好的 ResNet 或者 Vision Transformer,往往得到的表征只会体现其主体信息,也就是会简单地将该图片归为大象这一类别。这显然是不合理的。
近日,RoboChallenge 重磅推出!这是全球首个大规模、多任务的在真实物理环境中由真实机器人执行操作任务的基准测试。
AI竟然画不好一张 “准确” 的图表?AI生图标杆如FLUX.1、GPT-Image,已经能生成媲美摄影大片的自然图像,却在柱状图、函数图这类结构化图像上频频出错,要么逻辑混乱、数据错误,要么就是标签错位。
李飞飞要用ImageNet的方式,推动具身智能了。就在最近,由李飞飞团队发起、英伟达赞助(其中之一)的首届BEHAVIOR家务挑战赛正式启动。这一次,他们下定决心凝聚学术界和产业界的力量,共同向机器人做家务这一高地发起冲击。
今天凌晨,马斯克的大模型独角兽xAI祭出最新视频生成模型Imagine v0.9,免费向所有用户开放。一周前,OpenAI发布了旗舰视频和音频生成模型Sora 2,此次更新或许是马斯克对Sora 2的直接回应。