
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVAEMOVA(EMotionally Omni-present Voice Assistant),一个能够同时处理图像、文本和语音模态,能看、能听、会说的多模态全能助手,并通过情感控制,拥有更加人性化的交流能力。
EMOVA(EMotionally Omni-present Voice Assistant),一个能够同时处理图像、文本和语音模态,能看、能听、会说的多模态全能助手,并通过情感控制,拥有更加人性化的交流能力。
每年最值得关注的创业项目路演——YC Demo Day 来了。
自从大型 Transformer 模型逐渐成为各个领域的统一架构,微调就成为了将预训练大模型应用到下游任务的重要手段
给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来!
沉睡了两千多年的兵马俑,苏醒了?
排名超过Llama-3-70B,英伟达Nemotron-4 340B问鼎竞技场最强开源模型!
性能超越 Llama-3,主要用于合成数据。
《DoraemonGPT: Toward Understanding Dynamic Scenes with Large Language Models》
全球每年有近 500 万人死于抗生素耐药性,因此迫切需要新的方法来对抗耐药菌株。AI 方法可以发现新的抗生素,但现有方法有明显的局限性。性质预测模型很难扩展到大型化学空间。直接设计分子的生成模型可以快速探索广阔的化学空间,但生成的分子难以合成。
【新智元导读】OpenAI机器人理解力虽强,却无法进行非语言交流。最近,哥伦比亚大学华人团队打造了全新的机器人Emo,不仅可以提前预测和模拟人类表情,还可以进行眼神交流。