三个程序员奋战三天重写推理堆栈,Grok-2 mini直接提速两倍,马斯克亲发贺电
三个程序员奋战三天重写推理堆栈,Grok-2 mini直接提速两倍,马斯克亲发贺电一直在用 Grok-2 的用户可能察觉到,这两天,它好像变快了
搜索
一直在用 Grok-2 的用户可能察觉到,这两天,它好像变快了
本文引入了 Transfusion,这是一种可以在离散和连续数据上训练多模态模型的方法。
热衷于开课并与网友分享新技术使用心得的 AI 大牛 Karpathy,也有被质疑「为推销某个产品而在言论中夹带私货」的一天。
最近 ACL 2024 论文放榜,扫了下,SMoE(稀疏混合专家)的论文不算多,这里就仔细梳理一下,包括动机、方法、有趣的发现,方便大家不看论文也能了解的七七八八,剩下只需要感兴趣再看就好。
B2B占主导,反过来也意味着B2C潜力巨大,创始人普遍具备强大技术背景。
Midjourney认怂了兄弟姐妹们
在人工智能领域,图像生成技术一直是一个备受关注的话题。近年来,扩散模型(Diffusion Model)在生成逼真且复杂的图像方面取得了令人瞩目的进展。然而,技术的发展也引发了潜在的安全隐患,比如生成有害内容和侵犯数据版权。这不仅可能对用户造成困扰,还可能涉及法律和伦理问题。
MICRO 全称 IEEE/ACM International Symposium on Microarchitecture,与 ISCA、HPCA、ASPLOS 并称为体系结构「四大顶会」,囊括了当年最先进的体系结构成果,被视作国际前沿体系结构研究的风向标,见证了诸多突破性成果的首次亮相,包括谷歌、英特尔、英伟达等企业在半导体领域的多项技术创新。
视频时代需要自己的基础设施。VideoSys 的目标是使视频生成对于每个人而言都简便、迅速且成本低廉。
除了扩大模型规模,AI 公司还有其他路可以走吗?只靠模型 API 赚不到钱了怎么办?Aidan Gomez 在访谈中谈到了目前困扰 AI 公司的诸多难题。
昨天,李沐回到了母校上海交大,做了一场关于 LLM 和个人生涯的分享。本文是机器之心梳理的李沐演讲内容
只要不到10行代码,就能让大模型数学能力(GSM8k)提升20%!
Transformer八子中最年轻的Aidan Gomez在最新的采访中感叹:
什么是顶流?
哈佛大学的一项最新研究表明,大语言模型已经深入学生的日常生活。为何学生们对AI的兴趣如此浓厚,背后的原因恐怕是这所大学的教授们。
OpenAI警告说,跟人工智能语音聊天可能会产生「情感依赖」。这种情感依赖是怎么产生的呢?MIT的一项研究指出,这可能是「求仁得仁」的结果,无怪乎连软件工程师也会对AI着迷。
就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了!
AI要真正改变世界,必须能够自由交易。代理不仅需要智能,还需要自主完成经济任务而无需人工干预,这就是AI经济。
“谷歌杀手”,走上谷歌的老路。
在致人死亡的动物中,蚊子排名第一。
《黑神话:悟空》上线之后,各大资讯平台出现一批奇怪文章。它们开篇讲“震惊”,全文说“震撼”,然而没评测、没细节、没结论,如大圣爷毫毛化猴,面目雷同又空空如也,最后汇入百亿流量之中。
7月底,市场调研机构Sensor Tower发布了今年上半年美国AI产品下载量排行榜前十名。在这个榜单中,有三个是作业帮和MimiMax等中国公司的产品。
《Her》她来了,第一个火出圈的“AI分身”
当AI文生图比拼真实度、艺术感,Ideogram开辟了一个刁钻的赛道:在图片上精准生成文字,并且字体和排版都好看。
昆仑万维上半年业绩强劲,AI业务多点开花。
“将各个行业的所有瑰宝都集中在自己的投资组合中”
端侧大模型的真实需求仍需验证。
金融赋能人工智能企业产融对接会成功举办。
从尝到甜头到回到巅峰,还需几步?