雷军国庆将网友“骂”了整整七天,AI语音方向错了?
雷军国庆将网友“骂”了整整七天,AI语音方向错了?只需3秒,你的声音就能被完美克隆。 谁能想到科技圈顶流之一的雷军,居然因为AI语音引起互联网热议?
搜索
只需3秒,你的声音就能被完美克隆。 谁能想到科技圈顶流之一的雷军,居然因为AI语音引起互联网热议?
AI努力两年半,这个国庆成没成旅游『好帮手』? 今年的国庆假期,忙的不只是人,还有AI。
AI 的风吹到了瑞典皇家科学院
字节摸着快手过河。
AI,将给SaaS公司带来新一轮增长
引领AI摄像头新潮流
瑞士信息与通信科技公司Acodis创立于2016年,公司致力于开发智能文档处理平台,该平台基于人工智能,可在数秒内将任何类型文档的非结构化信息转化为结构化数据,取代手动文档传输和信息处理,节省时间成本的同时提升企业数据利用效率。
精明的温州老板,正采用一种激进的方式改造自己的事业。
一家名为 VESSL AI 的韩国 MLOps 平台正试图通过专注于使用结合本地和云环境的混合基础设施来优化 GPU 费用,从而为自己开辟新的市场。
2024年诺贝尔物理学奖揭晓,今年颁给了约翰·霍普菲尔德(John J. Hopfield)和图灵奖得主、AI教父杰弗里·辛顿(Geoffrey E. Hinton),以表彰他们利用人工神经网络进行机器学习的基础发现和发明。
AI,AI硬件,AI耳机,Oladance
来自约翰斯·霍普金斯大学和腾讯AI实验室的研究人员推出了EzAudio,这是一种新的文本到音频(T2A)生成模型,承诺以前所未有的效率从文本提示中生成高质量的音效。这一进步标志着人工智能和音频技术的重大飞跃,解决了人工智能生成音频中的几个关键挑战。
生成式AI(GenAI),尤其是以OpenAI的ChatGPT为代表,人们发现,这些大模型在一年多后的性能表现远不及刚发布时那样令人惊艳了。
视频生成模型大乱斗
众所周知,人类的本质是复读机。 我们遵循复读机的自我修养:敲黑板,划重点,重要的事情说三遍。 but,事实上同样的方法对付AI也有奇效!
开始之前想先抛一个问题给大家:艺术的本质是什么?
这是一轮新变化。
大语言模型市场的整合与差异:大语言模型市场存在整合的趋势。一方面,人工智能发展的基础产业是资本密集型的,市场整合对于大语言模型市场的资本支撑是必要的。另一方面,为尽可能提高算法的泛化能力,单个大语言模型也需要集成多种创新功能。市场集中度的提高使得企业需要进一步考虑大语言模型的差异化。
NotebookLM 是谷歌开发的一款实验性的 AI 云笔记应用。它基于用户上传的内容,结合 Google Gemini 和 RAG 技术,完成文本摘要、问答、创作等任务,是个性化的笔记助手。
会议组织者都是 NLP 头部科学家,在语言建模方面有着相当的成果。
梵高名作也能被AI逆向破解了?!
顶流新会议首届COLM成功举办,Mamba等4篇论文获得杰出论文奖。
Transformer计算,竟然直接优化到乘法运算了。MIT两位华人学者近期发表的一篇论文提出:Addition is All You Need,让LLM的能耗最高降低95%。
现在,人人皆导演,正在成为现实!
2023年,有两波力量,同时涌向AI风口。
现实世界中的强化学习在应用过程中也面临着巨大的挑战,尤其是如何保证系统的安全性。为了解决这一问题,安全强化学习(Safe Reinforcement Learning, Safe RL)应运而生,成为当前学术界和工业界关注的焦点。
随着 AI 模型的参数量越来越大,对算力的需求也水涨船高。
这样一套组合拳打下去,AI厂商大概率就会乖乖向网站付费了。
这是由潞晨 Video Ocean 生成的黑白电影片段,全新升级的模型现已正式上线,任意角色任意风格,并带来三大突破性功能 —— 文生视频、图生视频、角色生视频,解锁创意的无限可能。
深度解析是我们从 2024 年 8 月榜单开始,在发布榜单时增加的一部分内容,对本期榜单进行深度解析。完整榜单在深度解析后面。