AI信任危机之后,揭秘预训练如何塑造机器的「可信灵魂」
AI信任危机之后,揭秘预训练如何塑造机器的「可信灵魂」在人工智能的前沿领域,大语言模型(Large Language Models,LLMs)由于其强大的能力正吸引着全球研究者的目光。在 LLMs 的研发流程中,预训练阶段占据着举足轻重的地位,它不仅消耗了大量的计算资源,还蕴含着许多尚未揭示的秘密。
在人工智能的前沿领域,大语言模型(Large Language Models,LLMs)由于其强大的能力正吸引着全球研究者的目光。在 LLMs 的研发流程中,预训练阶段占据着举足轻重的地位,它不仅消耗了大量的计算资源,还蕴含着许多尚未揭示的秘密。
刚刚,Adobe 正式宣布推出新的图像生成模型 Firefly Image 3,即日起在 Firefly Web 应用程序、Adobe Photoshop 和 Adobe InDesign 中提供测试版,并在「今年晚些时候」全面上市,旨在让创作者能够提高工作效率,生成更高质量、更详细的图像。
继 1 月推出国内首个基于 MoE 架构的千亿参数量大语言模型 abab6 后,上周,通用人工智能创业公司、中国估值最高的大模型公司之一 MiniMax 推出了万亿 MoE 模型 abab 6.5。根据 MiniMax 发布的技术报告,在各类核心能力测试中,abab 6.5接近 GPT-4、 Claude 3 Opus 、Gemini 1.5 Pro 等世界领先的大语言模型。
上周百度 AI 开发者大会,特工宇宙的几个小“特工”也去参加了。体验下来大家最大的感受就是——百度几个大模型产品怎么都长得差不多的。
AI Agent 正在成为今年的 AI 新风口,不仅仅是从技术实现的角度,还有当下 AI 落地和收入角度的考虑。
两个多月前,我写过一篇文章:字节的Coze、扣子和GPTs,有什么区别?浅谈了我对 Agent 和 GPTs 的一些思考。两个月后的今天,我们可以看到,GPTs 逐渐过气,字节的扣子逐步出圈,而钉钉、百度、Dify 等也都上线了工作流功能。且 Agent 的热度也越来越高,尤其是近段时间吴恩达教授在红杉演讲后。
2022年末,ChatGPT惊艳了世人,留下了急火攻心的“AI先行者”Google。
在探索人工智能领域的浪潮中,针对个人消费者C端的AI解决方案的实际落脚点,似乎依旧沿着一条较为狭窄的路径发展。
过去几年里,基于文本来生成图像的扩散模型得到了飞速发展,生成能力有了显著的提升,可以很容易地生成逼真的肖像画,以及各种天马行空的奇幻画作。
就在刚刚,Meta官网上新,官宣了Llama 3 80亿和700亿参数版本