吴恩达最新预测：关于AI，这些事未来十年不会变

3777点击 2024-01-02 14:28

2024年，AI的发展会有怎样的改变？

在吴恩达最新的一封来信中，他认为有几件事情在接下来十年内都不会发生改变。

（以下是吴恩达来信原文）

亲爱的朋友们，

人工智能的发展速度超过以往任何时期，这一现象令人振奋。然而，快速变化可能导致迷失方向。在这种情况下，遵循杰夫·贝佐斯（Jeff Bezos）的建议是非常有益的，不仅要考虑变化中的因素，还要思考那些保持不变的因素。如果事物没有改变，投入精力和努力就更加值得。

以下是我相信AI在未来十年不会改变的一些事情：

我们需要社区。拥有朋友和盟友的人比孤身前行的人表现得会更好。即便人工智能领域每周都带来突破性进展，拥有朋友帮助你分辨真实和炒作、测试你的想法、提供相互支持，并与之共同创造，将使你处于更有利的地位。
知道如何使用 AI 工具的人工作效率更高。知道如何操纵数据的个人和企业可以更有效地了解真相、做出更好的决策并取得更多成就。随着人工智能的不断进步，这一点只会变得更加真实。
人工智能需要好的数据才能良好运作。正如人类需要好的数据来做出决策，从追求何种营销策略到决定孩子的饮食，人工智能在我们的算法不断扩大、演变和改进的过程中，也同样需要好的数据。

那么上述三点对我们每个人意味着什么？

让我们继续构建 AI 社区。这很重要！我希望你能与他人分享你所学到的东西，互相激励，并继续寻找朋友和合作者。
不断学习！最好让学习成为一种习惯。它可以让你更有效率，还有很多其他的好处。如果你正在考虑2024年的新年决心，那就把你的学习目标包括进去。随着人工智能的不断发展，每个人都需要一个计划来跟上这一浪潮。
继续培养以数据为中心的人工智能实践。随着企业采用越来越多的人工智能工具，我发现最重要的做法之一是控制自己的数据。我认为这对个人来说也会越来越重要。

虽然以上三点与人工智能有关，但我想分享另外两件事，不幸的是，我相信它们在未来十年将保持不变：⑴气候变化将继续成为人类面临的重大挑战。⑵贫穷，许多人几乎（甚至可能买不起）基本必需品，仍将是一个问题。我将继续思考人工智能气候建模如何帮助前者，以及我们如何利用人工智能来提升每个人的生活质量。

以上便是吴恩达对于未来AI发展的最新观点。

而就在新年伊始的这几天，AI圈中的多位大佬们也陆续发表了他们对于今年人工智能技术发展的预测。

被LeCun点赞的八大预测

最近，Meta一位研究员Martin Signoux写下了他认为AI在今年发展中的八大预测，而这些预测也得到了LeCun的高度认可。

吴恩达最新预测：关于AI，这些事未来十年不会变

（以下是Martin Signoux预测的原文）

一、AI智能眼镜会成为现实

随着多模态技术的兴起，领先的人工智能公司将加倍投入人工智能优先的可穿戴设备。

还有什么比眼镜外形更适合托管 AI 助手的呢？

吴恩达最新预测：关于AI，这些事未来十年不会变

眼镜腿靠近耳朵来传递音频，摄像头靠近眼睛来捕捉看到的输入，它们解放了我们的双手并且佩戴起来也很舒服。

我们和RayBan一起引领着这波潮流，但想想最近的OpenAI和Snapchat传闻……我们的故事才刚刚开始。

二、ChatGPT之于人工智能助手，不会像谷歌之于搜索

2023年是以ChatGPT作为开始，以Bard、Claude、Llama、Mistral和数千个衍生品作为结束。

随着商品化的继续，ChatGPT将随着参考估值修正而消失。

吴恩达最新预测：关于AI，这些事未来十年不会变

三、再见LLM，你好LMM

大型多模态模型（LMM）将持续涌现，并在热议中取代大型语言模型，包括多模态评估、多模态安全等等。

此外，LMM是迈向真正通用人工智能助手的一块垫脚石。

吴恩达最新预测：关于AI，这些事未来十年不会变

四、没有重大突破，但各方面都有所改善

新模型不会带来真正的突破（GPT5不会出现），大型语言模型仍将具有内在限制并容易产生幻觉。我们不会看到任何飞跃进展让它们在2024年能足够可靠地“解决基本通用人工智能（AGI）问题”。

迭代改进将使它们“足够好”地完成各种任务。RAG、数据管理、更好的微调、量化等方面的改进将使LLM在许多用例中足够鲁棒/有用，从而推动各行各业各种服务的采用。

五、小即是美

小型语言模型（SLM）已经存在，但成本效率和可持续性的考虑将加速这一趋势。

量化也将大大改善，推动消费者服务的设备上集成的主要浪潮。

六、开源模型将击败GPT-4，开源闭源之争将逐渐消失

回顾过去12个月开源社区所取得的活力和进步，很明显，开源模型将很快缩小性能差距。

我们在2023年底结束时，Mixtral和GPT-4在MMLU（多模态学习理解）测试中的差距仅剩13%。

但最重要的是，大家都意识到了开源模型将持续存在并推动进步，它们将与专有模型共存。

七、基准测试仍然会是个难题

没有一套基准测试、排行榜或评估工具成为模型评估的终极选择。

相反，我们将看到一系列的改进（就像最近的HELM）和新的倡议（如GAIA），特别是在多模态方面。

八、相比于现存风险，关于存在性风险的讨论不会太多

虽然2023年X-risks成为了头条新闻，但公众辩论将更多地集中在当前的风险和争议上，比如偏见、假新闻、用户安全等问题。

Runway CTO：用新工具讲新故事

Runway联合创始人兼CTO Anastasis Germanidis也发表了他对于今年AI发展的看法。

吴恩达最新预测：关于AI，这些事未来十年不会变

（以下是Anastasis Germanidis预测的原文）

2023年是广泛应用人工智能系统（涵盖文本、图像、视频、音频和其他模态）发展的转折点。

仅在Runway公司，我们就看到了如Gen-1和Gen-2这样的视频生成模型的发布，以及使这些模型具有新型创造控制形式的工具。

在未来一年，我预计在以下几个领域会看到持续的进展：

视频生成：过去一年，生成视频模型（文本到视频、图像到视频、视频到视频）首次公开发布。在来年，这些模型的质量、通用性和可控性将继续迅速提高。到2024年底，互联网上相当一部分视频内容将在某种程度上利用这些模型。
实时互动性：随着大型模型运行速度变快，我们开发出更多结构化控制它们的方法，将开始看到围绕它们出现更多新颖的用户界面和产品，这些界面和产品超越了常见的提示到x或聊天助手范式。
自动化AI研究：开发者们已经接受了基于大型语言模型的编码助手，如GitHub Copilot。但是，很少有工具被设计用来专门加速AI研究工作流程；比如，自动化开发和调试模型代码、训练和评估模型等重复性工作。明年将出现更多这样的工具。
更多关注系统：大量的对话集中在单个网络的端到端训练能力上。然而，在实际应用中，部署在现实世界场景中的AI系统通常由一系列模型的管道驱动。将出现更多用于构建这种模块化系统的框架。

除了技术进步之外，构建这些系统最有意义的部分是，随着每次更新和能力的增强，新的受众被引入其中，讲述了以前没有讲过的新故事。我很兴奋地看到这将在未来一年继续发生。

斯坦福副教授：基础模型的透明度

斯坦福大学计算机科学副教授Percy Liang，则是将关注点聚焦到了基础模型的透明度上。

吴恩达最新预测：关于AI，这些事未来十年不会变

（以下是Percy Liang预测的原文）

仅仅一年前，ChatGPT让世界意识到了基础模型的力量。但这种力量不仅仅体现在耀眼、令人瞠目的演示上。基础模型将以与计算和互联网在上一代社会变革中相似的方式，渗透到我们生活的每个领域、每个方面。考虑到这种预期影响的广度，我们不仅要问人工智能能做什么，还要问它是如何构建的。它是如何被管理的？谁来决定？

我们真的不知道。这是因为人工智能的透明度正在下降。在2010年代的大部分时间里，开放是默认的取向：研究人员发布论文、代码和数据集。在过去三年里，透明度减弱了。

关于最先进模型（如GPT-4、Gemini和Claude）的公开信息很少：用于训练它们的数据是什么？谁创建了这些数据，劳动实践如何？这些模型与哪些价值观相一致？这些模型在实践中是如何使用的？没有透明度，就没有问责，我们已经见证了缺乏透明度在社交媒体等以前一代技术中产生的问题。

为了使透明度评估严谨，基础模型研究中心引入了基础模型透明度指数，用于描述基础模型开发者的透明度。好消息是，许多透明度方面（例如，拥有适当的文档）是可实现的，并且与公司的激励相符。在2024年，也许我们可以开始逆转这一趋势。

目前，政策制定者普遍认识到需要管理人工智能。除了透明度，首要优先事项之一是评估。事实上，没有科学基础来理解这些模型的能力和风险，我们就是盲目的。大约一年前，基础模型研究中心发布了综合评估语言模型（HELM），这是一个评估基础模型（包括语言模型和图像生成模型）的资源。现在我们正在与MLCommons合作，开发一个安全评估的行业标准。

但这个评估很难，尤其是对于通用、开放式的系统。你如何覆盖几乎无限的使用案例和潜在危害空间？你如何防止操纵？你如何以公众能理解的方式呈现结果？这些都是开放的研究问题，但我们需要在短时间内解决这些问题，以跟上人工智能的快速发展。我们需要整个研究社区的帮助。

想象ChatGPT式助手将成为我们获取信息和做出决策的主要方式，并不遥远。因此，基础模型的行为——包括任何偏见和偏好——是重要的。

据说这些模型与人类价值观相一致，但我们谈论的是哪些价值观？再次，由于缺乏透明度，我们无法看到这些价值观是什么，以及它们是如何确定的。我们能否想象一个更民主的过程来引出价值观，而不是由单一组织做出这些决定？重要的是这个过程的正直性和合法性。

OpenAI希望在这方面资助工作，Anthropic也有一些这方向的研究，但这些都还处于早期阶段。我希望其中一些想法能够被纳入生产系统。

微软CTO：为下一年的指数增长做好准备

微软CTO Kevin Scott也做出他对AI在今年发展的一些预测。

吴恩达最新预测：关于AI，这些事未来十年不会变

（以下是Kevin Scott预测的原文）

毫无疑问，2023年是我在相当长的职业生涯中见过的最激动人心、最有趣的技术年份。

值得一提的是，我很确定在2022年结束时我也说过类似的话，我怀疑我明年这个时候可能还会说同样的话，以及在可预见的未来的每一年——重点是，现在的人工智能领域，我们正在经历一个持续的指数级增长时期，这可能代表了我们所见过的最深刻的技术进步。

而且这只是开始。现代生成型人工智能仍处于婴儿期，我们在学习中前行。尽管感觉我们已经和它们共存了很长时间，但2023年实际上是像ChatGPT和Microsoft Copilots这样的强大人工智能工具真正有意义地进入公众视野，作为有用的助手让人们的生活更轻松的第一年。

到明年结束时，我们将拥有许多新的体验、应用和工具，为全世界越来越多的人带来层层叠加的好处。尽管人工智能增长的炒作幅度和加速率可能让人们专注于每一个接下来的“下一个大事件”，但如果我们稍微退后一点，就更容易看到我们面前的机会比我们已经实现的要大得多。

因为我们只能每隔几年左右才能体验到指数曲线的产物，最近一次是GPT-4，我们很容易在这段时间忘记增长的速度实际上有多惊人。而且，按照我们人类的本性，我们很快就适应了，并很快就将每一套新出现的疯狂可能性视为理所当然。

因此，我对所有在未来一年从事人工智能和技术工作的人的希望是，我们需要意识到，指数曲线的下一个样本即将到来，并适当地为（肯定会令人难以置信的）结果做好准备。

愿2024年继续为我们所有人带来发现的激动和持续的创新。

那么，你认为今年AI的发展还有什么值得我们期待呢？

参考链接：

[1]https://twitter.com/MartinSignoux/status/1740729650530365646

[2]https://twitter.com/AndrewYNg/status/1741892184977309823

[3]https://www.deeplearning.ai/the-batch/issue-229/

[4]https://twitter.com/ylecun/status/1740830697181655432

文章来自于微信公众号“量子位”（ID: QbitAI)，作者 “金磊”

关键词: 吴恩达 , AI , AI社区 , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner