“开源”人工智能的神话

4342点击 2023-08-27 20:23

“开源”人工智能的神话

chatGPT使任何人都能够体验强大的人工智能，但这个备受瞩目的世界知名聊天机器人的内部运作仍然是一个严密保护的秘密。

然而，在最近几个月里，将人工智能变得更加“开放”的努力似乎正在蓬勃发展。今年五月，有人泄露了Meta的一个名为“Llama”的模型，这让外部人员能够访问其底层代码以及决定其行为的“权重”。随后，在今年七月，Meta选择推出了一个更为强大的模型，名为“Llama 2”，供任何人下载、修改和重用。此后，Meta的模型已成为许多公司、研究人员和业余爱好者构建类似ChatGPT功能的工具和应用的极为受欢迎的基础。

这是WIRED的“快进”新闻通讯的一部分，由Will Knight编写，探索人工智能进展和其他可能改变我们生活的技术。注册今日！

“我们在全球范围内有广泛的支持者，他们坚信我们对当今人工智能的开放方法...研究人员致力于使用该模型进行研究，以及技术、学术和政策领域的人士，他们像我们一样看到了Llama和开放平台的好处。”Meta在宣布“Llama 2”的时候表示。今天早上，Meta发布了另一个名为“Llama 2 Code”的模型，专门用于编码。

或许开源的方法正在获得人工智能领域的类似影响，就像它几十年来为软件提供了民主访问权、确保透明度并提高安全性一样。

然而，一组来自卡内基梅隆大学、AI Now研究所和Signal基金会的研究人员在一份调查报告中提出了不同的声音，他们研究了“Llama 2”和其他某种程度上被描述为“开放”的人工智能模型的真实情况。这些研究人员表示，被冠以“开放”标签的模型可能会有一些限制。

“Llama 2”可以免费下载、修改和部署，但它不受传统开源许可证的覆盖。Meta的许可证禁止使用“Llama 2”来训练其他语言模型，并且如果开发人员在每日活跃用户超过七亿的应用或服务中部署它，需要获得特殊许可。

这种控制水平意味着“Llama 2”可能会为Meta带来重大的技术和战略优势，例如当公司在自己的应用中使用该模型时，它可以从外部开发人员所做的有用调整中获益。

研究人员表示，像非营利组织EleutherAI的“GPT Neo”这样根据常规开源许可证发布的模型更加开放。但是，要使这些项目达到平等的水平是困难的。

首先，训练先进模型所需的数据通常保密。其次，构建这些模型所需的软件框架通常由大型公司控制。最受欢迎的两个框架，TensorFlow和PyTorch，分别由Google和Meta维护。第三，训练大型模型所需的计算能力也超出了普通开发者或公司的范围，通常需要数千万甚至上亿美元进行一次训练。最后，改进这些模型所需的人力也是一种资源，大多只有拥有丰富资金的大公司才能获得。

在目前的发展趋势下，几十年来最重要的技术之一可能最终只会让少数几家公司（包括OpenAI、Microsoft、Meta和Google）受益。如果人工智能确实是一项具有改变世界影响的技术，那么如果它能够更广泛地可用和可访问，可能会带来最大的好处。

“我们的分析表明，开放不仅不会实现人工智能的‘民主化’，”Signal的总裁Meredith Whittaker之一以及该研究论文的研究人员之一在谈到此事时告诉我，“实际上，我们展示了公司和机构可以利用‘开放’技术来巩固和扩大中心化的权力。”

Whittaker补充说，开放神话应该成为急需的人工智能监管中的一个因素。她表示：“我们迫切需要有意义的替代技术，来取代那些由大型垄断公司定义和主导的技术，特别是因为人工智能系统正在许多高度敏感领域（如医疗保健、金融、教育和职场）得到广泛应用。”她说：“为实现这些替代方案的条件创造出来，是一个可以与监管运动（如反垄断改革）并行甚至得到支持的项目。”

除了限制大公司的权力，

使人工智能更加开放也可能对释放其最佳潜力以及避免其最糟糕倾向至关重要。

如果我们希望了解最先进的人工智能模型的能力，并减轻可能随着部署和进一步发展而带来的风险，将其开放给全球科学家可能更为明智。

就像安全通过模糊性从未真正保证代码会安全运行一样，保护强大人工智能模型的运作方式可能不是最明智的方式。

关键词: chatGPT , Llama , 2