智能时代的“既要也要” 亚马逊云科技如何为生成式AI装上“安全阀”?
2004年,由威尔史密斯主演的电影《机械公敌》幻想了近未来世界下,充满智慧的机器人在突破不伤害人类的规范(也就是机器人三定律)之后,所带来的可怕后果,在当时引起了巨大的轰动和反响。而当我们把目光聚焦到当下,会发现虽然人型机器人的威胁还没有出现,但来自生成式AI的威胁,却已经露出了冰山一角。
诚然,随着第四次工业革命的来临,人工智能正在成为推动人类进入智能时代的决定性因素,特别是生成式AI的出现让越来越多企业都看到了实现商业价值的更多可能,越来越多的组织都在积极利用生成式AI为业务赋能,加速数智转型的进程。不过任何事物都有双面性,生成式AI的爆发也带来了一些十分明显的安全问题,例如部分企业的机密信息被聊天机器人泄露,又或者生成式AI被黑客滥用在网络攻击领域等等,因此,在生成式AI时代,构建有效的安全策略是十分重要且必要的。
作为云计算的开创者和引领者,亚马逊云科技始终将安全视为首要任务,并借助云上的前所未有的规模优势创建了一系列经典的云安全体系。生成式AI的诞生与云计算密切相关,因此,亚马逊云科技在云计算安全领域的优势也顺理成章地延续到了生成式AI领域。在re:Invent 2023大会期间,亚马逊首席安全官Steve Schmid从三个层面阐述了亚马逊云科技在生成式AI时代对应用构建安全方面的观点,主要分为以下三个方面:
对于安全从业者,大语言模型和生成式AI可以加速效率,减轻安全工作者的负担,可以有效帮助安全从业者改善其工作成果,但绝不能把决策权交给AI。
实际上,作为网络安全领域不可忽视的重要组成部分,生成式AI也为安全从业者开辟了很多新的安全防护路径,例如亚马逊云科技推出的漏洞管理服务Amazon Inspector就推出了为Amazon Lambda函数提供的代码修复功能,可以持续扫描云上工作负载以查找软件和代码漏洞以及意外的网络暴露,并根据亚马逊云科技的安全最佳实践评估自定义专有Lambda代码中的安全问题,如注入漏洞、数据泄露、弱加密或缺失加密等。在发现漏洞后,Amazon Inspector还可以提供可操作的安全发现,包括受影响的代码片段和修复建议。作为支持发现的一部分,Amazon Inspector提供与漏洞相关的代码补丁,简化了更新易受攻击代码的过程。
此外,亚马逊云科技推出的另一项服务Amazon Detective也为组汇总特性提供了生成式AI能力,该服务可以帮助客户分析、调查并快速确定安全发现或可疑活动的根本原因。在结合了新的生成式AI能力之后,该服务不但可以构建一个可以和客户互动的数据集,结合机器学习、统计分析和图论,帮助调查者理解和分析问题,同时还能在生成问题的叙述时带来更广泛的视角和更多的安全知识,这无疑能加速调查工作流程。
不过也要注意到的是,生成式AI虽然好用,但也不能太过依赖,由于其生成的并非确定性的输出,因此也不能成为唯一识别问题的方式,生成式AI还没有取代安全从业者高级技能的能力,团队也不应该将决策权交给AI。
对于企业,需要从数据源、数据使用和关联过程以及数据生成结果三个层面保障数据安全。
首先在数据源方面,企业需要明确自己的数据来源,Steve Schmidt举了亚马逊云科技设计Amazon Bedrock时的例子,“我们必须讨论数据是否可以通过使用该模型而被暴露。如果你正在用你的公司数据训练大型语言模型,模型是如何访问那些数据的?在训练过程中,你能否保持数据在传输和静止时的加密,以及你如何验证这一点正在发生?用于访问该数据的权限是否已被限制为尽可能最少?”
因此,在这样的设计理念下被开发出来的Amazon Bedrock,在数据源方面也实现了全面的安全保障,首先,Amazon Bedrock可以安全地将数据存储在Amazon S3桶中,使用适当的范围角色来提供模型访问权限,还可以通过Amazon PrivateLink提供对数据的访问,从而让企业控制自己的数据和访问权限。此外,Amazon Bedrock还能为客户提供私有定制基础模型,以保证在使用模型的过程中不会产品信息泄漏,从而为客户提供最新模型的好处,并为其敏感信息提供强大的隔离。
其次,在数据使用和关联过程中,企业需要明确的是,训练数据并非唯一需要关注的敏感数据集。一般来讲,最终用户向大语言模型提问时,很快就能学会如何提出有效的查询,但如果是企业员工向大语言模型做出了提问,企业是无法得知查询的输入和员工对结果的反应是否用于模型训练的,在理想情况下,在开始使用聊天机器人之前,企业需要了解服务处理数据的方式,因为查询本身也是敏感的,这些都应该作为数据保护计划的一部分。
最后,在数据生成结果层面,企业要关注模型的输出是否准确,虽然现在我们看到众多的大语言模型在自然语言方面的输出质量正在稳步提高,但从安全角度来看,用例也定义了风险,如果企业正在使用大语言模型来生成定制的代码,除了关注代码的准确性之外,也要考虑到是否遵循了企业自身的最佳实践等。
对亚马逊云科技自身,多年来一直遵循的原则就是将安全嵌入到整个开发过程,从而使客户能够获得更好的安全体验。这个原则也在Amazon CodeWhisperer和Amazon Bedrock这两个服务上得到了体现。
具体来看,Amazon CodeWhisperer定制功能允许客户安全地将Amazon CodeWhisperer连接到内部代码存储,以创建多种定制,这为Amazon CodeWhisperer提供了生成符合企业使用内部库或API、最佳实践和架构模式的代码所需的上下文。客户可以细致控制哪些开发者可以访问这些定制,并且每个定制都与Amazon CodeWhisperer基础模型隔离。值得一提的是,Amazon CodeWhisperer并不使用客户的代码或从中得到的定制训练支持Amazon CodeWhisperer的基础模型。
对Amazon Bedrock也同样如此,客户的内容不会被用来改善基础模型,也不会与第三方模型开发者共享。使用者可以在不知道数据实际使用方式的情况下,使用可视化界面安全地训练基础模型的实例。在Amazon Bedrock中,客户可以自行决定数据存储的位置区域,并始终在传输和静止时加密,客户可以使用自己的密钥进行加密。客户可以使用Amazon PrivateLink与Amazon Bedrock建立从基础模型到Amazon VPC的私有连接,而不会将流量暴露给互联网。
“确保模型的安全是我们设计Amazon Bedrock的一个核心原因。如果你仔细看Amazon Bedrock的基础构建,你会发现它是围绕模型建立的。但这个模型实际上运行在硬件上,下面有一个虚拟机,还有一个操作系统来支持它的运行。因此,所有支持EC2当前运作的基本构建都有助于保护这个模型,因为你需要采取与保护任何其他应用程序相同的安全措施。这意味着你必须确保它以最小权限运行,以及确保它只具有适当的对外连接。”Steve Schmidt补充道。
这里也要特别提一下亚马逊云科技在2023 re:Invent全球大会上推出的生成式人工智能助手Amazon Q,其在设计方面同样遵循了内嵌安全的设计原则,亚马逊云科技首席执行官Adam Selipsky在发布Amazon Q时也明确表示,很多已经推出工具的提供商实际上是在没有数据隐私和安全功能的情况下推出这些工具的,这导致了很多企业在使用这些工具时需要面临诸多考虑,这种情况下,最好的方法无疑是将安全性构建到技术的基本设计中。
对网络安全而言,生成式AI无疑是一把锋利的双刃剑,一方面,它带来了新的安全威胁,另一方面,它也可以帮助企业安全体系提高威胁检测和响应能力,提高预测能力和安全运营效率,在亚马逊云科技“三管齐下”的策略下,无疑能帮助企业构建更加富有前瞻性的安全措施。
小米(MI)AI音箱二代升级版蓝牙wifi小爱同学人工语音遥控智能音响家用闹钟mini小艾网络低音炮 小米AI音箱(第二代)¥ 169 京东 购买