生成式AI催化行业变革 亚马逊云科技三层技术栈加速大模型落地

AI带来的巨大价值潜能正在激活新一轮产业变革周期,从文本大模型ChatGPT到图像大模型Midjourney再到不久前爆火的视频大模型Sora,丰富的生成式AI技术应用正在加速发展和落地,推动千行百业加速数智转型。根据IDC的预测,全球生成式AI市场年复合增长率将达85.7%,到2027年全球生成式AI市场规模将接近1500亿美元。越来越多的企业都在思考如何通过生成式AI创造更具竞争力的产品。

但从模型能力到真正的运营生产之间,企业还需要增加很多的辅助能力来正确、合理、安全、高效地使用生成式AI,而这也是亚马逊云科技一系列产品所提供的价值所在。“去年9月,亚马逊云科技正式发布了生成式AI全托管服务Amazon Bedrock,它可以提供一系列广泛的能力,例如预置吞吐量功能以保障业务拥有稳定独享的底层资源,模型微调能够将自身的业务数据与大模型快速进行结合,以及能够全面监管大模型的Guardrails功能等,这些工程化的能力是企业在真正上生产环境时一定会需要的。此外对用户来说,大模型与业务结合必须要有非常强的数据基石,而亚马逊云科技就为企业提供了构建强大数据基石的能力。”亚马逊云科技大中华区产品部总经理陈晓建表示。

实际上,Amazon Bedrock很好地代表了亚马逊云科技在生成式AI领域的持续创新,为了让更多企业能够在兼顾规模与成本的同时选择最适合业务场景的大模型,亚马逊云科技在生成式AI领域提供了三层技术栈。最底层是高性能的基础设施,中间层是来自多个领先提供商的广泛的基础模型选择,客户可以根据这些基础模型来为自身的业务量身定制,并保持自己的数据私有和安全,并与其他在亚马逊云科技上的工作负载无缝集成,最上层则是应用生成式AI技术的开箱即用的云服务。

对很多企业来说,自身在AI方面的需求是随着业务场景和行业属性而变化的,所谓一个模型走天下的情况在现实世界几乎不可能存在。模型选的太复杂,可能会大材小用,选择能力不足的模型,则会白白浪费企业的成本投入,而作为利用大模型构建和扩展生成式人工智能应用的最简单方法,Amazon Bedrock提供了各种领先的基础模型供用户选择,既有知名的开源模型,如Stable Diffusion XL、Llama、Mistral 7B和Mixtral 8*7B,也有像AI21labs Jurassic、Cohere Command、Amazon Titan这样的非开源模型。

就在不久前,Amazon Bedrock还率先实现了对Claude 3系列模型的支持,该系列模型是全球最领先的大模型之一,包括超大杯Claude 3 Opus、大杯Claude 3 Sonnet和中杯Claude 3 Haiku,三个模型均提供200k长度的上下文,并针对不同的用例进行了优化。

其中,Claude 3 Opus是三个模型中最为先进且最为强大的大模型,具有深度推理、高级数学和编码能力,在高度复杂的任务上具有顶级性能;Claude 3 Sonnet在智能和速度之间实现了平衡,适用于绝大多数工作负载;而Claude 3 Haiku的优势则在于速度和成本效益,这是一种快速紧凑的模型,具有近乎即时的响应能力。客户可以根据自身的商业需求选择最合适的模型。

基准性能方面,Claude 3创造了模型智能水平的新纪录,在数学问题、编程练习和科学推理等标准评估中超越了所有现有模型,特别是Claude 3 Opus,它不仅在包括本科生水平专业知识(MMLU)、研究生水平专业推理(GPQA)、基础数学(GSM8K)在内的常见AI系统评估基准测试中表现优异,其在复杂任务重也表现出了优秀的理解能力和流畅性。

多模态能力方面,Claude 3可以接受基于图像的输入,能力与其他前沿模型大致相同,并且延迟低于其他多模态模型,在兼具速度和智能要求的用例中表现相当出色。

AI幻觉方面,Claude 3在处理挑战性开放问题上准确性相较Claude 2有着明显的提升。

应用场景方面,Claude 3可提供包括内容续写、代码辅助、电商商品描述撰写以及长文本知识召回在内的多种功能。

在Claude 3登陆Amazon Bedrock后,企业能够根据其业务和场景的特定需求,轻松使用Anthropic的最新模型进行构建。而之所以Amazon Bedrock能在第一时间提供对Claude 3的支持,也是源于亚马逊云科技和Anthropic在生成式AI领域的广泛合作。作为Anthropic的首选云服务商,亚马逊云科技不光为Anthropic提供了Amazon Trainium和Amazon Inferentia芯片这样的底层基础设施,亚马逊也对Anthropic进行了多达40亿的投资。

当然,除了提供像Claude3这样的领先基础模型外,Amazon Bedrock也拥有知识库、代理、Guardrails等各种便捷工具,同时确保数据隐私和安全。

具体来说,知识库功能Knowledge Bases for Amazon Bedrock可以为基础模型和Agent提供来自企业私人数据源的上下文信息,用于检索增强生成(RAG),以提供更相关、更准确和更个性化的响应。

代理功能Agents for Amazon Bedrock则能让生成式AI应用使用自然语言执行多步骤的业务任务。代理功能会使用基础模型的推理功能分解问题,并通过分步骤的方式解决提出的问题。

而Guardrails for Amazon Bedrock则允许客户根据应用程序特定要求和负责任的AI策略来管理用户体验,从而构建适合其应用场景且符合其安全和隐私要求的生成式人工智能应用程序。

最后在合规方面,由于Amazon Bedrock是基于全面的数据保护和隐私保护构建的,传输中数据和静态数据都会被加密,数据不会与模型提供者共享,也不会用于改进基础模型。

虽然大模型从去年开始就一直处在行业焦点的位置,但目前多数行业都不知道如何运用大模型来改进自身的业务,还有一些企业因为自身业务规模不大选择在本地部署模型,对此亚马逊云科技大中华区产品技术总监王晓野表示,大模型运行所需要的算力并非传统的IDC数据中心可以轻松实现。除了考虑芯片,还需要考虑散热、网络,以及它自身的高可用,断电后如何做恢复等。基于以上考虑,云端目前仍然是运行大模型最好的地方,就目前的情况来看,能够运行在边缘侧的模型的能力还远未达到领先大模型所实现的“重塑”的效果。

而对于那些并不知道如何运用大模型的企业,陈晓建则建议采用循序渐进、从简单到复杂的思路,最初选择一个容易落地且满足业务要求的场景,在逐渐了解模型的能力之后,再尝试将大模型运用到复杂场景中。

“当然,没有一个模型是适用于所有场景的,这也是Amazon Bedrock提供多种基础模型的原因之一。对企业来说,无论场景是否复杂,团队能力是否足够高,在大模型面前,每个人都是小学生,因此和专业服务团队的合作是非常重要的,作为一家云服务提供商,我们希望进一步降低生成式AI的门槛,因此我们也会为客户提供‘打通’最后三公里的专业团队,包括架构师、产品专家、人工智能实验室、数据实验室、快速原型团队、专业服务团队等等,从而加快大模型在各行各业中的实际落地。”陈晓建在最后表示。

计算机科学丛书·云计算:概念、技术与架构¥ 67 京东 购买