分析训练推理“多箭”齐发 亚马逊云科技打出生成式AI技术“组合拳”

2024-12-23 10:24

对于云厂商而言,AI无疑是新的增长引擎,从云基础设施扩展到芯片和大模型的过程中,新的战场已经开启。

前不久,2024 re:Invent中国行北京站发布会上,亚马逊云科技围绕计算服务、存储服务、数据库服务、数据分析服务以及AI推理推出了通用自研芯片Amazon Graviton4、Amazon S3 Tables、Amazon S3 Metadata、Amazon Aurora DSQL、新⼀代Amazon SageMaker、Amazon Nova系列模型、mazon Bedrock以及Amazon Q等一系列新产品技术,受到外界极大关注。

“今年的re:Invent是非常不同寻常的,其发布的创新成果,无论从广度还是深度来讲,跟其他几次re:Invent都非常突出。”亚马逊云科技大中华区产品部总经理陈晓建认为,“几乎所有的应用程序都可以分解成为几个核心的构建单元,亚马逊云科技所做的就是构建出非常优秀的核心单元,用户通过自由搭建这些核心单元,满足他们在特定场景下不同的业务需求。”

简而言之,亚马逊云科技正通过彻底的革新来开发新一代的基础构件,用户可以利用这些基础组件搭建起符合AI时代需求的技术架构,激发AI潜力,加速转型。

01、计算服务:计算性能大幅提升

自2018年起,亚马逊云科技就关注到arm核心性能的提升,推出Amazon Graviton的arm自研处理器。经过持续迭代,第四代芯片Amazon Graviton4在几个月前正式发布,相比之前的芯片,Amazon Graviton4单核处理性能提升了30%,虚拟CPU和内存容量是上一代芯片Amazon Graviton3的三倍。

目前在亚马逊云科技的机房里面,数据中心新增处理器中Amazon Graviton的占比已经超过了50%。同时亚马逊云科技规模最大的1000家Amazon EC2客户中,已有超过90%开始使用Amazon Graviton。

在自主研发的AI芯片领域,亚马逊云科技正式宣布搭载Amazon Trainium2的Amazon EC2 Trn2实例现已正式在海外区域推出,与当前⼀代基于GPU的实例相比,Amazon Trainium2的性价比提升了30-40%。每个Trn2实例都配备了16个Amazon Trainium2芯⽚,这些芯片通过NeuronLink的高带宽、低延迟互连技术相连,使单个实例能够提供高达20.8 Petaflops的计算性能。

此外,亚马逊云科技还透露,面向AI训练的Trainium 3芯片将于明年后期推出,将是首款采用3纳米制程工艺的芯⽚,计算速度提高到2倍,能效最高提升40%。

02存储服务:释放更大数据处理价值

在人工智能飞速发展推动下,存储规模也持续扩大,数据爆炸式的增长对存储系统的可扩展、高可靠、高性能提出了更高要求。从十年前不到100家的1PB以上存储的客户到如今已有数千家客户达到了这个存储规模,作为数据湖的首选平台的Amazon S3凭借其出色扩展性、性能、成本效益、易用性和先进功能,为不同领域的分析、金融建模、实时广告投放、AI等各类工作负载提供支持。

全新推出的Amazon S3 Tables存储服务能够帮助用户更好地使用Iceberg来管理、查询和访问底层的Parquet文件,查询速度提高到3倍,与常规Amazon S3存储桶相比,每秒可处理事务数量提升到10倍。

Amazon S3 Metadata可自动管理更新所有Amazon S3存储的元数据,帮助客户省掉在管理元数据方面繁琐费时的工作,自动为客户创建可查询的元数据,并且实现几乎实时的更新。

03、数据库服务:掌握强一致性、低延迟等优势

从关系型数据库,到图数据库到文档数据库,亚马逊云科技提供了多种适用于不同场景下的数据库,但关系型数据库依然是众多应用的最 佳选择之一。完全兼容MySQL和PostgreSQL的数据库服务Amazon Aurora既能提供商业数据库级别的可靠性,又能像开源数据库⼀样具有可移植性。且相比于开源数据库,性能提升可达到3-5倍,成本却仅为商业数据库的十分之⼀。

Amazon Aurora DSQL是一款全新的无服务器分布式SQL数据库,它结合Amazon Time Sync服务,采用完全无服务器设计,可在多区域实现近乎无限扩展,可用性高达99.999%,支持强一致性,具备低延迟的读写性能,完全兼容PostgreSQL。与其他的流行分布式SQL数据库相比,其读写速度提升了4倍。

与此同时,Amazon DynamoDB global tables也迎来了重要更新,已支持多区域强一致性,无论客户选择SQL还是NoSQL数据库,都能享受到主动-主动多区域部署带来的强一致性、低延迟和高可用性优势。

04、数据分析服务:构建数据视图统一管理

在数据分析领域,亚马逊云科技提供了最全面、最深入的专用服务组合包括数据仓库Amazon Redshift、大数据处理Amzon EMR、搜索分析Amazon Opensearch、流数据分析Amazon Kinesis/Amazon MSK、数据集成Amazon Glue,交互查询的Amazon Athene,以及BI⼯具Amazon Quicksight等多个领域的产品和服务。

为简化数据分析,亚马逊云科技推出了新一代的Amazon SageMaker,它将提供数据分析和AI需求的统一平台。其中包括Amazon SageMaker Unified Studio统一工作室,覆盖了分析、数据处理、搜索、数据准备、AI 模型训练和推理等必需的功能,所有功能都可以通过完整统一的数据视图来实现;Amazon SageMaker Lakehouse数据湖仓,可统一数据湖、数据仓库、运营数据库和企业应用程序中的数据。此外,机器学习相关的部分现成被整合为Amazon SageMaker AI,提供端到端的AI模型构建、训练、和部署,并推出Amazon SageMaker HyperPod的一系列创新功能,重塑了构建和扩展基础模型训练的方式,帮助用户在降低成本的同时,实现最优的训练效率。

05、AI推理:重塑客户云上创新体验

生成式AI推理将成应用核心构建块,未来应用需支持规模化推理平台,模型选择至关重要。“推理将无处不在,所有业务可能都需要应用到大模型所提供的推理能力,也就意味着亚马逊云科技需要提供一个能够支持规模化推理的平台”陈晓建表示。

会上,亚马逊推出Amazon Nova系列模型,包括文本到文本,能以极低成本提供低延迟响应的Micro;能够处理包括文本、图像和视频的Nova Lite;在准确性、速度和成本间平衡的Nova Pro;以及将推出的可处理复杂推理任务并指导定制模型蒸馏的Nova Premier。此外还推出了Amazon Nova Canvas和Amazon Nova Reel等新一代图像生成和视频生成模型。

Amazon Bedrock是构建和扩展生成式AI应用的关键平台,为客户提供推理功能整合到生产环境所需的工具。Amazon Bedrock推出延迟优化选项、模型蒸馏、支持GraphRAG、自动推理检查、多智能体协作等多种新功能,其中多智能体协助功能,可支持多个Agent协作处理复杂工作流程,为特定任务创建一系列独立Agent,创建监督Agent负责设置信息访问权限、决定任务执行方式并确保协作,用户无需单独管理Agent可轻松处理复杂任务。

Amazon Q系列产品包括Amazon Q Developer和 Amazon Q Business,可为不同场景提供生成式AI支持。Amazon Q Developer能够帮助开发者完成编程、测试、诊断、安全扫描、修复、优化等一系列工作,可大幅降低开发者的工作量并提升工作效率。目前在第三方的评测工具SW bench权威的基准测试方面的认证排行榜上名列前茅。

Amazon Q Business 是一款功能最为强大的生成式 AI 助手,它能够有效的使用公司的内部数据,又能够加速任务的处理速度。Amazon Q可以连接企业数据源、亚马逊云科技、第三方应用和维基百科等各类业务系统,让用户能够在不同的数据孤岛中进行搜索、总结信息,并就相关内容展开对话。纳斯达克、Principal Financial Group和埃森哲都在使用Amazon Q Business,通过生成式AI显著提升了员工的工作效率。

生成式AI正对企业产生深远影响,不仅重塑生产方式、革新经营管理模式,还颠覆了传统的商业逻辑,在服务遍及全球的用户时,亚马逊云科技不仅敏锐地洞察到需求动态的变化趋势,而且深刻地将这些变化背后隐含的方法论与创新逻辑,巧妙地融入其新产品与功能的研发之中。全栈联动式的大规模创新,不仅巩固了亚马逊云科技在全球云计算领域的领先地位,更为全球企业的数字化转型和智能化升级提供了强有力的支撑,推动了整个行业向更加高效、智能的未来迈进。

(责任编辑:康玲华)

运营商财经(官方微信公众号yyscjrd)—— 主流财经网站,一家全面覆盖科技、金融、证券、汽车、房产、食品、医药、日化、酒业及其他各种消费品网站。

分享至:
文章关键词:

关于网站