개요
차세대 Amazon SageMaker는 레이크하우스, AI 모델, 애플리케이션 전반에서 데이터 및 AI에 대한 검색, 거버넌스, 협업을 간소화합니다. Amazon DataZone에 구축된 Amazon SageMaker Catalog를 사용하면 사용자는 생성형 AI가 생성한 메타데이터를 사용하는 시맨틱 검색으로 승인된 데이터 및 모델을 안전하게 검색하고 액세스할 수 있습니다. 아니면 그냥 자연어를 사용하여 Amazon Q Developer에게 데이터를 찾으라고 요청할 수도 있습니다. 사용자는 Amazon SageMaker Unified Studio에서 중앙 집중식으로 세분화된 액세스 제어가 포함된 단일 권한 모델을 사용하여 액세스 정책을 일관되게 정의하고 적용할 수 있습니다. 간편한 게시/구독 워크플로를 통해 데이터 및 AI 자산을 원활하게 공유하고 협업합니다. SageMaker를 사용하면 Amazon Bedrock 가드레일을 사용하여 AI 모델을 보호하고 책임 있는 AI 정책을 구현할 수 있습니다. 데이터 품질 모니터링 및 자동화, 민감한 데이터 탐지, 데이터 및 기계 학습(ML) 계보를 통해 조직 전체에 신뢰를 구축합니다.
Amazon SageMaker Catalog의 실제 사례 보기

이점
기능
컨텍스트 및 검색 가능성을 위해 큐레이션된 데이터
SageMaker Catalog는 기술 메타데이터로 비즈니스 컨텍스트를 가져와 사용자가 비즈니스 컨텍스트로 기술 메타데이터를 강화할 수 있도록 합니다. 모든 사용자가 빠르고 쉽게 데이터를 찾고, 이해하고, 신뢰할 수 있도록 비즈니스 컨텍스트로 데이터를 가시화할 수 있습니다.
자동 메타데이터 추천
데이터에 비즈니스 설명과 이름을 자동으로 추가하면 컨텍스트를 쉽게 파악할 수 있고 어려운 기술 명칭을 사용하지 않아도 됩니다. 이 자동화는 대규모 언어 모델(LLM)을 기반으로 하여 정확성과 일관성을 향상합니다.
모든 애플리케이션에 일관된 수준의 AI 안전 제공
Amazon Bedrock 가드레일은 사용 사례별 정책을 기반으로 사용자 입력 및 파운데이션 모델(FM) 응답을 평가하는 데 도움이 되며, 기본 FM과 관계없이 추가 계층의 보호를 제공합니다.
모델을 빠르게 감사 및 추적할 수 있습니다.
통합 보기를 통해 모든 모델, 엔드포인트 및 모델 모니터링 작업의 성능을 신속하게 감사하고 문제를 해결합니다. 자동화된 알림을 통해 예상되는 모델 동작과 누락되거나 비활성화된 모니터링 작업의 편차를 추적합니다.
데이터 품질
데이터 소비자는 데이터 품질 통계를 통해 AWS 또는 서드 파티 시스템의 데이터 품질 지표를 볼 수 있습니다. 데이터 소비자는 의사 결정에 사용하는 데이터 소스를 신뢰할 수 있고 자산을 검색할 때 데이터 품질 컨텍스트를 파악할 수 있습니다. 데이터 생산자와 IT 팀은 API를 사용하여 서드 파티 시스템의 데이터 품질 통계를 콘솔 외부의 통합 포털에 통합할 수도 있습니다.
데이터 및 ML 계보
시간 경과에 따른 데이터 및 모델의 이동을 이해합니다. 계보는 데이터 소비자가 데이터의 출처, 변경 사항, 사용을 파악하는 데 도움을 주어 조직의 데이터 및 AI 리터러시를 향상시키고 신뢰를 높일 수 있습니다. 데이터 및 AI 자산과 자산 관계 매핑, 파이프라인 문제 해결 및 개발, 데이터 및 AI 거버넌스 사례 적용에 소요되는 시간을 줄일 수 있습니다.
고객
CISCO
"우리는 데이터를 검색하고, 공유하고, 관리해야 합니다. 데이터 메시 또는 데이터 패브릭으로 불리는 이 데이터라는 것이 여러 팀의 여러 사일로에 존재하므로, 하나로 통합해야 합니다. Amazon SageMaker Catalog는 데이터 생산자와 소비자를 연결하여 생산자가 내장된 제어 및 데이터 계약을 통해 데이터를 공유할 수 있도록 하는 동시에, 소비자가 원하는 도구를 사용하여 데이터에 액세스할 수 있도록 합니다.”
Shaja Arul Selvamani, Cisco Sr. Director AI/ML.

Natera, Inc.
“우리 조직은 Amazon DataZone, Amazon SageMaker AI, Amazon Athena, Amazon Redshift를 활용하여 임상 및 유전체 데이터를 관리하고 분석해 왔습니다. 이제 Amazon SageMaker Catalog의 통합 거버넌스가 출시되어 매우 기쁩니다. 이를 통해 데이터 검색 및 액세스를 간소화하여 팀이 전체 도메인의 관련 데이터를 신속하게 분석할 수 있게 될 것입니다. 이러한 통합은 맞춤형 데이터세트를 생성하여 잠재적으로 인사이트를 얻는 시간을 단축하고 개인화된 유전자 검사를 진료의 표준 부분으로 만들겠다는 목표를 진전시켜 궁극적으로 환자 치료 결과를 개선하는 데 도움이 될 것입니다.”
Mirko Buholzer, Natera, Inc. VP of Software Engineering

NatWest
“저희 데이터 플랫폼 엔지니어링 팀은 데이터 엔지니어링, ML, SQL, 생성형 AI 태스크를 위한 최종 사용자 도구를 여럿 배포해 왔습니다. 은행 전반의 프로세스를 단순화하기 위해 사용자 인증 및 데이터 액세스 권한 부여를 간소화하는 방안을 모색하고 있습니다. Amazon SageMaker는 바로 사용 가능한 사용자 경험을 제공하여 조직 전체에 단일 환경을 배포하여 데이터 사용자가 새 도구에 액세스하는 데 필요한 시간을 약 50% 단축합니다.“
Zachery Anderson, NatWest Group CDAO

Amazon SageMaker Catalog 시작하기
오늘 원하는 내용을 찾으셨나요?
페이지의 콘텐츠 품질을 개선할 수 있도록 피드백을 보내 주세요.