概要
次世代の Amazon SageMaker は、レイクハウス、AI モデル、アプリケーション全体にわたるデータや AI の検出、ガバナンス、コラボレーションを簡素化します。Amazon DataZone 上に構築された Amazon SageMaker Catalog では、ユーザーが生成 AI 作成のメタデータを用いたセマンティック検索を使用して承認されたデータやモデルをセキュアに検出してアクセスすることができ、Amazon Q Developer にデータを見つけるよう自然言語で指示することも可能です。ユーザーは、Amazon SageMaker Unified Studio できめ細かなアクセスコントロールを備えた単一の許可モデルを一元的に使用して、アクセスポリシーを一貫した方法で定義および適用できます。簡単なパブリッシュとサブスクライブのワークフローを通じて、データと AI アセットをシームレスに共有し、コラボレーションできます。SageMaker では、Amazon Bedrock のガードレールを使用して AI モデルを保護するとともに、責任ある AI ポリシーを実装することができます。データ品質の監視とオートメーション、機密データの検出、データと機械学習 (ML) のリネージを通じて、組織全体で信頼性を築きましょう。
Amazon SageMaker Catalog の実際の動作をご覧ください

利点
特徴
コンテキストと検索可能性を考慮して精選されたデータ
SageMaker Catalog は、ビジネスコンテキストをテクニカルメタデータに取り込み、データをビジネスコンテキストで充実させることを可能にします。すべてのユーザーが迅速かつ容易にデータを見つけ、理解し、信頼できるように、ビジネスコンテキストとともにデータを表示することができます。
メタデータの自動推奨
データへのビジネス内容や名前の追加を自動化します。これは、コンテキストを理解しやすくすると同時に、わかりにくい技術的な名前に対処する必要をなくします。この自動化は、精度と一貫性を高めるために大規模言語モデル (LLM) によって強化されています。
すべてのアプリケーションで一貫したレベルの AI 安全性を実現
Amazon Bedrock のガードレールは、ユースケース固有のポリシーに基づいてユーザー入力と基盤モデル (FM) 応答を評価するために役立ち、基盤となる FM が何であるかにかかわらず、追加の保護レイヤーを提供します。
モデルの迅速な監査と追跡
統合されたビューを通じて、すべてのモデル、エンドポイント、モデルモニタリングジョブのパフォーマンスの監査とラブルシューティングを迅速に実行します。予想されるモデル動作からの逸脱や、欠落または非アクティブ状態のモニタリングジョブの追跡には、自動化されたアラートを使用します。
データ品質
データ品質に関する統計情報を使用すると、データの利用者は AWS またはサードパーティーのシステムからのデータ品質に関するメトリクスを確認できます。データの利用者は、意思決定に使用するデータソースを信頼して、アセットを検索する際にデータ品質のコンテキストを把握することができます。また、データプロデューサーや IT チームは、API を使用してサードパーティーシステムからのデータ品質に関する統計情報をコンソール外の統合ポータルに組み込むことも可能です。
データと ML リネージ
時間の経過に合わせてデータとモデルの動きを把握できます。リネージは、データがどこから来たのか、どのように変化したのか、どのように利用されているのかをデータ利用者が理解できるようにすることで、信頼性と組織のデータと AI のリテラシーを高めるのに役立ちます。データ、AI アセット、およびそれらの関係のマッピング、パイプラインのトラブルシューティングと開発、データと AI ガバナンスの慣行のアサーションに費やす時間を短縮できます。
お客様
CISCO
「データを発見、共有、管理したいとお思いでしょうか。データメッシュと呼ぶかデータファブリックと呼ぶかにかかわらず、データはさまざまなチームにまたがって複数のサイロに分散して存在し、データをまとめる方法が必要となります。Amazon SageMaker Catalog はデータプロデューサーとコンシューマーをつなぐので、プロデューサーは組み込みのコントロールやデータコントラクトでデータを共有できると同時に、消費者は好きなツールを使用してデータにアクセスできるようになります」
Cisco、Sr.Director AI/ML、Shaja Arul Selvamani 氏

Natera, Inc
「私たちの組織は、Amazon DataZone、Amazon SageMaker AI、Amazon Athena、Amazon Redshift を活用して、臨床データとゲノムデータを管理および分析してきました。Amazon SageMaker Catalog のガバナンスが統一されたことを嬉しく思います。これにより、データの検出とアクセスが合理化され、チームがドメイン全体の関連データを迅速に分析できるようになります。この統合は、カスタマイズされたデータセットの作成に役立ち、インサイトを得るまでの時間を短縮できる可能性があります。また、個別化された遺伝子検査を標準治療の一部にするという目標を前進させる中で、最終的には患者の治療効果を改善することができます」
Natera, Inc.、VP of Software Engineering、Mirko Buholzer 氏

NatWest
「当社の Data Platform Engineering チームは、データエンジニアリング、ML、SQL、生成 AI のタスク用に複数のエンドユーザーツールをデプロイしてきました。銀行全体のプロセスを簡素化するために、ユーザー認証とデータアクセス承認の合理化を検討してきました。Amazon SageMaker は既製のユーザーエクスペリエンスを提供してくれるので、組織全体に 1 つの環境をデプロイでき、データユーザーが新しいツールにアクセスするのに必要な時間を約 50% 短縮できます」
NatWest Group、CDAO、Zachery Anderson 氏

Amazon SageMaker Catalog の使用を開始する
今日お探しの情報は見つかりましたか?
ぜひご意見をお寄せください。ページのコンテンツ品質の向上のために役立てさせていただきます。