やさしい AIF(ドメイン 5)

記事タイトルとURLをコピーする

おなかが痛くてもコーヒーは飲む、近藤恭平です。

前回は責任ある AI の原則・バイアス・透明性・人間中心の AI を整理しました。今回は、AI システムを守るためのセキュリティ・ガバナンス・コンプライアンスの実装方法を解説します。試験ガイドのドメイン5に対応した内容です。


AI システムを保護する

ここで紹介するサービスは AI システムに限定されない、AWS 上のシステム全般に共通するセキュリティの基盤でもあります。AI の文脈では「トレーニングデータの保護」「モデルへのアクセス制御」「推論ログの監査」といった用途で活用されます。

アクセス制御:IAM と SageMaker Role Manager

AI システムへのアクセス制御の基本は IAM(Identity and Access Management)です。誰が・何に・何をできるかを最小権限の原則に基づいて定義します。

ML ワークロード特有の複雑なロール設計を簡素化するサービスが Amazon SageMaker Role Manager です。

  • 機械学習のユースケースごとに適切な IAM ロールをテンプレートから作成できます
  • あらかじめ用意されたペルソナ(データサイエンティストMLOps エンジニアSageMaker コンピューティング)を選択することで、必要な権限セットを素早く構築できます

監査ログ:AWS CloudTrail

AWS CloudTrail は、AWS アカウント内で行われたすべての API 呼び出しを記録するサービスです。

  • 誰が・いつ・何の操作をしたかを証跡として保管します
  • ログは指定した S3 バケットに自動配信されます
  • モデルの推論エンドポイントへのアクセスや、S3 上のトレーニングデータへの操作を監査する際に活用します

機密データの検出:Amazon Macie

Amazon Macie は、S3 バケット内の機密データを機械学習で自動検出するサービスです。

  • PII(個人識別情報)・認証情報・財務データなどを特定します
  • トレーニングデータセットに機密情報が混入していないかの確認にも活用できます

データの品質管理と統合

AI の精度はデータ品質に直結します。AWS はデータのキュレーション・統合・管理を支援するサービス群を提供しています。

サービス 役割
AWS Glue データの ETL(抽出・変換・ロード)を担うサーバーレスサービス
AWS Glue Data Catalog データセットのメタデータを一元管理するリポジトリ。データの場所・スキーマ・属性を保存する
AWS Glue Data Quality データ品質ルールを提案・適用し、異常を自動検出する
AWS Glue DataBrew ノーコードでデータのプロファイリング・クレンジング・変換を行うビジュアルツール
AWS Lake Formation サイロ化されたデータを集約し、データレイクとして統一管理する。きめ細かいアクセス制御も提供する

バージョン管理とモデルガバナンス

ML システムは「コード」だけでなく、データ・モデル・実験結果すべてのバージョン管理が必要です。

管理対象 内容
コード Git などのバージョン管理システムで管理
データセット S3 のバージョニングや Feature Store で管理
コンテナ ECR(Amazon Elastic Container Registry)でイメージを管理
トレーニングジョブ・モデル・エンドポイント SageMaker の実験管理機能で追跡

SageMaker はモデルガバナンスを支援する専用サービスも提供しています。

サービス 役割
SageMaker Model Cards モデルの目的・性能・バイアス評価・使用制限を文書化・共有する
SageMaker ML Lineage Tracking データからモデル・エンドポイントまでの系譜(リネージ)を自動追跡し、ガバナンスの確立とワークフローの再現を支援する
SageMaker Feature Store 特徴量をオンライン・オフライン両方で管理・再利用できるリポジトリ
SageMaker Model Dashboard デプロイ済みモデルのパフォーマンス・品質・ドリフトを一元的に監視するポータル

コンプライアンス規制と AI ガバナンスフレームワーク

AWS Artifact

Artifact のコンソール画面で SOC でフィルタリングした例

AWS Artifact は、AWS のコンプライアンスプログラムに関する認定文書(SOC レポート・ISO 証明書・PCI DSS など)をオンデマンドで取得できるサービスです。規制対応の証跡として活用します。

主な AI コンプライアンス標準

標準 内容
ISO 42001 AI マネジメントシステムの国際標準。AI の責任ある開発・運用のための要件を定める
ISO 24894 機械学習に特化したガバナンスのガイドライン
NIST AI Risk Management Framework(RMF) 米国国立標準技術研究所が策定した AI リスク管理の枠組み。ガバナンス・マッピング・測定・管理の4機能で構成される

EU AI Act(EU 人工知能規制法)

EU が制定した AI に関する包括的な規制法です。AI システムをリスクレベルで分類し、規制の強度を変えています。

リスクレベル 内容
容認できないリスク 完全禁止 公共空間でのリアルタイム生体認証、社会スコアリング
高リスク 法的要件の対象(透明性・説明可能性・人間の監視が義務) 採用・融資審査・重要インフラ管理に使用する AI
限定リスク 透明性の開示義務 チャットボット(AI であることを明示する義務)
最小リスク 規制なし スパムフィルタ・AIゲーム

Algorithmic Accountability Act(アルゴリズム責任法)

米国で提案されている、AI システムの説明可能性と公正性を企業に求める法律です。

  • ローン申請が却下された場合、申請者はその理由を知る権利を持ちます
  • 「生成 AI を使用しており人間が介在していない」といった説明では不十分とされ、入力と出力に基づいたモデルの挙動の説明が求められます

AWS のコンプライアンス・ガバナンスツール

Amazon Bedrock Guardrails

Amazon Bedrock Guardrailsは、生成 AI アプリケーションに対して有害コンテンツのフィルタリング・トピック制限・PII のマスキングを実装するサービスです。責任ある AI の実装を技術的に担保します。

Guardrails については以下の記事もご参照ください。

blog.serverworks.co.jp

blog.serverworks.co.jp

AWS Audit Manager

AWS Audit Manager は、AWS の使用状況を継続的に監査してコンプライアンス評価を自動化するサービスです。コンプライアンスフレームワーク(GDPR・HIPAA 等)に対応した証跡を自動収集します。

AWS Config

AWS Config は、AWS リソースの構成変更をリアルタイムで記録・評価するサービスです。

  • 現在のリソース設定のインベントリを管理します
  • 設定変更を自動でキャプチャし、定義したルールに照らして評価します
  • 非準拠のリソースは AWS Config Automation で自動修復することも可能です
  • コンフォーマンスパックを使用すると、セキュリティベストプラクティスに沿った評価ルール群を一括適用できます

Amazon Inspector

Amazon Inspector は、EC2 インスタンス・コンテナ・Lambda 関数に対してアプリケーションレベルの脆弱性評価を自動実行するサービスです。AI システムを動かすインフラのセキュリティ担保に活用します。

AWS Trusted Advisor

AWS Trusted Advisor は、AWS 環境全体を以下の5つの観点でチェックし、改善アクションを推奨するサービスです。

  • コスト削減パフォーマンス向上セキュリティ向上耐障害性サービスの制限

データガバナンス戦略

AI システムのデータガバナンスを円滑に機能させるには、技術的な仕組みを整えるだけでなく、組織内での役割を整理しておくことが有効なアプローチとなります。

役割 責任
データ所有者 データの品質・セキュリティ・利用ポリシーに対する最終責任を持つ
データスチュワード データ所有者の方針に従い、日常的なデータ品質管理・メタデータ整備を担う
IT 部門 データパイプライン・ストレージ・アクセス制御などインフラ面を担当する

また、データリネージ(データがどこから来て、どのように変換・加工されてきたかの系譜)を追跡できるようにすることが、AI ガバナンスポリシーの整備において重要です。


2021年4月新卒入社。目に見えて、動かせるものが好き。