このようにして、競争上の優位性を生み出すためにガバナンスが計画および実行され、摩擦のない包括的な方法でポリシーのコンプライアンス、セキュリティ、アクセシビリティ、およびユーザビリティに対処します。 これにより、リスクの集中管理を維持しながら、データの可用性が向上し、分散したチーム メンバーの使いやすさが向上します。 一般的なデータ ガバナンスの慣行はビジネスにハードルをもたらしますが、このモデルの混合により、これらのハードルを克服できる可能性があります。
どちらのデータ ガバナンス モデルにも課題があります
企業は、大規模なデータをクラウドで管理することに苦労しています。 意思決定者の約 4 分の 3 が 最近の Forrester Research の世論調査 クラウド内の組織のデータのほとんどをまだ管理していないと回答した。 約 80% は、大規模なデータを管理するのが難しいと言っています。 なんと 82% が、データ エコシステムにおける課題としてコストの予測と管理を挙げており、82% がデータ ガバナンス ポリシーの混乱が困難であると述べています。
一方、企業が管理しなければならないデータの量は急増しており、より多くのユーザーがより多くのアクセスを求めています。 Capital One Software の製品管理担当シニア ディレクターである Patrick Barch 氏は、次のように述べています。
組織は、このデータをより多くのビジネス チームがアクセスできるようにして、新しい洞察とより多くのビジネス価値を実現したいと考えています。 しかし、多くの企業は、クラウド内のデータの一元的なガバナンスの必要性 (包括的なガバナンスを保証しますが、データ アクセスのボトルネックになる可能性があります) と、事業部門がデータと分析をより詳細に制御およびアクセスできるようにする分散型モデルとのバランスを取ることに苦労しています。 ただし、分散化には独自の欠点があります。 チームが異なれば、ガバナンス ポリシーが一致しない場合もあります。 特定のデータまたはデータの種類がサイロに閉じ込められ、すべての人が利用できるわけではありません。 機械学習エンジニアは、高度な分析ツールを構築するために必要なデータにアクセスできない場合があります。
「チームは、選択したデータとツールに完全かつ瞬時にアクセスできることを望んでいます」と Barch 氏は言います。 「大きなボトルネックになったり、大量のデータ エンジニアを雇わなければ、すべてを一元的に管理することはできません。重大なデータ リスクを負うことなく、管理責任を完全に分散化することもできません。」
両方の長所
ただし、データ管理のフェデレーションを通じて、集中型アプローチと分散型アプローチを組み合わせて、データ ガバナンスの新しいモデルにする方法があります。 そうすることで、企業はそれぞれのメリットをデメリットなしで実現できます。
たとえば、Capital One はこのモデルを採用し、同社はデータセンターを閉鎖して運用をパブリック クラウドに移行しました。 同社はクラウド データ ウェアハウスを実装して、ビジネス チームがデータを広く利用できるようにしましたが、データ ガバナンスに注意を払う必要があることに気付きました。
「優れたガバナンス管理がなければ、ポリシー管理のリスクがあるだけでなく、意図したよりもはるかに多くのお金をはるかに速く費やすリスクもあります」とバーチは言います。 「データの価値を最大化するには、特にそのデータの量と種類が拡大するにつれて、データの公開、データの消費、管理などの活動に関与するさまざまな利害関係者を可能にする、組み込みのガバナンスを備えた統合されたエクスペリエンスを作成する必要があることを知っていました。データと基盤となるインフラストラクチャを管理し、すべてがシームレスに連携します。」