ケーブルを覚える、メールボックスに届いていた電話とインターネットのコンボ オファーは? これらのオファーは変換用に高度に最適化されており、オファーの種類と月額料金は、隣接する 2 つの家屋や同じ建物内のコンドミニアム間でも大きく異なる可能性があります。
私は以前データ エンジニアであり、この種のオファーの最適化のために抽出、変換、ロード (ETL) データ パイプラインを構築していたので、これを知っています。 私の仕事の一部には、暗号化されたデータ フィードのアンパック、データが欠落している行または列の削除、フィールドの内部データ モデルへのマッピングが含まれていました。 次に、統計チームは、クリーンで更新されたデータを使用して、各世帯に最適なオファーをモデル化しました。
それはほぼ10年前のことです。 現在、そのプロセスを 100 倍の規模のデータセットに合わせて強化して実行すると、現在中規模および大規模の組織が扱っている規模に到達できます。
データ分析プロセスの各ステップは、混乱の機が熟しています。
たとえば、1 回のビデオ会議通話で、何百ものストレージ テーブルを必要とするログが生成される可能性があります。 手頃な価格で入手できる無制限のストレージとスケーラブルなコンピューティング リソースにより、クラウドはビジネスのやり方を根本的に変えました。
簡単に言えば、これが古いスタックと最新のスタックの違いです。
今日のデータ リーダーが最新のデータ スタックを気にかけているのはなぜですか?
セルフサービス分析
シチズン開発者は、重要なビジネス ダッシュボードにリアルタイムでアクセスしたいと考えています。 彼らは、運用データと顧客データに基づいて構築されたダッシュボードを自動的に更新することを望んでいます。
たとえば、製品チームは、リアルタイムの製品使用状況と顧客更新データを意思決定に使用できます。 クラウドにより、誰でもデータに真にアクセスできるようになりますが、従来の静的なオンデマンド レポートやダッシュボードと比較して、セルフサービス分析が必要です。