データレイク

でーたれいく

生データをそのまま貯める保管層。

  • #data
  • #lake

構造化・非構造化を問わず生データをそのまま保管する仕組み。ストレージとコンピュートを分離した設計と相性が良く、スキーマオンリードで柔軟に分析できる。ガバナンスとカタログ管理が無いと沼化(swamp)するリスクがある。