Bitemporal Data Modelについて

データベース

概要

Bitemporal Data Modelについて調べたことをまとめる。

Bitemporal Data Modelとは

Temporal Data Modelsという分野で扱われるデータモデルの1つで、時間軸を取り扱うデータモデルのうち、2つの時間軸を持つデータモデルのことを指す。

  • ノンテンポラル(Non-Temporal)
    • 現在の状態のみを保持する
    • 過去の履歴や将来の変更に関する情報は保持しない
  • ユニテンポラル(Uni-Temporal)
    • 単一の時間軸を持つ
    • データが有効である開始日と有効期間が終了する終了日を保持する
  • バイテンポラル(Bi-Temporal)
    • 2つの時間軸を持つ
    • データベースに記録された時間であるトランザクション時間(システム時間)と、イベントが発生した時間である有効時間を保持する
    • ユニテンポラルは、トランザクション時間と有効時間が同じであるのに対し、バイテンポラルは異なる時間軸を持つ

バイテンポラルデータモデルが採用される背景としては次のような要件が考えられる。

  • データの変更履歴の追跡
  • 法規制や監査要件
  • 時系列分析の柔軟性向上

バイテンポラルなデータモデルをRDBで扱う場合、次のような難しさが伴う。

  • データの一貫性の保証
    • 同一のエンティティに対して、有効時間が重複しないように制約を持たせる必要がある
    • トランザクション時間の連続性を保つ必要がある
    • PostgreSQLでは、排他制約(EXCLUDE制約)が使えるため、有用である
  • クエリの複雑さ
    • 有効時間とトランザクション時間の両方を考慮したクエリを発行する必要がある
      • 複雑化しやすいためパフォーマンスチューニングも難しくなる
  • アプリケーションロジックの複雑さ
    • データの取得、更新、削除の際に意識する時間軸が2つある
    • ロジックに一貫性を持たせるように実装する必要がある

過去の履歴を参照したり、過去や未来の履歴を追加したり、履歴自体の更新情報を残したり、履歴情報の柔軟性を持つことができるデータモデルであるが、実現するためには複雑さを覚悟する必要がある。(と感じた・・)

所感

今まで業務で柔軟性の高い履歴データを扱ったことがなかったので、履歴の扱いの世界に深いものを感じた。

参考