今回は、Silverの「S3 開発/SQL - S3.1 SQL コマンド(パーティション)」からの出題です。
※この例題は実際のOSS-DB技術者認定試験とは異なります。
例題公開日:2019年5月15日
パーティショニングはデータベースの性能向上を図る手法の一つで、巨大なテーブルを複数の小さなテーブルに分割することで、データアクセスの効率化を図るものです。
PostgreSQLでは以前から継承(インヘリタンス)を利用したパーティショニングをサポートしていましたが、PostgreSQL
バージョン10からは宣言的パーティショニングによるパーティションテーブルをサポートしています。
宣言的パーティショニングでは、元となるテーブルを
CREATE TABLE テーブル名(列定義) PARTITION BY…
のようにPARTITION BY句をつけて作成します。各パーティションは CREATE TABLE パーティション名 PARTITION OF テーブル名 FOR VALUES… のようにして作成し、FOR VALUESでどういうデータをそのパーティションに入れるのかを指定します。
例えば長年の売上データに関する巨大なテーブルがあるとして、その直近1ヶ月のデータを分析することを考えたとき、おそらくはWHERE句で指定した日付の指定に従ってインデックスを利用した検索が行われることでしょう。期間を限定してもそのデータ自体は巨大なテーブルのあちこちに散らばっているのが普通ですから、大量のデータページを読み取る必要があります。
ここで、例えば売上の月ごとにパーティションを作り、各月のデータをそのパーティションに格納することができます。そうすると、直近1ヶ月の売上データを分析する場合は、特定のパーティションだけを読み取れば良いことになりますから、読み取るべきデータページ数を大幅に減らすことができますし、場合によってはインデックスを使わずにパーティション内をフルスキャンすることで大きく性能向上を図れる可能性もあります。
パーティション単位で配置先のテーブルスペースを指定できますので、頻繁にアクセスする行の集合(パーティション)とそうでないパーティションを別のディスク領域に配置し、コストと性能の最適化を図ることも可能です。なお、列ごとに別のテーブルスペースに配置することはできませんので、そのような場合はテーブル自体を別にして、必要に応じてビューの機能などを使います。
例えば10年前のデータを一括削除したい、という場合は、そのデータが含まれるパーティションをDROP TABLEで削除することでそれに代えることができます。パーティションの機能を使っていないテーブルで大量データを一括削除する場合、内部的には対象行が含まれる各データページを更新する必要があり、さらにVACUUM処理も発生しますので、性能的に大きな差があります。
なお、個々のパーティションには通常のテーブルと同じデータが含まれますから、パーティション全体のデータサイズは、1つの巨大なテーブルに全データを格納する場合と変わりません。
従って、正解はB、C、Eです。
今回の解説について、理解できないポイントがあればどんどん質問をお寄せ下さい。
採用になった方にはLPI-Japanオリジナルの記念品を贈呈します。
※試験問題に関わるお問い合わせにつきましては、LPI-Japan事務局ではお応えできませんのでご了解ください。
© EDUCO All Rights Reserved.