ファイル ジオデータベースにデータセットを作成する際には、データの格納方法をカスタマイズするためのコンフィグレーション キーワードを選択できます。各キーワードは、データの種類に合わせて格納方法を最適化し、格納効率とパフォーマンスを向上させます。使用可能なキーワードは 7 種類あります。これらのキーワードはカスタマイズできません。
フィーチャクラスまたはラスターをファイル ジオデータベース内に作成する際は、DEFAULTS キーワードを指定するのが一般的です。ほとんどの場合は、DEFAULTS で通用します。ただし、次のような場合だけは例外です。
- サイズが 1 TB を超える大容量のラスター データセットを格納する場合は、MAX_FILE_SIZE_256TB キーワードを指定してください。
- 非ラテン アルファベット (たとえば、中国語やアラビア語など) を使用する文字データを格納する場合は、TEXT_UTF16 キーワードを指定してください。
- テレイン データセットをファイル ジオデータベース内に格納する場合は、GEOMETRY_OUTOFLINE キーワードを指定してください。
- 大容量の BLOB 列も含むテレイン データセットを格納する場合は、GEOMETRY_AND_BLOB_OUTOFLINE キーワードを指定してください。
- あまりアクセスしない大容量の BLOB 列も含むフィーチャクラスを格納する場合は、BLOB_OUTOFLINE コンフィグレーション キーワードを指定してください。
コンフィグレーション キーワードを指定しない場合は、DEFAULTS が使用されます。
キーワード | データ ストレージに対する影響 |
---|---|
DEFAULTS | 最大 1 TB までのサイズのデータを格納します。 テキストは、UTF8 形式で格納されます。 |
TEXT_UTF16 | 最大 1 TB までのサイズのデータを格納します。 テキストは、UTF16 形式で格納されます。 |
MAX_FILE_SIZE_4GB | データ サイズを最大 4GB までに制限します。 テキストは、UTF8 形式で格納されます。 |
MAX_FILE_SIZE_256TB | 最大 256 TB までのサイズのデータを格納します。 テキストは、UTF8 形式で格納されます。 |
GEOMETRY_OUTOFLINE | 最大 1 TB までのサイズのデータを格納します。 テキストは、UTF8 形式で格納されます。 ジオメトリ属性を非空間属性とは異なるファイルに格納します。 |
BLOB_OUTOFLINE | 最大 1 TB までのサイズのデータを格納します。 テキストは、UTF8 形式で格納されます。 BLOB 属性をその他の属性とは異なるファイルに格納します。 |
GEOMETRY_AND_BLOB_OUTOFLINE | 最大 1 TB までのサイズのデータを格納します。 テキストは、UTF8 形式で格納されます。 ジオメトリおよび BLOB 属性をその他の属性とは異なるファイルに格納します。 |
テキストの格納:UTF8 と UTF16
UTF8 は、英語、西ヨーロッパ言語、その他ラテン アルファベットを使用する言語 (ポーランド語、トルコ語、インドネシア語など) のテキスト データを格納する場合に効率的な形式です。UTF8 は、アクセント記号なしのラテン文字を 1 バイトで格納し、アクセント記号付きの文字やラテン アルファベットに存在しない文字を 2 ~ 6 バイトで格納します。UTF8 はほとんどのテキスト文字を 1 バイトで格納するため、これらの言語では必要とする記憶領域が抑えられ、よいパフォーマンスが得られます。
UTF16 は、ラテン アルファベット以外のテキスト データ (中国語、日本語、韓国語、ロシア語、ギリシャ語、アラビア語) に最適な格納形式です。これらの言語では、1 文字に 2 バイト使用されます。UTF8 で同じ文字を表現した場合は最大で 6 バイトが使用されるため、これらの言語では必要となる記憶領域が増えるため、パフォーマンスが低下する場合があります。このテキスト格納方式を使用するには、TEXT_UTF16 キーワード (最大サイズは 1TB) を指定する必要があります。
MAX_FILE_SIZE_4GB
このキーワードを使用した場合、データのサイズが 4GB 未満に制限されますが、格納形式は、DEFAULTS キーワードよりも少し効率的になります。ただし効率化できるサイズはレコードにつき 1 バイト、100 万レコードにつき 1MB にとどまります。たとえば、カリフォルニア州のすべての道路 (2,092,079 レコード) を格納した場合、DEFAULTS キーワードでは 312MB、MAX_FILE_SIZE_4GB キーワードでは 310MB になります。
このキーワードは、データセットの最大サイズを 4GB に制限するため、フィーチャクラスまたはラスター データセットがこのサイズを超えないことがわかっている場合にのみ指定してください。
MAX_FILE_SIZE_256TB
MAX_FILE_SIZE_256TB キーワードを指定すると、最大サイズが 256TB のデータセットを作成することができます。通常は、大きなラスター データセットを格納する場合にのみ、このキーワードを指定します。
行内格納と行外格納
データを行内に格納すると、すべての属性が同じファイル内またはファイル ジオデータベース内の同じ仮想テーブル内に格納されます。行外に格納されたデータは、別のオブジェクト内に格納されます。
行内に保存されたデータはすべて、フィーチャクラスのクエリまたは編集時に、メモリにロードされます。そのため、フィーチャクラスが大量の格納領域を使用する属性を持つ場合、メモリへのロードに時間がかかり、メモリへ格納するためには大容量のバッファーが必要になります。
ジオメトリ属性タイプと BLOB 属性タイプは、大容量データを格納する可能性があります。たとえば、フィーチャクラス内の多くのフィーチャに数千もの頂点が格納されている場合は、ジオメトリを行外に格納することをお勧めします。また、属性データが大容量の場合 (複数のテキスト列または大容量 BLOB 列から構成されている場合)、ジオメトリを行外に格納することで、ジオメトリにアクセスする際に自動的に、すべての属性情報をメモリに取り込む必要がなくなります。ジオメトリ タイプまたは BLOB タイプの一方または両方を行外に格納した場合、アプリケーションから要求があったときにのみメモリにロードされます。たとえば、ArcMap で BLOB 値に基づいてフィーチャを選択した場合は、その BLOB 属性がメモリにロードされます。
フィーチャクラスに大容量 BLOB 属性が含まれている場合は、フィーチャクラスを作成する際に、BLOB_OUTOFLINE キーワードを指定してください。その結果、クエリを実行したときにのみ BLOB 属性がロードされるようになります。