При создании набора данных в файловой базе геоданных вы можете выбрать ключевое слово конфигурации для настройки способа хранения данных. Каждое ключевое слово оптимизирует процесс хранения для конкретного типа данных, слегка улучшая эффективность и производительность работы. Доступно семь ключевых слов. Их нельзя настроить.
В большинстве случаев вы будете использовать ключевое слово DEFAULTS при создании класса пространственных объектов или растра в файловой базе геоданных. Ключевое слово DEFAULTS работает, как правило, отлично, за исключением тех ситуаций, когда
- вам нужно хранить очень большой набор растровых данных, который занимает более 1 ТБ.В такой ситуации вам было бы лучше определить ключевое слово MAX_FILE_SIZE_256TB.
- Если вы храните данные с символами не-латинского алфавита (китайский или арабский, например), укажите ключевое слово TEXT_UTF16.
- Если вы храните наборы данных terrain в файловой базе геоданных, укажите ключевое слово GEOMETRY_OUTOFLINE.
- Если вы храните наборы данных terrain, и там еще есть столбцы BLOB, укажите ключевое слово GEOMETRY_AND_BLOB_OUTOFLINE.
- Если вы храните класс пространственных объектов со столбцами BLOB, к которым часто обращаетесь, укажите ключевое слово конфигурации BLOB_OUTOFLINE.
Если вы не определили никакое ключевое слово конфигурации, то будет использоваться DEFAULTS.
Данное ключевое слово | Влияет на хранение данных |
---|---|
DEFAULTS | Хранит данные размером до 1 ТБ Текст хранится в формате UTF8. |
TEXT_UTF16 | Хранит данные размером до 1 ТБ Текст хранится в формате UTF16. |
MAX_FILE_SIZE_4GB | Ограничение на размер данных 4 Гб Текст хранится в формате UTF8. |
MAX_FILE_SIZE_256TB | Сохраняет данные размером до 256 TB Текст хранится в формате UTF8. |
GEOMETRY_OUTOFLINE | Хранит данные размером до 1 ТБ Текст хранится в формате UTF8. Сохраняет атрибуты геометрии в файле отдельно от непространственных атрибутов |
BLOB_OUTOFLINE | Хранит данные размером до 1 ТБ Текст хранится в формате UTF8. Сохраняет атрибуты BLOB в файле отдельно от остальных атрибутов |
GEOMETRY_AND_BLOB_OUTOFLINE | Хранит данные размером до 1 ТБ Текст хранится в формате UTF8. Сохраняет атрибуты геометрии и BLOB в файлах отдельно от прочих атрибутов |
Хранение текста: UTF8 по сравнению с UTF16
UTF8 является самым лучшим форматом хранения в том случае, если у вас имеются текстовые данные на английском, ином западноевропейском языке или на любом другом языке, в котором используется латинский алфавит, например, польский, турецкий или индонезийский. UTF8 хранит каждый латинский символ без диакритического знака (например, знака подчеркивания или ударения) с помощью 1 байта, а каждый диакритический или любой другой символ, которого нет в латинском алфавите, с помощью нескольких байтов, от 2 до 6. Поскольку UTF8 хранит большую часть текстовых символов с помощью 1 байта, то он обеспечивает меньший размер данных и улучшенную производительность при работе с данными на этих языках.
UTF16 является наиболее эффективным форматом хранения текстовых данных на языках, использующих алфавит, отличный от латинского:китайский, японский, русский, греческий или арабский. Для этих языков в данном формате на один символ приходится 2 байта. Для представления того же самого символа в формате UTF8 может потребоваться до 6 байт, что приведет к увеличению размеров данных и несколько снизит производительность в работе с данными на этих языках. Данный метод хранения текста доступен только с ключевым словом TEXT_UTF16, который имеет ограничение в размере на 1 ТБ.
MAX_FILE_SIZE_4GB
Данное ключевое слово обеспечивает несколько лучшее хранение наборов данных размером меньше 4 ГБ, чем ключевое слово DEFAULTS, хотя размеры экономии сравнительно незначительны:на каждой записи будет экономиться 1 байт, т.е. около 1 МБ для миллиона записей. Например, класс объектов всех дорог Калифорнии (2092079 записей) занимает 312 МБ при использовании ключевого слова DEFAULTS и 310 МБ при использовании ключевого слова MAX_FILE_SIZE_4GB.
Данное ключевое слово устанавливает для набора данных ограничение на максимальный размер в 4 ГБ, так что вам следует определять это ключевое слово только в том случае, если вы уверены, что класс пространственных объектов и набор растровых данных никогда не будут занимать больше 4 ГБ.
MAX_FILE_SIZE_256TB
Определение ключевого слова конфигурации MAX_FILE_SIZE_256TB позволит вам создать набор данных, который может занимать до 256 ТБ. Вы могли бы использовать это ключевое слово только для хранения очень больших наборов растровых данных.
Вложенное (In-line) хранение и связанное (out-of-line) хранение
Вложенное хранение данных означает хранение всех атрибутов объекта в одном файле или в одной виртуальной таблице файловой базы геоданных. Когда вы храните данные в связанном режиме, они будут храниться в отдельном месте.
Если все данные хранятся во вложенном состоянии, они будут загружаться в память при выполнении запросов или редактировании класса объектов. Таким образом класс объектов, которых хранит большие объемы информации в атрибутах будет занимать больше дискового пространства и потреблять больше памяти для обработки.
Атрибуты типа Геометрия (Geometry) и BLOB потенциально могут хранить большие объемы данных. Например, если много объектов в классе объектов состоят из тысяч вершин, то возможно вам потребуется хранить информацию о геометрии объектов в связанном режиме в другом файле. Или, если данные в атрибутах занимают много дискового пространства (например, состоят из нескольких полей с текстом или больших объектов BLOB в полях атрибутов), вы, возможно, захотите хранить геометрию объектов в отдельном файле, чтобы автоматически не загружать большие объемы данных в память компьютера. Если вы храните и геометрию и данные типа BLOB в отдельных файлах, они будут загружены в память только при обращении к ним. Например, если вы выбираете объекты в ArcMap на основе значений типа BLOB, атрибуты BLOB будут загружены в память.
Если класс объектов содержит большие объемы данных в атрибутах типа BLOB, вы можете указать ключевое слово BLOB_OUTOFLINE при создании класса объектов. Тогда атрибуты типа BLOB будут загружаться только при запросе к ним.