Чтобы уменьшить требования к хранению информации, можно сжать таблицы и классы объектов файловой базы геоданных (вместе называемые в этом разделе наборами данных) в формат, предназначенный только для чтения. После сжатия скорость отображения данных и обработки запросов сопоставима со скоростью для несжатых данных. Вы можете заметить, что некоторые операции станут выполняться немного быстрее, а другие – немного медленнее.
Существует два типа сжатия, применимые к данным файловой базы геоданных: без потерь и с потерей качества. При использовании сжатия без потери качества информация не теряется независимо от системы координат и типов атрибутивных данных, содержащихся в базе классов объектов и таблиц. Все значения с плавающей точкой при этом сжатии будут сохранены. Сжатие с потерями позволяют получить на 20 процентов лучший результат для файловой базы геоданных, но значения с плавающей точкой будут изменены. Сжатие с потерей качества является хорошим вариантом в случае, если вам требуется максимальное сжатие ваших данных, точность которых не очень велика, либо вы не сильно беспокоитесь о сохранении максимальной точности своих данных, к примеру, вы выполняете сжатие географических данных масштаба 1:1 000 000 и мельче.
Сжатые данные отличаются от несжатых при редактировании: сжатый набор данных доступен только для чтения, и его нельзя отредактировать. Можно только его переименовать, изменить атрибутивные индексы и метаданные.
После сжатия набор данных выглядит в ArcCatalog и ArcMap так же, как и до сжатия. Помимо этого, ваша работа с набором данных будет проходить, не считая редактирования, точно так же. Сжатые данные имеют формат прямого доступа, так что для обеспечения доступа к ним вам не придется переводить их в несжатый формат: ArcGIS и ArcReader могут читать их напрямую.
Сжатие идеально подходит для наборов данных, не требующих дальнейшего редактирования. Однако, при необходимости восстановления исходного формата «чтение/запись» сжатые наборы данных могут быть всегда переведены в несжатый формат.
Сжатие данных в ArcMap
Можно сжать базу геоданных, набор классов объектов, отдельный класс пространственных объектов или таблицу.
Для сжатия файловой базы геоданных щелкните правой кнопкой базу геоданных в дереве Каталога, выберите Администрирование > Сжать файловую базу геоданных и нажмите OK.
Чтобы сжать набор векторных данных либо отдельный класс объектов или таблицу, щелкните ее правой кнопкой в дереве Каталога, выберите Управлять > Сжать файловую базу геоданных и нажмите OK.
При сжатии базы геоданных происходит сжатие всех классов пространственных объектов и таблиц, хранимых в ней. Точно так же, при сжатии набора классов объектов происходит сжатие всех содержащихся в нем классов пространственных объектов.
Вы также можете выполнить сжатие с помощью инструмента геообработки Сжать данные файловой базы геоданных и отменить сжатие с помощью инструмента Отменить сжатие данных файловой базы геоданных. Оба инструмента находятся в группе инструментов Файловая база геоданных набора Управление данными.
Сжатые класс объектов или таблица выглядят так же, как и до выполнения сжатия, а определить, что данные были сжаты, вы сможете, просмотрев список классов объектов и таблиц на вкладке ArcCatalog Содержание. Сжатые класс объектов или таблица содержат слово (сжатый) в столбце Тип.
Другим способом определения этого является открытие диалогового окна Свойства класса объектов или таблицы. На вкладке Общие указано, являются ли данные сжатыми.
Преимущества сжатия
Сжатые данные файловой базы геоданных занимают на диске меньше места, чем несжатые, но в то же время обеспечивают высокую производительность при отображении и обработке запросов.
Степень возможного сжатия данных классов пространственных объектов и таблиц может изменяться от незначительной до показателя, превышающего 4:1. Возможную степень сжатия определяют координаты, а также количество атрибутивных полей и их содержание.
Самым важным фактором, определяющим уровень сжатия, является число вершин, приходящихся на объект. Точечные объекты и простые линии с двумя вершинами сжимаются лучше, чем линии или полигоны с множеством вершин. Классы точечных объектов адресов или дорог с несколькими вершинами могут быть сжаты с отношением 3:1, в то время как класс объектов речной сети или данных о почвенном покрове с объектами, образованными большим количеством вершин, может быть сжат только с отношением 3:2. Объекты, состоящие из большого количества вершин, уже хранятся эффективно в несжатом формате, поэтому возможность их сжатия значительно меньше. Поля атрибутов также играют роль в определении уровня сжатия: поля с типом text и integer, а также поля с типом date сжимаются лучше, чем поля с типами float и double.
В расположенной ниже таблице сравниваются размеры файлов в сжатом и несжатом форматах. Класс пространственных объектов, который по сравнению с исходным размером был максимально сжат, – Europe places – является классом точечных объектов. Класс пространственных объектов, который по сравнению с исходным размером был сжат в минимальной степени, – Mexico roads – является классом линейных объектов, содержащим объекты, которые образованы большим количеством вершин.
Сравнение обычного и сжатого форматов
Класс пространственных объектов | Размер без сжатия | Размер со сжатием | Степень сжатия |
---|---|---|---|
Europe places (61541 точечных объектов, 14 полей) | 6,2 МБ | 0,67 МБ | 9.3 |
U.S. census blocks США (8205055 точечных объектов, 11 полей) | 705 МБ | 80 МБ | 8.8 |
California roads (2092079 линейных объектов, 29 полей) | 329 МБ | 60 МБ | 5.5 |
Europe rails (383531 линейных объектов, 12 полей) | 58 МБ | 9,7 МБ | 6.0 |
Calgary addresses (285,285 point features, 8 fields) | 21 МБ | 6,4 МБ | 3.3 |
Calgary buildings (319000 полигональных объектов, 9 полей) | 48 МБ | 20 МБ | 2.4 |
U.S. rivers and streams (2844231 линейных объектов, 9 полей) | 878 МБ | 288 МБ | 3.0 |
U.S. counties (3140 полигональных объектов, 57 полей) | 1,6 МБ | 0,8 МБ | 2.5 |
Europe water (232375 полигональных объектов, 10 полей) | 176 МБ | 70 МБ | 2.5 |
U.S. traffic analysis zones (166747 полигональных объектов, 10 полей) | 68 МБ | 35 МБ | 1.9 |
Mexico roads (5847 линейных объектов, 7 полей) | 3,5 МБ | 1,6 МБ | 2.2 |
Таблицы обычно сжимаются с отношением свыше 2:1. Таблицы обычно сжимаются с отношением, превышающим 2:1, причем повторы значений являются самым важным фактором: поля, значения которых при переходе от одной записи к другой часто не меняются, сжимаются лучше, чем поля с множеством уникальных значений. Как и в классе объектов текстовые, целочисленные поля и поля даты сживаются лучше, чем поля с плавающей точкой и поля двойной точности.
Несмотря на то, что вы можете сжимать данные любого размера, эффективнее всего использовать сжатие для больших объемов данных. Сжатие больших наборов данных или большого количества средних и небольших наборов данных может сэкономить вам значительный объем свободного дискового пространства, что может оказаться очень актуальным, если у вас имеется дефицит свободного места на диске или если вы пытаетесь уместить свои данные на один CD или DVD диск. Например, файловую базу геоданных переписи населения США размером 8,9 ГБ можно сжать до 3,4 ГБ – этого достаточно, чтобы она поместилась на DVD.
При минимизации требований к объему места на диске для хранения вы должны помнить о том, что сжатие файловой базы геоданных не является единственной находящейся в вашем расположении опцией. Если ваши данные хранятся с меньшим разрешением x,y, чем необходимо, то вы можете уменьшить объем, необходимый для хранения данных, перезагрузив данные перед сжатием с более крупным разрешением. Например, если у вас есть набор данных, хранящий по умолчанию информацию с разрешением 1/10 мм, но вы знаете, что точность данных составляет лишь 1 м, можно заново загрузить данные с метровым разрешением. Перезагрузка класса объектов зданий г. Калгари разрешения 1/10 мм в метровом разрешении уменьшит объем данных с 48 до 31 МБ. Дальнейшее сжатие класса пространственных объектов размером 31 Мб сократит размер данных до 12 МБ.
Влияние разрешения x,y на место на диске
Класс пространственных объектов | Размер без сжатия | Размер со сжатием |
---|---|---|
Calgary buildings, разрешение 0,0001 метра | 48 МБ | 20 МБ |
Calgary buildings, разрешение 1,0 метр | 31 МБ | 12 МБ |
Чтобы перезагрузить класс пространственных объектов с другим разрешением, вам необходимо экспортировать данные в новый класс пространственных объектов. Щелкните правой кнопкой класс объектов в дереве Каталога и выберите Экспорт > В базу геоданных (выберите команду Несколько для экспорта нескольких классов объектов одновременно). Задайте новое разрешение в диалоговом окне Параметры среды перед выполнением экспорта. Для получения более подробной информации см. Разрешение XY, Разрешение Z и Класс объектов в класс объектов.
Что вы можете сжать
Можно сжать базу геоданных, набор классов объектов, отдельный класс пространственных объектов или таблицу. При сжатии базы геоданных происходит сжатие всех классов пространственных объектов и таблиц, хранимых в ней. Точно так же, при сжатии набора классов объектов происходит сжатие всех содержащихся в нем классов пространственных объектов. Любой элемент, который не может быть сжат, будет пропущен. В представленной ниже таблице указаны элементы дерева Каталога, которые могут и не могут быть сжаты.
Данные файловой базы геоданных | Могут быть сжаты |
---|---|
База геоданных | Да (Все векторные классы пространственных объектов и таблицы в базе геоданных могут быть сжаты.) |
Класс пространственных объектов (только отдельные классы) | Да |
Набор пространственных данных | Да (Все векторные классы пространственных объектов в наборе классов объектов могут быть сжаты.) |
Геометрическая сеть | Да |
Набор сетевых данных | Да |
Набор данных участков | Нет |
Каталог растров | Нет |
Набор растровых данных | Нет |
Схема | Нет |
Набор геодезических данных | Нет |
Таблица | Да |
Набор данных Terrain | Нет |
Топологии | Да |
Вы не можете сжать или перевести в несжатый формат отдельный класс пространственных объектов в наборе классов объектов. Вы сжимаете и отменяете сжатие пространственного набора – то есть всех его объектов.
Сжатие наборов растровых данных и растровых каталогов фактически поддерживается ограниченным образом с помощью инструментов геообработки файловой базы геоданных: вы можете сжать отдельно один из наборов растровых данных, хотя это не рекомендуется делать, поскольку это не уменьшает объем памяти, необходимый для хранения. Эта поддержка предназначена исключительно, чтобы дополнительный модуль ArcGIS Publisher выполнял доступ к инструментам при упаковке наборов растровых данных и растровых каталогов файловой базы геоданных в сжатую форму и последующей их блокировки.
Ограничения при работе со сжатыми данными
Помимо возможности редактирования сжатого класса объектов или таблицы нельзя изменить следующие дополнительные свойства:
- Информация о системе координат
- Подтипы, атрибутивные домены и значения по умолчанию
- Поля и их свойства
- Представления
Единственными свойствами, которые могут быть изменены, являются псевдоним класса пространственных объектов или таблицы и атрибутивные индексы.
Сжатые наборы объектов позволяют добавлять несжатые классы объектов с использованием таких операций, как создание пустого класса объектов, копирование, вставка и импорт данных. Это приводит к появлению разнородной среды, когда некоторые классы пространственных объектов в наборе классов объектов сжаты, а некоторые – нет. Если набор классов объектов содержит и сжатые, и несжатые классы пространственных объектов, то вы не сможете редактировать несжатые классы пространственных объектов. Чтобы отредактировать класс пространственных объектов, вам придется перевести в несжатый формат все классы из набора классов объектов.
Можно сжимать классы пространственных объектов, участвующие в классах отношений, топологиях, геометрических сетях, наборах сетевых данных и наборах данных terrain. Однако для этих типов данных существуют следующие ограничения:
- Вы не можете создать топологию или геометрическую сеть на основе сжатых классов пространственных объектов.
- Если вы сжали одну «сторону» класса отношений, то независимо от того, когда вы это сделали, вы уже не сможете редактировать другую «сторону». Это происходит в связи с тем, что при обновлении несжатой «стороны» может потребоваться автоматическое обновление сжатой «стороны», которая хранится в формате «только для чтения».
- Вы не можете изменять параметры топологии, если ее классы пространственных объектов сжаты.
Класс отношений | Топология | Геометрическая сеть | Набор сетевых данных | Набор данных Terrain | |
---|---|---|---|---|---|
Позволяет сжимать их классы пространственных объектов | Да | Да | Да | Да | Да |
Позволяет создавать в них сжатые классы пространственных объектов | Да | Нет | Нет | Да | Да |
Позволяет редактировать свойства | Да | Нет | Да | Да | Да |