Сериализация: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
См. также: Добавил JSON
"битовая последовательноcть" вместо "последовательность байтов"
 
(не показано 19 промежуточных версий 15 участников)
Строка 1: Строка 1:
'''Сериализация''' (в программировании) — процесс перевода какой-либо [[Список структур данных|структуры данных]] в последовательность [[бит]]ов. Обратной к операции сериализации является операция ''десериализации'' (структуризации) — восстановление начального состояния структуры данных из битовой последовательности.
'''Сериализация''' (в программировании) — процесс перевода [[Структура данных|структуры данных]] в битовую последовательность. Обратной к операции сериализации является операция ''десериализации'' (структуризации) — создание структуры данных из битовой последовательности.


Сериализация используется для передачи [[объект (программирование)|объектов]] по сети и для сохранения их в [[файл]]ы. Например, нужно создать распределённое [[Прикладное программное обеспечение|приложение]], разные части которого должны обмениваться данными со сложной структурой. В таком случае для типов данных, которые предполагается передавать, пишется код, который осуществляет сериализацию и десериализацию. Объект заполняется нужными [[Данные|данными]], затем вызывается код сериализации, в результате получается, например, [[XML]]-документ. Результат сериализации передаётся принимающей стороне, например, по [[Электронная почта|электронной почте]] или [[HTTP]]. Приложение-получатель создаёт объект того же типа и вызывает код десериализации, в результате получая объект с теми же данными, что были в объекте приложения-отправителя. По такой схеме работает, например, сериализация объектов через [[SOAP]] в [[Microsoft .NET]].
Сериализация используется для передачи [[объект (программирование)|объектов]] по сети и для сохранения их в [[файл]]ы. Например, нужно создать распределённое [[Прикладное программное обеспечение|приложение]], разные части которого должны обмениваться данными со сложной структурой. В таком случае для типов данных, которые предполагается передавать, пишется код, который осуществляет сериализацию и десериализацию. Объект заполняется нужными [[Данные|данными]], затем вызывается код сериализации, в результате получается, например, [[XML]]-документ. Результат сериализации передаётся принимающей стороне по, скажем, [[Электронная почта|электронной почте]] или [[HTTP]]. Приложение-получатель создаёт объект того же типа и вызывает код десериализации, в результате получая объект с теми же данными, что были в объекте приложения-отправителя. По такой схеме работает, например, сериализация объектов через [[SOAP]] в [[Microsoft .NET]].


== Применение ==
== Применение ==
Любой из схем сериализации присуще то, что кодирование данных последовательно по определению, и извлечение любой части сериализованной структуры данных требует, чтобы весь объект был считан от начала до конца и воссоздан. Во многих приложениях такая линейность полезна, потому что позволяет использовать простые интерфейсы ввода-вывода общего назначения для сохранения и передачи состояния объекта. В приложениях, где важна высокая производительность, может иметь смысл использовать более сложную, нелинейную организацию хранения данных.
Любой из схем сериализации присуще то, что кодирование данных последовательно по определению, и извлечение любой части сериализованной структуры данных требует, чтобы весь объект был считан от начала до конца и воссоздан. Во многих приложениях такая линейность полезна, потому что позволяет использовать простые интерфейсы ввода-вывода общего назначения для сохранения и передачи состояния объекта. В приложениях, где важна высокая производительность, может иметь смысл использовать более сложную, нелинейную, организацию хранения данных.


Сериализация предоставляет несколько полезных возможностей:
Сериализация предоставляет несколько полезных возможностей:
Строка 12: Строка 12:
* метод обнаружения изменений в данных, изменяющихся со временем.
* метод обнаружения изменений в данных, изменяющихся со временем.


Для наиболее эффективного использования этих возможностей необходимо поддерживать независимость от архитектуры. Например, необходимо иметь возможность надёжно воссоздавать сериализованный поток данных, независимо от [[порядок байтов|порядка байтов]], использующегося в данной архитектуре. Это значит, что наиболее простая и быстрая процедура прямого копирования участка памяти, в котором размещается структура данных, не может работать надёжно для всех архитектур. Сериализация структур данных в архитектурно-независимый формат означает, что не должно возникать проблем из-за различного порядка следования байт, механизмов распределения памяти или различий представления структур данных в языках программирования.
Для наиболее эффективного использования этих возможностей необходимо поддерживать независимость от архитектуры. Например, необходимо иметь возможность надёжно воссоздавать сериализованный поток данных независимо от [[порядок байтов|порядка байтов]], использующегося в данной архитектуре. Это значит, что наиболее простая и быстрая процедура прямого копирования участка памяти, в котором размещается структура данных, не может работать надёжно для всех архитектур. Сериализация структур данных в архитектурно-независимый формат означает, что не должно возникать проблем из-за различного порядка следования байт, механизмов распределения памяти или различий представления структур данных в языках программирования.


== Недостатки ==
== Сериализация массива в PHP ==
Сериализация нарушает непрозрачность абстрактного типа данных, потенциально раскрывая частные детали реализации. Тривиальные реализации, которые сериализуют все элементы данных, могут нарушать инкапсуляцию.
В PHP массив сериализируется с помощью функции serialize($array), где $array - это массив, а возвращаемое значение функции - текстовая строка. После этого строку можно заново превратить в массив с помощью функции unserialize($string), где - $string - сериализированный массив (строка), а возвращаемое значение функции - начальный массив.

Чтобы озадачить конкурентов в плане создания аналогичных продуктов, разработчики патентованного программного обеспечения часто держат детали форматов сериализации своих программ в секрете. Некоторые намеренно запутывают или даже шифруют сериализованные данные. Тем не менее, совместимость требует, чтобы приложения могли понимать форматы сериализации друг друга. Поэтому архитектуры удаленного вызова методов, такие как CORBA, детально задают свои форматы сериализации.


== Сериализация научных данных ==
== Сериализация научных данных ==
Строка 23: Строка 25:
* [[Маршалинг]]
* [[Маршалинг]]
* [[JSON]]
* [[JSON]]
* [[BSON]]


== Ссылки ==
== Ссылки ==
* [http://wiki.shelek.ru/index.php/C%2B%2B_%D1%81%D0%B5%D1%80%D0%B8%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85 Сериализация данных в C++.]
* [http://wiki.shelek.ru/index.php/C%2B%2B_%D1%81%D0%B5%D1%80%D0%B8%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85 Сериализация данных в C++.]
* [http://www.xakep.ru/post/51883/ Сериализация PHP-объектов глазами хакера]
* [https://xakep.ru/2010/04/22/51883/ Сериализация PHP-объектов глазами хакера]
* [https://cbor.io/ RFC 8949 Concise Binary Object Representation]


{{перевести|en|Serialization}}
{{перевести|en|Serialization}}

Текущая версия от 17:18, 11 августа 2022

Сериализация (в программировании) — процесс перевода структуры данных в битовую последовательность. Обратной к операции сериализации является операция десериализации (структуризации) — создание структуры данных из битовой последовательности.

Сериализация используется для передачи объектов по сети и для сохранения их в файлы. Например, нужно создать распределённое приложение, разные части которого должны обмениваться данными со сложной структурой. В таком случае для типов данных, которые предполагается передавать, пишется код, который осуществляет сериализацию и десериализацию. Объект заполняется нужными данными, затем вызывается код сериализации, в результате получается, например, XML-документ. Результат сериализации передаётся принимающей стороне по, скажем, электронной почте или HTTP. Приложение-получатель создаёт объект того же типа и вызывает код десериализации, в результате получая объект с теми же данными, что были в объекте приложения-отправителя. По такой схеме работает, например, сериализация объектов через SOAP в Microsoft .NET.

Применение

[править | править код]

Любой из схем сериализации присуще то, что кодирование данных последовательно по определению, и извлечение любой части сериализованной структуры данных требует, чтобы весь объект был считан от начала до конца и воссоздан. Во многих приложениях такая линейность полезна, потому что позволяет использовать простые интерфейсы ввода-вывода общего назначения для сохранения и передачи состояния объекта. В приложениях, где важна высокая производительность, может иметь смысл использовать более сложную, нелинейную, организацию хранения данных.

Сериализация предоставляет несколько полезных возможностей:

Для наиболее эффективного использования этих возможностей необходимо поддерживать независимость от архитектуры. Например, необходимо иметь возможность надёжно воссоздавать сериализованный поток данных независимо от порядка байтов, использующегося в данной архитектуре. Это значит, что наиболее простая и быстрая процедура прямого копирования участка памяти, в котором размещается структура данных, не может работать надёжно для всех архитектур. Сериализация структур данных в архитектурно-независимый формат означает, что не должно возникать проблем из-за различного порядка следования байт, механизмов распределения памяти или различий представления структур данных в языках программирования.

Недостатки

[править | править код]

Сериализация нарушает непрозрачность абстрактного типа данных, потенциально раскрывая частные детали реализации. Тривиальные реализации, которые сериализуют все элементы данных, могут нарушать инкапсуляцию.

Чтобы озадачить конкурентов в плане создания аналогичных продуктов, разработчики патентованного программного обеспечения часто держат детали форматов сериализации своих программ в секрете. Некоторые намеренно запутывают или даже шифруют сериализованные данные. Тем не менее, совместимость требует, чтобы приложения могли понимать форматы сериализации друг друга. Поэтому архитектуры удаленного вызова методов, такие как CORBA, детально задают свои форматы сериализации.

Сериализация научных данных

[править | править код]

Для научных наборов данных, имеющих большой объём, таких как данные, получаемые от спутников, или численные модели климата, погоды и океанов, были разработаны специальные бинарные стандарты сериализации, например HDF, netCDF и более старый GRIB.