Tarantool: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
м Бот: добавление заголовков в сноски; исправление двойных сносок, см. ЧаВо
Строка 74: Строка 74:
* RTREE (многомерное R*-дерево, только для memtx) — для быстрого поиска ближайших соседей (KNN) и точек в заданных многомерных параллелепипедах с заданными функциями расстояния между двумя точками.
* RTREE (многомерное R*-дерево, только для memtx) — для быстрого поиска ближайших соседей (KNN) и точек в заданных многомерных параллелепипедах с заданными функциями расстояния между двумя точками.


В качестве формата хранения и протокола передачи данных используется MessagePack.
В качестве формата хранения и протокола передачи данных используется [[MessagePack]].


База данных поддерживает асинхронную репликацию. Репликация может быть выполнена в виде мастер-мастер.
База данных поддерживает асинхронную репликацию. Репликация может быть выполнена в виде мастер-мастер.

Версия от 12:48, 31 января 2019

Tarantool
Тип NewSQL
Автор Mail.Ru Group
Разработчик ВК
Написана на Си
Операционные системы Linux, FreeBSD, OS X
Первый выпуск 2008
Последняя версия 1.10.2 (2018-10-13)
Тестовая версия 2.1.1
Репозиторий github.com/tarantool/tar…
Лицензия Упрощенная BSD
Сайт tarantool.io

Tarantool представляет собой решение с открытым исходным кодом, совмещающее систему управления базой данных и неблокирующий сервер приложений на Lua.

База данных обладает высокой скоростью работы по сравнению с традиционными СУБД, обладая теми же свойствами: персистентности, транзакционности ACID, репликации master-slave, master-master.

Обзор

СУБД

Язык запросов:

  • SQL
  • документо-ориентированные запросы на языке Lua

Технологии хранения данных:

  • memtx - хранение всех данных в оперативной памяти, с дисковыми снимками данных и логом транзакций
  • vinyl - хранение данных на жестком диске, с оптимизацией для быстрой вставки данных

Единицей хранения является кортеж (tuple или строка). Кортеж состоит из одного и более полей.

Поля могут быть одного из следующих типов:

Скалярный/составной тип MsgPack тип Lua Пример
скалярный nil «nil» msgpack.NULL
скалярный булевый «boolean» true
скалярный строковый «string» "A B C"
скалярный целочисленный «number» 12345
скалярный с плавающей точкой двойной точности «number» 1.2345
составной ассоциативный массив «table» со строковыми ключами {"a": 5, "b": 6}
составной массив «table» с числовыми ключами [1, 2, 3, 4, 5]
составной массив байт «cdata»


Кортежи организованы в пространства (space или таблицы). Для каждого пространства указывается технология хранения (memtx или vinyl).

Пространство должно быть проиндексировано первичным ключом. Также поддерживаются неограниченное количество вторичных ключей.

Ключ может состоять из одного и более полей.

Поддерживаемые индексы:

  • TREE (дерево) — для быстрого поиска значений и возможности итерации.
  • HASH (хеш-таблица, только для memtx) — для еще более быстрого поиска значений.
  • BITSET (битовая маска, только для memtx) — возможность поиска по битовым маскам.
  • RTREE (многомерное R*-дерево, только для memtx) — для быстрого поиска ближайших соседей (KNN) и точек в заданных многомерных параллелепипедах с заданными функциями расстояния между двумя точками.

В качестве формата хранения и протокола передачи данных используется MessagePack.

База данных поддерживает асинхронную репликацию. Репликация может быть выполнена в виде мастер-мастер.

Для разделения доступа используется традиционная модель ACL. У каждого объекта есть владелец имеющий неограниченный доступ. Владелец может предоставить доступ к объекту другим пользователям или ролям. Роль это в свою очередь группа пользователей.

Список разграниченных действий:

  • read
  • write
  • execute
  • create
  • alter
  • drop

База данных поддерживает хранимые процедуры триггеры написанные на языке Lua.

Глобальный триггер

  • box_once - первый запуск бд (бутстрап)

Триггеры для пространств (таблиц):

  • on_replace - триггер только для чтения на события вставка, обновления, удаления данных
  • before_replace - триггер с возможностью модификации событий вставки, обновления, удаления данных

Сервер приложений

Для написания бизнес-логики используется язык Lua и его компилятор LuaJIT.

Сервер приложений содержит высокоуровневое API для доступа к базе данных, файловой системе, сети.

Пользователь может динамически добавлять, удалять, модифицировать функции. Для одновременного выполнения кода используется кооперативная мультизадачность.

Для расширения сервера приложений доступны Lua библиотеки как из репозитория tarantool/rocks так и собранные из исходников.

Список стандартных модулей tarantool-а:

  • box - доступ к СУБД
  • clock - системное время
  • crypto - криптографические функции
  • csv - работа с CSV форматом данных
  • digest - хеширование строк
  • errno - доступ к переменной системных ошибок *nix
  • fiber - многопоточность и инструменты синхронизации
  • fio - работа с файловой системой, ввод/вывод
  • fun - функциональное программирование
  • iconv - работа с текстом в разных кодировках
  • json - работа с JSON форматом данных
  • log - логирование событий
  • msgpack - работа с MsgPack форматом данных
  • net.box - модуль связи tarantool-ов между собой
  • os - небольшая часть основных команд операционной системы
  • pickle - сериализация/десериализация Lua структур
  • socket - работа с сетью
  • string - утилиты для работы со строками
  • tap - фреймворк для модульного тестирования
  • uuid - работа с UUID
  • uri - работа с форматом uri
  • yaml - работа с YAML форматом данных

Модули доступные из репозитория tarantool/rocks:

  • vshard - шардирование и репликация данных для горизонтального масштабирования сервиса
  • avro-schema - валидация и преобразование сложных структур данных
  • date - манипуляция с датой и временем
  • ldecnumber - арифметика с десятичной плавающей точкой (например, денежная)

История

Mail.Ru, крупная интернет-компания в России, начала проект в 2008 году c вложения средств и поиска программистов. В качестве руководителя проекта наняли бывшего технического директора из MySQL. Tarantool стал частью самого портала Mail.Ru и сейчас используется для динамического контента: сеансов пользователей, мгновенных сообщений и прочего, а также используется в качестве слоя кэширования для традиционных реляционных баз данных, таких как MySQL или PostgreSQL.[1]

В 2014 году Tarantool также был принят социальными сетями Badoo и Одноклассники. [2]

В июне 2014 года исследователи из Политехнического института Коимбры и Университета Коимбры (Португалия) провели первый официальный независимый тест производительности систем NoSQL, которые включали в том числе и Tarantool. Испытания использовали стандартный YCSB тест, а конкуренцию Tarantool составляли другие системы NoSQL: Cassandra, HBase, Oracle NoSQL, Redis, Voldemort, Scalaris, Elasticsearch, MongoDB и OrientDB.[3]

В 2018 году разработчик и основатель проекта Tarantool Константин Осипов стал лауреатом премии HighLoad++ Awards[4]

Примечания

Ссылки