Common Locale Data Repository

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая Kaganer (обсуждение | вклад) в 23:14, 21 июня 2017. Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску
Common Locale Data Repository
Разработчик Unicode Consortium[англ.]*
Опубликован 19 декабря 2003; 21 год назад (2003-12-19)[1]
Последний выпуск CLDR 31 (20 марта 2017; 7 лет назад (2017-03-20)[2])
Тип формата проект и набор данных
Содержит XML[3]
Сайт cldr.unicode.org (англ.)

Проект Common Locale Data Repository (Общий Репозиторий Региональных Данных), часто сокращаемый как CLDR — это проект консорциума Юникод[англ.]*, призванный обеспечить языковые настройки данных в формате XML для использования в программном обеспечении. Репозиторий CLDR содержит сведения о специфических особенностях каждого языка, которые операционная система обычно предоставляет приложениям. CLDR написано на LDML (Locale Data Markup Language). Информация в настоящее время используется в ряде приложений и операционных систем, в частности, в Международных компонентах Юникода[англ.], ОС MacOS, LibreOffice, MediaWiki и AIX.

Среди типов данных, включаемых в CLDR, находятся:

  • Переводы названий языков.
  • Переводы названий территорий и стран.
  • Переводы названий валют, в том числе модификации для форм единственного/множественного числа.
  • Переводы таких терминов, как рабочая неделя, месяц, эра, часть дня, в полной и сокращённой форме.
  • Переводы названий часовых поясов и примеры городов (или аналогичные) для часовых поясов.
  • Переводы для полей календаря.
  • Шаблоны для форматирования/парсинга дат или времени суток.
  • Наборы образцов символов, используемых для написания на каждом языке.
  • Шаблоны для форматирования/парсинга чисел.
  • Правила сортировки[англ.], адаптированные к каждому языку.
  • Правила для форматирование чисел в традиционных системах счисления (например, римские цифры, армянские цифры, ...).
  • Правила записи числа прописью.
  • Правила транслитерации между системами письма. Многое из этого базируется на системе транслитерации BGN/PCGN[англ.].

Этот проект несколько пересекается с ISO 15897 (языковые настройки POSIX). Языковая информация POSIX может быть получена из CLDR, используя некоторые из инструментов преобразования CLDR.

CLDR поддерживается техническим комитетом CLDR, включающим сотрудников из компаний IBM, Apple, Google, Microsoft и некоторых правительственных организаций. В настоящее время комитет работает под председательством Джона Эммонса (IBM), с Марк Дэвис (Google) в качестве заместителя председателя.[4]

Примечания

  1. CLDR Releases/Downloads
  2. http://cldr.unicode.org/index/downloads/cldr-31
  3. Updating DTDs, В CLDR реализуется специальное использование XML, поскольку он структурирован. В частности, XML-код разработан таким образом, что вы можете прочитать XML-файл CLDR и интерпретировать его как неупорядоченный список пар <путь,значение>, имеющий внутренне название «CLDRFile». Эти пары путей/значений могут быть добавлены к или удалены, а затем CLDRFile может быть записана обратно на диск, в результате чего получится корректный XML-файл. Это очень мощный механизм, благодаря которому также реализуется модель наследования CLDR
  4. http://cldr.unicode.org/index/process#TOC-Officers

Ссылки

Инструменты CLDR