Common Locale Data Repository

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая Kaganer (обсуждение | вклад) в 11:51, 17 октября 2018. Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску
Common Locale Data Repository
Разработчик Unicode Consortium[англ.]*
Опубликован 19 декабря 2003; 21 год назад (2003-12-19)[1]
Последний выпуск CLDR 34 (15 октября 2018; 6 лет назад (2018-10-15)[2])
Тип формата проект и набор данных
Содержит XML[3]
Сайт cldr.unicode.org (англ.)

Проект Common Locale Data Repository (Общий Репозиторий Языковых Данных), часто сокращаемый как CLDR — это проект консорциума Юникод[англ.]*, призванный обеспечить языковые настройки данных в формате XML для использования в программном обеспечении. Репозиторий CLDR содержит сведения о специфических особенностях каждого языка, которые операционная система обычно предоставляет приложениям. CLDR написано на LDML (Locale Data Markup Language). Информация в настоящее время используется в ряде приложений и операционных систем, в частности, в Международных компонентах Юникода[англ.], ОС MacOS, LibreOffice, MediaWiki и AIX.

Среди типов данных, включаемых в CLDR, находятся:

  • Переводы названий языков.
  • Переводы названий территорий и стран.
  • Переводы названий валют, в том числе модификации для форм единственного/множественного числа.
  • Переводы таких терминов, как рабочая неделя, месяц, эра, часть дня, в полной и сокращённой форме.
  • Переводы названий часовых поясов и примеры городов (или аналогичные) для часовых поясов.
  • Переводы для полей календаря.
  • Шаблоны для форматирования/парсинга дат или времени суток.
  • Наборы образцов символов, используемых для написания на каждом языке.
  • Шаблоны для форматирования/парсинга чисел.
  • Правила сортировки[англ.], адаптированные к каждому языку.
  • Правила для форматирование чисел в традиционных системах счисления (например, римские цифры, армянские цифры, ...).
  • Правила записи числа прописью.
  • Правила транслитерации между системами письма. Многое из этого базируется на системе транслитерации BGN/PCGN[англ.].

Этот проект несколько пересекается с ISO/IEC 15897[англ.] (языковые настройки POSIX). Языковая информация POSIX может быть получена из CLDR, используя некоторые из инструментов преобразования CLDR.

CLDR поддерживается техническим комитетом CLDR, включающим сотрудников из компаний IBM, Apple, Google, Microsoft и некоторых правительственных организаций. В настоящее время комитет работает под председательством Джона Эммонса (IBM), с Марком Дэвисом[англ.] (Google) в качестве заместителя председателя.[4]

Примечания

  1. CLDR Releases/Downloads
  2. http://cldr.unicode.org/index/downloads/cldr-34
  3. Updating DTDs, В CLDR реализуется специальное использование XML, поскольку он структурирован. В частности, XML-код разработан таким образом, что вы можете прочитать XML-файл CLDR и интерпретировать его как неупорядоченный список пар <путь,значение>, имеющий внутренне название «CLDRFile». Эти пары путей/значений могут быть добавлены к или удалены, а затем CLDRFile может быть записана обратно на диск, в результате чего получится корректный XML-файл. Это очень мощный механизм, благодаря которому также реализуется модель наследования CLDR
  4. http://cldr.unicode.org/index/process#TOC-Officers

Ссылки

Инструменты CLDR