Hadoop

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая GrigorevMN (обсуждение | вклад) в 10:33, 27 марта 2008 (Ссылки). Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску
Apache Hadoop
Hadoop Logo
Тип Система для распределенных вычислений
Авторы Дуг Каттинг и Майк Кафарела[вд]
Разработчик Apache Software Foundation
Написана на Java
Операционная система Кросс-платформенное программное обеспечение
Первый выпуск 1 апреля 2006[1]
Аппаратная платформа Java Virtual Machine
Последняя версия 0.15.3 (18 января 2008)
Репозиторий git-wip-us.apache.org/re…
gitbox.apache.org/repos/…
github.com/apache/hadoop
Лицензия Apache License 2.0
Сайт hadoop.apache.org
Логотип Викисклада Медиафайлы на Викискладе

Apache Hadoop является свободным Java каркасом программной системы, поддерживающим выполнение распределенных приложений, работающих на больших кластерах, построенных на обычном оборудовании. [2] Эта система позволяет приложениям легко масштабироваться до уровня тысяч узлов и петабайт данных. Источником вдохновения для разработчиков Hadoop послужили материалы по Google File System (GFS).

Hadoop является проектом верхнего уровня Apache, в его развитии участвует сообщество разработчиков со всего мира.

Проект Hadoop был назван в честь игрушечного слоненка ребенка основателя проекта, Doug Cutting. Изначально проект разрабатывался как система для поддержки распределенных вычислений для проекта Nutch. [3]

Сноски и источники

  1. https://archive.apache.org/dist/hadoop/common/
  2. Hadoop прозрачно предоставляет приложениям надежность и быстродействие операций с данными. В Hadoop реализована вычислительная парадигма,известная как MapReduce. Согласно этой парадигме приложение разделяется на большое количество небольших заданий, каждое из которых может быть выполнено на любом из узлов кластера. В дополнение, предоставляется распределенная файловая система, использующая для хранения данных вычислительные узлы кластера, что позволяет достичь очень высокой аггрегированной пропускной способности кластера. Hadoop Overview
  3. "Hadoop содержит платформу для распределенных вычислений, которая изначально была частью проекта Nutch. Она включает в себя Hadoop Distributed File System (HDFS) и реализацию map/reduce. About Hadoop

См. также

Ссылки