Архив Интернета

Материал из Википедии — свободной энциклопедии
Это старая версия этой страницы, сохранённая Alexander Nureyev (обсуждение | вклад) в 21:49, 1 октября 2016 (Блокировка Архива Интернета). Она может серьёзно отличаться от текущей версии.
Перейти к навигации Перейти к поиску
Internet Archive
Изображение логотипа
Главная страница сайта
URL archive.org (англ.)
Коммерческий нет
Тип сайта универсальная электронная библиотека
Язык (-и) английский
Расположение сервера  США
 Египет
 Нидерланды
Владелец Internet Archive
Создатель Брюстер Кейл[1]
Начало работы 24 января 1996
Текущий статус работает
Оборот
  • 30,5 млн $ (декабрь 2022, 2022)[2][3]
Чистая прибыль
  • 4,09 млн $ (2021)[4]
Число сотрудников
  • 122 чел. (2021)[4]
Слоган universal access to all knowledge[5]
Страна
Логотип Викисклада Медиафайлы на Викискладе

Архив Интернета (англ. Internet Archive) — некоммерческая организация, основанная в 1996 году в Сан-Франциско Брюстером Кейлом. Архив собирает копии веб-страниц, графические материалы, видео- и аудиозаписи и программное обеспечение. Архив обеспечивает долгосрочное архивирование собранного материала и бесплатный доступ к своим базам данных для широкой публики. Декларируемой целью Архива является сохранение культурно-исторических ценностей цивилизации в эпоху интернет-технологий, создание и поддержка электронной библиотеки. По состоянию на октябрь 2012 года размер Архива — 10 петабайт[7]. По состоянию на август 2016 года содержит 502 миллиарда копий веб-страниц. Сервер Архива расположен в Сан-Франциско, зеркала — в Новой Александрийской библиотеке и в Амстердаме. С 2007 года Архив имеет юридический статус библиотеки[8].

История

Архив был создан Брюстером Кейлом в 1996 году примерно в то же время, когда он основал компанию Alexa Internet, занимающуюся сбором статистики о посещаемости веб-сайтов. В октябре того же года организация начала архивировать и хранить копии веб-страниц[9]. Сохранённые копии не были доступны для широкой публики до создания в 2001 году веб-сервиса Wayback Machine. С конца 1999 года Архив начал расширение за пределы веб-архива и в настоящее время помимо копий веб-сайтов включает тексты, видео, звукозаписи, программное обеспечение и изображения.

Проекты

Wayback Machine

Логотип Wayback Machine

The Wayback Machine — веб-сервис Архива. Содержание веб-страниц время от времени фиксируется c помощью бота, или при ручном указании посетителем сайта адреса страницы для фиксации. Таким образом, можно посмотреть, как выглядела та или иная страница раньше, даже если она больше не существует.

Легальность

На сервис не раз подавались судебные иски, в связи с тем, что публикация контента может быть нелегальной[10]. Поэтому сервис удаляет материалы из публичного доступа по требованию их правообладателей, или если доступ к страницам сайтов не разрешён в файле robots.txt владельцами этих сайтов.

В 2002 году часть архивных копий веб-страниц, содержащих критику саентологии, была удалена из архива[11] с пояснением, что это было сделано по «просьбе владельцев сайта»[12]. В дальнейшем выяснилось, что этого потребовали юристы Церкви саентологии, тогда как настоящие владельцы сайта не желали удаления своих материалов[13]. Некоторые пользователи сочли это проявлением интернет-цензуры.

Книжный сканер Архива
Книга, изготовленная в течение 20 минут в рамках проекта Book-on-demand, на основе электронной книги из Архива

Open Library

Open Library — общественный проект по сканированию всех книг в мире, к которому приступила Internet Archive в октябре 2005 года. На февраль 2010 года библиотека содержит в открытом доступе 1 миллион 165 тысяч книг, в каталог библиотеки занесено больше 22 млн изданий. По данным на 2008 год Архиву принадлежит 13 центров оцифровки в крупных библиотеках. По оценке Internet Archive на ноябрь 2008 года, коллекция составила более 0,5 петабайт, включая изображения и документы в формате PDF[14]. Коллекция постоянно растёт, так как библиотека сканирует около 1000 книг в день.

Scan-on-demand — бесплатная оцифровка желаемых публикаций из фондов Бостонской общественной библиотеки, относится к проекту «Открытая библиотека».

Собрание фильмов, аудио, текстов и программного обеспечения, которые являются общественным достоянием или защищены лицензией Creative Commons.

Награды

23 марта 2010 года Архив Интернета назван победителем в номинации Project of Social Benefit ежегодной премии Free Software Awards, организованной некоммерческим фондом Free Software Foundation (FSF)[15][16].

Блокировка Архива Интернета

В России

Внешние изображения
Страница сайта Роскомнадзора с сообщением о блокировке страницы «Одиночный джихад»

В октябре 2014 года Роскомнадзор заблокировал на территории РФ доступ к некоторым страницам Архива Интернета за видеоролик «Звон мечей» экстремистской группировки «Исламское государство Ирака и Леванта» (нынешнее название — «Исламское государство»). Ранее блокировались только ссылки на отдельные материалы в архиве, однако 24 октября 2014 года в реестр запрещённых сайтов временно был включён сам домен и его IP-адрес[17][18][19].

16 июня 2015 года на основании статьи 15.3 закона «Об информации, информационных технологиях и о защите информации» генпрокуратура РФ приняла решение о блокировке страницы «Одиночный джихад в России», содержащей по её мнению «призывы к массовым беспорядкам, осуществлению экстремистской деятельности, участию в массовых мероприятиях, проводимых с нарушением установленного порядка»[19][20][21], в действительности на территории России был заблокирован доступ ко всему сайту, кроме The Wayback Machine.

Архив недоступен на территории Казахстана, хотя официальных сведений о блокировке нет.

См. также

Примечания

  1. Internet Archive: Bios (англ.)
  2. https://projects.propublica.org/nonprofits/organizations/943242767
  3. Nonprofit Explorer: Research Tax-Exempt Organizations
  4. 1 2 https://projects.propublica.org/nonprofits/organizations/943242767/202233199349312193/full
  5. https://www.youtube.com/watch?v=8YYJPtCXf4I
  6. Global Research Identifier Database (англ.) — 2015.
  7. 10,000,000,000,000,000 bytes archived! Архивировано 28 ноября 2012 года.
  8. Internet Archive officially a library. Internet Archive (7 мая 2007). Дата обращения: 31 августа 2016.
  9. Internet Archive: In the Collections. Wayback Machine (6 июня 2000). Дата обращения: 1 сентября 2016. Архивировано из оригинала 6 июня 2000 года.
  10. Статья о сервисе в англ. Википедии(англ.)
  11. Bowman, Lisa M (24 сентября 2002 г). "Net archive silences Scientology critic". CNET News.com. Архивировано 16 июля 2012. Дата обращения: 4 января 2007. {{cite news}}: Проверьте значение даты: |date= (справка)
  12. Jeff. exclusions from the Wayback Machine (Blog). Wayback Machine Forum. Internet Archive (23 сентября 2002). Дата обращения: 4 января 2007. Архивировано 25 августа 2011 года. Author and Date indicate initiation of forum thread
  13. Miller, Ernest Sherman, Set the Wayback Machine for Scientology (Blog). LawMeme. Yale Law School (24 сентября). Дата обращения: 4 января 2007. Архивировано 25 августа 2011 года. The posting is billed as a 'feature' and lacks an associated year designation; comments by other contributors appear after the 'feature'
  14. Bulk Access to OCR for 1 Million Books, via Open Library Blog, by raj, 24 ноября 2008. Архивировано 28 ноября 2012 года.
  15. Free Software Awards Announced. Архивировано 28 ноября 2012 года.
  16. Стали известны номинанты ежегодной награды Free Software Awards. Архивировано 28 ноября 2012 года.
  17. Производится блокировка экстремистского видео террористической организации «Исламское государство Ирака и Леванта» в сети Интернет. Роскомнадзор (24 октября 2014).
  18. Роскомнадзор внёс «архив интернета» в реестр запрещённых сайтов.
  19. 1 2 Роскомнадзор заблокировал архив интернета // РБК. 25 июня 2015 года.
  20. Роскомнадзор заблокировал страницу «архива интернета» за экстремизм // Lenta.ru. 25 июня 2015 года.
  21. Роскомнадзор заблокировал архив интернета из-за «Одиночного джихада» // Московский комсомолец. 25 июня 2015 года.

Литература

Ссылки

Зеркала