Google (поисковая система): различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
м откат правок 81.88.195.228 (обс) к версии Ющерица
Строка 30: Строка 30:


== Индексация сайтов ==
== Индексация сайтов ==
[[Поисковый робот]] Gogle имеет [[User Agent]] — Googlebot (Поисковый робот), который является основным роботом, сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:
[[Поисковый робот]] Google имеет [[User Agent]] — Googlebot (Поисковый робот), который является основным роботом, сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:
* Googlebot-Mobile — робот, индексирующий сайты для мобильных устройств,
* Googlebot-Mobile — робот, индексирующий сайты для мобильных устройств,
* Google Search Appliance (Google) gsa-crawler<ref name=autogenerated4>{{cite web |url=http://www.user-agents.org/index.shtml |title=List of User-Agents (Spiders, Robots, Browser)<!-- Заголовок добавлен ботом --> |archiveurl=http://archive.is/20120920/http://www.user-agents.org/index.shtml |archivedate=2012-09-20}}</ref> — поисковый робот нового аппаратно-программного комплекса Search Appliance,
* Google Search Appliance (Google) gsa-crawler<ref name=autogenerated4>{{cite web |url=http://www.user-agents.org/index.shtml |title=List of User-Agents (Spiders, Robots, Browser)<!-- Заголовок добавлен ботом --> |archiveurl=http://archive.is/20120920/http://www.user-agents.org/index.shtml |archivedate=2012-09-20}}</ref> — поисковый робот нового аппаратно-программного комплекса Search Appliance,
Строка 43: Строка 43:
=== Проблемы с авторскими правами ===
=== Проблемы с авторскими правами ===
[[KaZaA]] и [[Церковь саентологии]] использовали Закон об авторском праве в цифровую эпоху ([[DMCA]]), чтобы потребовать от Google удалить ссылки на материалы на их сайтах, якобы защищённые авторским правом.<ref name=autogenerated1>{{cite web |url=http://www.technewsworld.com/story/31481.html |title=Technology News: News: Google Pulls P2P Links Over Kazaa Copyright Claims |archiveurl=http://archive.is/20120920/http://www.technewsworld.com/story/31481.html |archivedate=2012-09-20}}</ref><ref name=nytdmca>{{cite web |url=http://query.nytimes.com/gst/fullpage.html?res=9F02E5D7103FF931A15757C0A9649C8B63 |title=New Economy; A copyright dispute with the Church of Scientology is forcing Google to do some creative linking |archiveurl=http://archive.is/20120920/http://query.nytimes.com/gst/fullpage.html?res=9F02E5D7103FF931A15757C0A9649C8B63 |archivedate=2012-09-20}} New York Times</ref> Google по закону обязан удалить эти ссылки, но вместо того, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации.<ref name=nytdmca/>
[[KaZaA]] и [[Церковь саентологии]] использовали Закон об авторском праве в цифровую эпоху ([[DMCA]]), чтобы потребовать от Google удалить ссылки на материалы на их сайтах, якобы защищённые авторским правом.<ref name=autogenerated1>{{cite web |url=http://www.technewsworld.com/story/31481.html |title=Technology News: News: Google Pulls P2P Links Over Kazaa Copyright Claims |archiveurl=http://archive.is/20120920/http://www.technewsworld.com/story/31481.html |archivedate=2012-09-20}}</ref><ref name=nytdmca>{{cite web |url=http://query.nytimes.com/gst/fullpage.html?res=9F02E5D7103FF931A15757C0A9649C8B63 |title=New Economy; A copyright dispute with the Church of Scientology is forcing Google to do some creative linking |archiveurl=http://archive.is/20120920/http://query.nytimes.com/gst/fullpage.html?res=9F02E5D7103FF931A15757C0A9649C8B63 |archivedate=2012-09-20}} New York Times</ref> Google по закону обязан удалить эти ссылки, но вместо того, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации.<ref name=nytdmca/>

KANAT ABSATAROV
[[The New York Times]] жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права.<ref name=autogenerated3>{{cite web |url=http://www.news.com/2100-1038_3-1024234.html |title=Google cache raises copyright concerns — CNET News.com |archiveurl=http://archive.is/20120911/http://www.news.com/2100-1038_3-1024234.html |archivedate=2012-09-11}}</ref> Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования посредством файла [[Стандарт исключений для роботов|robots.txt]] — стандартного механизма, позволяющего администраторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска — или через мета-теги, позволяющие редактору контента указать, можно ли индексировать или архивировать документ и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторских прав согласно американскому законодательству в делах [[Field v. Google]] и [[Parker v. Google]].<ref name=autogenerated5>[http://www.eff.org/IP/blake_v_google/google_nevada_order.pdf Case No. CV-S-04-0413-RCJ-LRL] United States District Court (District of Nevada). Filed on January 19, 2006</ref><ref name=autogenerated2>[http://www.paed.uscourts.gov/documents/opinions/06D0306P.pdf Case No. 04-CV-3918] United States District Court (Eastern District of Pennsylvania). March 10, 2006</ref>
[[The New York Times]] жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права.<ref name=autogenerated3>{{cite web |url=http://www.news.com/2100-1038_3-1024234.html |title=Google cache raises copyright concerns — CNET News.com |archiveurl=http://archive.is/20120911/http://www.news.com/2100-1038_3-1024234.html |archivedate=2012-09-11}}</ref> Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования посредством файла [[Стандарт исключений для роботов|robots.txt]] — стандартного механизма, позволяющего администраторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска — или через мета-теги, позволяющие редактору контента указать, можно ли индексировать или архивировать документ и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторских прав согласно американскому законодательству в делах [[Field v. Google]] и [[Parker v. Google]].<ref name=autogenerated5>[http://www.eff.org/IP/blake_v_google/google_nevada_order.pdf Case No. CV-S-04-0413-RCJ-LRL] United States District Court (District of Nevada). Filed on January 19, 2006</ref><ref name=autogenerated2>[http://www.paed.uscourts.gov/documents/opinions/06D0306P.pdf Case No. 04-CV-3918] United States District Court (Eastern District of Pennsylvania). March 10, 2006</ref>



Версия от 08:40, 5 декабря 2012

Google
URL
Коммерческий Да
Тип сайта поисковая система
Регистрация Необязательно
Язык (-и) многоязычный (более 200)
Язык программирования Си, C++ и Python
Владелец Google Inc.
Создатель Сергей Брин и Ларри Пейдж
Начало работы 15 сентября 1997[1]
Страна
Логотип Викисклада Медиафайлы на Викискладе

Google (МФА [ɡuːɡl][2][3], MWCD /ˈgü-gəl/[4], рус. Гугл) — крупнейшая поисковая система, принадлежащая корпорации Google Inc.

Первая по популярности (79,65 %[5]), обрабатывает 41 млрд 345 млн запросов в месяц (доля рынка 62,4 %[6][7]), индексирует более 25 млрд веб-страниц[источник не указан 4455 дней], может находить информацию на 195 языках[источник не указан 4455 дней].

Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.

История создания

Поисковая система Google была создана в качестве учебного проекта студентов Стэнфордского университета Ларри Пейджа и Сергея Брина. Они в 1996 году работали над поисковой системой BackRub, а в 1998 году на её основе создали новую поисковую систему Google.

Хотя корпорация была основана 2 сентября 1998 года, а домен Google.com зарегистрирован 15 сентября 1997 года, поисковик (с 2000 года) иногда отмечает свой день рождения и в другой день: как 7, так и 27 сентября.[8][9]

Название Google произошло от намеренно искажённого Сергеем Брином слова Гугол (Googol), которое означает «десять в сотой степени» — 10100.

Индексация сайтов

Поисковый робот Google имеет User Agent — Googlebot (Поисковый робот), который является основным роботом, сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:

  • Googlebot-Mobile — робот, индексирующий сайты для мобильных устройств,
  • Google Search Appliance (Google) gsa-crawler[10] — поисковый робот нового аппаратно-программного комплекса Search Appliance,
  • Googlebot-Image — робот, сканирующий страницы для индекса картинок,
  • Mediapartners-Google — робот, сканирующий контент страницы для определения содержания AdSense,
  • Adsbot-Google — робот, сканирующий контент для оценки качества целевых страниц AdWords.

Существует теория эффекта песочницы, которая утверждает, что сайты, которые имеют новые доменные имена, частые смены владельцев или нэймсерверов, помещаются в «песочницу» (зону ожидания) и пребывают там, пока механизм Google не сочтёт сайт готовым из неё выйти.[источник не указан 5332 дня]

Также существует обратная теория, называющаяся «бонус новичка», в которой при первоначальной индексации сайта, в силу некоторых аспектов (например нескольких ссылок с авторитетных ресурсов), сайту сразу присваивается высокий PageRank и хорошие места в поисковой выдаче. По истечении некоторого времени, после снятия этого эффекта сайту присваиваются его реальные показатели. [источник не указан 5332 дня]

Проблемы с авторскими правами

KaZaA и Церковь саентологии использовали Закон об авторском праве в цифровую эпоху (DMCA), чтобы потребовать от Google удалить ссылки на материалы на их сайтах, якобы защищённые авторским правом.[11][12] Google по закону обязан удалить эти ссылки, но вместо того, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации.[12]

The New York Times жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права.[13] Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования посредством файла robots.txt — стандартного механизма, позволяющего администраторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска — или через мета-теги, позволяющие редактору контента указать, можно ли индексировать или архивировать документ и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторских прав согласно американскому законодательству в делах Field v. Google и Parker v. Google.[14][15]

Алгоритм ранжирования

Метатег Keywords не учитывается при ранжировании сайтов.[16]

PageRank

Google использует алгоритм расчёта авторитетности PageRank. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в результатах поиска Google. Google использует показатель PageRank найденных по запросу страниц, чтобы определить порядок выдачи этих страниц посетителю в результатах поиска.

Поисковые запросы

Синтаксис запросов

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д. Например, поиск «intitle:Google site:wikipedia.org» выведет все статьи Википедии на всех языках, в заголовке которых встречается слово Google.[17][18][19][20]

Мощный язык запросов в руках хакеров может быть использован для исследования веб-сайтов на уязвимости.[21]

Поиск в найденном

Для результатов поиска Google ранее предоставлял возможность повторного поиска, что позволяло производить поиск более детально. Для более детального поиска пользователям необходимо было указывать дополнительные параметры, по которым происходил отбор результатов, что позволяло сразу отобразить не только запрос, но и контекст, где он применяется. Данная возможность упрощала процедуру поиска, исключив необходимость в открытии каждого результата.

Википоиск

Поисковая технология, позволяющая пользователю настраивать результаты выдачи по поисковым запросам. Пользователь может удалять результаты из списка и поднимать вверх списка. Технология была запущена компанией Google весной 2009 года и проработала до осени. В настоящий момент (4 мая 2010 года), в настройках поиска осталась настройка для включения «Википоиска», но в выдаче соответствующие элементы управления отсутствуют. Другие поисковые системы подобной функциональности пока не предоставляли.

Голосовой поиск

22 сентября 2010 года компания запустила голосовой поиск в России.[22] Чтобы осуществить поиск, необходимо нажать в телефоне кнопку рядом со строкой поиска и произнести свой запрос, телефон отправит ваш голос на сервер, и браузер выдаст строку с распознанным вашим запросом и результатами поиска по нему.

Логотип Google

Текущий официальный логотип Google был разработан Рутом Кедаром и действует с 6 мая 2010 года. По случаю праздника или круглой даты какой-нибудь широко известной личности стандартный логотип Google у некоторых или, реже, у всех[23] региональных доменов может меняться на праздничный, имеющий определённую тематику, смысл, но в стиле Google (англ. Holiday and Events — Google style!)[24]. Например, по случаю дня рождения Наполеона Орды 11 февраля 2010 года на логотипе белорусского домена Google появились акварели этого известного художника[25], 6 июля поздравляли со 121-летием Марка Шагала (логотип был в виде коллажа из фрагментов его работ)[26]. После десятилетнего ожидания 22 марта 2011 года Google выиграл патент на «Google Doodle».

Российские:

Интерактивные:

  • Игра Pac-Man (включение/выключение звука, управление передвижением мышкой или клавишами со стрелками клавиатуры).[27]
  • 9 июня 2011 года — логотип, посвящённый 96-й годовщине со дня рождения Леса Пола.[28] Лого предоставляет возможность генерировать звуки (с изображением колеблющейся гитарной струны), записывать и проигрывать мелодии[29][30][31], передавать записанное (как URL)[32]
  • 15 июня — интерактивный логотип, демонстрирующий (с возможностью прокрутки) фазы лунного затмения.
  • 5 сентября — логотип ко дню рождения Фредди Меркьюри, в котором показан мультклип, созданный компанией Google на песню Don’t Stop Me Now группы Queen.
  • 23 ноября — к 60-летию первой публикации Станислава Лема (по мотивам иллюстраций польского художника Даниэля Мроза к Кибериаде[33]).
  • 31 октября — в честь праздника Хэллоуин. В ускоренном темпе на видео показано, как группа сотрудников Google вырезает логотип компании из 6 больших оранжевых тыкв.[34]
  • 9 апреля 2012 года — к 182-летию со дня рождения Эдварда Мейбриджа. Логотип представляет из себя 21 сектор разного цвета, в каждом из которых бежит скаковая лошадь.
  • 23 апреля — к 99-летию со дня получения Гидеоном Сундбэком патента на застёжку-молнию.
  • 1 июня — в честь Международного дня защиты детей.
  • Во время XXX летних олимпийских игр каждый день появлялся логотип с новым видом спорта.
  • 15 октября — к 107-летию со дня создания комикса «Маленький Нимо в стране снов».

Гуглить

Из-за популярности поисковой системы в английском языке появился неологизм to google или to Google (аналог в русском компьютерном сленге — гуглить), использующийся для обозначения поиска информации в Интернете с помощью Google. Именно с таким определением глагол занесён в наиболее авторитетные словари английского языка — Оксфордский словарь английского языка и Merriam-Webster[35], хотя в других источниках[36] приводятся примеры его использования для обозначения поиска вообще чего-либо в Интернете.

Первым, кто использовал слово как глагол, был сам Лэрри Пэйдж, 8 июля 1998 года подписавший одно из своих сообщений для списка рассылки: «Have fun and keep googling!»[37] Американское диалектическое сообщество назвало глагол «to google» словом десятилетия.[38]

Опасаясь возможной утраты товарного знака, Google не одобряет использование глагола google, особенно когда подразумевается поиск в Интернете вообще.[39] Например, 23 февраля 2003 года компания направила письмо[40] «прекратить и воздерживаться» (англ. cease and desist) Полу МакФедрису, основателю Word Spy — сайта, отслеживающего неологизмы.[41] Также, в своей статье в «Вашингтон пост», Фрэнк Арэнс обсуждал письмо, полученное от юристов Google, иллюстрирующее «правильное» и «неправильное» употребление глагола google.[42] В ответе на эту статью лексикографы словаря Merriam-Webster заметили, что записали глагол to google со строчно́й буквы, но для обозначения поисковой системы Google употребили заглавную букву (англ. to use the Google search engine to seek online information — пользоваться Google для поиска информации в Интернете), впрочем, редакторы оксфордского словаря не стали сохранять обе «версии» для истории.[43] В 2006 году Google выпустил публичное заявление с требованием «использовать слова, образованные от Google, только когда речь идет о Google Inc или его сервисах».[44]

См. также

Примечания

  1. WHOIS — google.com. InterNIC. Дата обращения: 27 января 2009. Архивировано 11 апреля 2012 года.
  2. «google» перевод английский-русский. Lingvo.abbyyonline.com. Дата обращения: 8 февраля 2012. Архивировано 16 июня 2012 года.
  3. How to pronounce Google (англ.). inogolo.com. Дата обращения: 8 февраля 2012. Архивировано 16 июня 2012 года.
  4. Google - Definition and More from the Free Merriam-Webster Dictionary (англ.). Merriam-Webster, Incorporated. Дата обращения: 8 февраля 2012. Архивировано 16 июня 2012 года.
  5. По данным компании [[Net Applications]] в декабре 2007 года рыночная доля Google в мире составляла 77,05 %, [[Yahoo!]] — 12,46 %, [[MSN]] — 3,33 %, [[Microsoft Live Search]] — 2,57 %, [[AOL]] — 2,12 %, [[Ask]] — 1,38 %, [[AltaVista]] — 0,13 %, [[Excite]] — 0,07 %, [[Lycos]] — 0,02 %, [[All the Web]] — 0,02 %. Архивировано 11 июля 2012 года.
  6. Baidu Ranked Third Largest Worldwide Search Property by comScore in December 2007 — comScore, Inc. Архивировано 29 июля 2012 года.
  7. «Яндекс» — девятый поисковик мира / Яндекс / Хабрахабр  (недоступная ссылка — история)
  8. 27.09.2010 Google отмечает двенадцатый день рождения. Архивировано 14 сентября 2012 года.
  9. С днём рождения, Google. Архивировано 10 июля 2012 года.
  10. List of User-Agents (Spiders, Robots, Browser). Архивировано 20 сентября 2012 года.
  11. Technology News: News: Google Pulls P2P Links Over Kazaa Copyright Claims. Архивировано 20 сентября 2012 года.
  12. 1 2 New Economy; A copyright dispute with the Church of Scientology is forcing Google to do some creative linking. Архивировано 20 сентября 2012 года. New York Times
  13. Google cache raises copyright concerns — CNET News.com. Архивировано 11 сентября 2012 года.
  14. Case No. CV-S-04-0413-RCJ-LRL United States District Court (District of Nevada). Filed on January 19, 2006
  15. Case No. 04-CV-3918 United States District Court (Eastern District of Pennsylvania). March 10, 2006
  16. Google отказался от мета тега Keywords. Архивировано 13 июля 2012 года.
  17. intitle: google site: wikipedia.org — Google Search. Архивировано 20 сентября 2012 года.
  18. Поисковые операторы Google,Таблица операторов Google. Архивировано 11 июля 2012 года.
  19. Официальный справочник на английском языке. Архивировано 20 сентября 2012 года.
  20. Описание операторов и встроенных функций расширенного поиска: общая страница; операторы и функции расширенного поиска; Advanced Operators (подробное описание операторов на английском); «шпаргалка» по языку поисковых запросов Google  (недоступная ссылка — история)
  21. Взлом при помощи Google на SecurityLab. Архивировано 20 сентября 2012 года.
  22. "Google запустил российский голосовой поиск". Lenta.ru. 2010-09-22. Архивировано 4 августа 2012.
  23. В списке логотипов. Архивировано 24 мая 2012 года. указана географическая область, для которой меняется логотип, если меняется глобально — указано «Global».
  24. Logos/Holiday and Events — Google style! Архивировано 24 мая 2012 года.
  25. Google змяніў свой лагатып у гонар народзінаў Напалеона Орды. Архивировано 19 июля 2012 года.
  26. Google віншуе Марка Шагала з днём народзінаў. Архивировано 14 июля 2012 года.
  27. Pacman. Архивировано 5 июня 2012 года.
  28. Les Paul’s 96th Birthday, Google Logos. Архивировано 5 сентября 2012 года.
  29. National Anthem of Russia played on Les Paul Google’s Doodle
  30. Демонстрация возможностей «гитары» Google (doodle)
  31. пример записи «гитары» Google (doodle)
  32. Лес Пол, doodle. Архивировано 22 июля 2012 года.
  33. Mroz drawings. Архивировано 15 июля 2012 года.
  34. Halloween 2011. Архивировано 20 сентября 2012 года.
  35. Google — Definition and More from the Free Merriam-Webster Dictionary. Архивировано 4 сентября 2012 года.
  36. Word Spy — google. Архивировано 18 сентября 2012 года.
  37. Larry Page. Google Search Engine: New Features. Google Friends Mailing List (8 июля 1998). Дата обращения: 6 августа 2007.
  38. «Гуглить» стало словом десятилетия. Архивировано 31 июля 2012 года.
  39. Гуглить нельзя помиловать Вебпланета. Архивировано 16 июля 2012 года.
  40. Paul McFedries. Google trademark concerns (англ.). American Dialect Society Mailing List (23 февраля 2003). Дата обращения: ???. Архивировано 2 февраля 2012 года.
  41. Duffy, Jonathan. Google calls in the «language police». Архивировано 29 июня 2012 года. (англ.) Би-би-си, 20 июня 2003
  42. Frank Ahrens. So Google Is No Brand X, but What Is «Genericide»? Архивировано 30 мая 2012 года. (англ.) Washington Post, 5 августа 2006
  43. Chris Noon. Brin, Page See «Google» Take Its Place In Dictionary. Архивировано 20 сентября 2012 года.  (англ.) Forbes, 6 июля 2006
  44. Michael Krantz. Do you «Google»? Архивировано 30 мая 2012 года.  (англ.) The Official Google Blog, 25 октября 2006

Ссылки