Google (поисковая система): различия между версиями
[отпатрулированная версия] | [непроверенная версия] |
→Синтаксис запросов: запрос источника |
Alfa xxx (обсуждение | вклад) м →Ссылки |
||
Строка 76: | Строка 76: | ||
* [http://ru-board.com/new/article.php?sid=134 Статья о поисковой системе Google на ru-board.com] |
* [http://ru-board.com/new/article.php?sid=134 Статья о поисковой системе Google на ru-board.com] |
||
* [http://www.searchengines.ru/articles/004532.html Google: технология поиска для нового тысячелетия] |
* [http://www.searchengines.ru/articles/004532.html Google: технология поиска для нового тысячелетия] |
||
* [http://art-money.com/google/google-%d0%b4%d0%be%d0%b1%d0%b0%d0%b2%d0%b8%d0%bb-%d0%b2%d0%b8%d1%80%d1%82%d1%83%d0%b0%d0%bb%d1%8c%d0%bd%d1%83%d1%8e-%d0%ba%d0%bb%d0%b0%d0%b2%d0%b8%d0%b0%d1%82%d1%83%d1%80%d1%83-%d0%ba-%d1%81%d1%82/2010/04/20 Google добавил виртуальную клавиатуру к строке поиска] |
|||
{{перевести|en|Google search}} |
{{перевести|en|Google search}} |
Версия от 08:50, 21 апреля 2010
Файл:Google logo.png | |
URL | www.google.ru |
Коммерческий | Да |
Тип сайта | поисковая система |
Язык (-и) | многоязычный (более 180) |
Язык программирования | Си, C++ и Python |
Владелец | Google Inc. |
Создатель | Сергей Брин и Ларри Пейдж |
Начало работы | 15 сентября 1997[1] |
Страна | |
Медиафайлы на Викискладе |
Google (произносится /ˈguːgl/, «гугл») — первая по популярности (77,05 %[2]) в мире поисковая система, обрабатывающая более 40 миллиардов запросов в месяц (доля рынка 62,4 %).[3][4]
Поисковой системой Google владеет корпорация Google Inc.
Лидер поисковых машин интернета, занимает более 60 % мирового рынка и индексирует более 8 миллиардов веб-страниц. Google может находить информацию на 186 языках (на 15 октября 2009).
Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.
История создания
Поисковая система Google была создана в качестве учебного проекта студентов Стендфорского университета Ларри Пейджа и Сергея Брина. Они в 1996 году работали над поисковой системой BackRub, а в 1998 году на её основе создали поисковую систему Google.
Индексация сайтов
Поисковый робот Google имеет User Agent — Googlebot, который является основным роботом сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:
- Googlebot-Mobile — робот, индексирующий сайты для мобильных устройств,
- Google Search Appliance (Google) gsa-crawler[5] — поисковой робот нового аппаратно-программного комплекса Search Appliance,
- Googlebot-Image — робот, сканирующий страницы для индекса картинок,
- Mediapartners-Google — робот, сканирующий контент страницы для определения содержания AdSense,
- Adsbot-Google — робот, сканирующий контент для оценки качества целевых страниц AdWords.
Существует теория эффекта песочницы, которая утверждает, что сайты, которые имеют новые доменные имена, частые смены владельцев или нэймсерверов, помещаются в «песочницу» (зону ожидания) и пребывают там, пока механизм Google не сочтёт сайт готовым из неё выйти.
Так же существует обратная теория называющаяся Бонус новичка в которой при первоначальной индексации сайта, в силу некоторых аспектов (например нескольких ссылок с авторитетных ресурсов), сайту сразу присваивается высокий Page Rank и хорошие места в поисковой выдаче. По истечении некоторого времени, после снятия этого эффекта сайту присваиваются его реальные показатели.
Проблемы с авторскими правами
KaZaA и Церковь Сайентологии использовали Закон об авторском праве в цифровую эпоху (DMCA), чтобы потребовать от Google удалить ссылки на материалы на их сайтах якобы защищённые авторским правом.[6][7] Google по закону обязан удалить эти ссылки, но вместо того, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации.[7]
New York Times жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права.[8] Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования через файл robots.txt, который является механизмом, который позволяет операторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска, или через мета-теги, которые позволяют редактору контента указать, можно ли индексировать или архивировать документ, и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторских прав согласно американскому законодательству в делах Field v. Google и Parker v. Google.[9][10]
Алгоритм ранжирования
Мета-тег Keywords не учитывается при ранжировании сайтов.[11]
PageRank
Google использует алгоритм расчёта авторитетности PageRank. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в результатах поиска Google. Google использует показатель PageRank найденных по запросу страниц, чтобы определить порядок выдачи этих страниц посетителю в результатах поиска.
Поисковые запросы
Синтаксис запросов
Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д. Например, поиск «intitle:Google site:wikipedia.org» даст все статьи Википедии на всех языках, в заголовке которых встречается слово Google.[12][13][14][15] С помощью мощного языка запросов хакеры могут получить неавторизированный доступ ко многим ресурсам интернета. Например, дав следующую инструкцию: «index of» admin site:exaple.com, можно просмотреть содержимое каталога admin, хранящегося на сервере example.com.Ошибка: некорректно задана дата установки (исправьте через подстановку шаблона)
Поиск в найденном
Для некоторых результатов поиска Google предоставляет повторное поле для поиска, которое позволяет пользователю найти то, что он ищет внутри конкретного вебсайта. Эта идея возникла из того, как пользователи использовали поиск. По словам инженера-программиста Бена Ли (Ben Lee) и менеджера продукта Джека Менцеля (Jack Menzel) «телепортирование» в сети — это как раз то, что помогает пользователям Google завершить свой поиск. Google развил эту концепцию на шаг вперёд, и вместо просто «телепортирования», что значит для поиска нужного сайта пользователю достаточно ввести часть имени вебсайта в Google (необязательно помнить весь адрес), пользователи могут вводить ключевые слова для поиска внутри выбранного сайта.[16] Оказалось, что пользователям часто нелегко найти то, что они ищут внутри корпоративного сайта.
Несмотря на то, что пользователям в новинку этот поисковый инструмент, он вызвал разногласия среди некоторых издательств и дистрибьюторов. На страницах результатов поиска Google отображаются платные (pay per click) рекламные объявления конкурирующих компаний, которые основывают рекламные объявления на брендах.[17] «В то время как сервис мог бы помочь увеличить трафик, некоторые пользователи „сливаются“, так как Google использует известность брендов для продажи рекламных объявлений, как правило, конкурирующим компаниям».[18] Чтобы сгладить этот конфликт Google предложил отключать эту возможность для желающих компаний.[18]
См. также
Примечания
- ↑ WHOIS — google.com . Дата обращения: 27 января 2009.
- ↑ По данным компании Net Applications в декабре 2007 года рыночная доля Google в мире составляла 77,05 %, Yahoo — 12,46 %, MSN — 3,33 %, Microsoft Live Search — 2,57 %, AOL — 2,12 %, Ask — 1,38 %, AltaVista — 0,13 %, Excite — 0,07 %, Lycos — 0,02 %, All the Web — 0,02 %
- ↑ http://www.comscore.com/press/release.asp?press=2018
- ↑ http://habrahabr.ru/blog/yandex/34614.html
- ↑ http://www.user-agents.org/index.shtml
- ↑ Technology News: News: Google Pulls P2P Links Over Kazaa Copyright Claims
- ↑ 1 2 New Economy; A copyright dispute with the Church of Scientology is forcing Google to do some creative linking New York Times
- ↑ Google cache raises copyright concerns — CNET News.com
- ↑ Case No. CV-S-04-0413-RCJ-LRL United States District Court (District of Nevada). Filed on January 19, 2006
- ↑ Case No. 04-CV-3918 United States District Court (Eastern District of Pennsylvania). March 10, 2006
- ↑ Google отказался от мета тега Keywords
- ↑ http://www.google.com/search?q=intitle:google+site:wikipedia.org
- ↑ Поисковые операторы Google,Таблица операторов Google
- ↑ Официальный справочник на английском языке
- ↑ Описание операторов и встроенных функций расширенного поиска: общая страница; операторы и функции расширенного поиска; Advanced Operators (подробное описание операторов на английском); «шпаргалка» по языку поисковых запросов Google
- ↑ Regan, Keith (2008-03-24). ""Google's Search-Within-Search Draws Scutiny"". E-Commerce Times.
- ↑ Stamoulis, Nick (2008-03-24). "Why Companies Are Upset With Google's Search-Within-Search". Search Engine Optimization Journal.
- ↑ 1 2 Tedeschi, Bob (2008-03-24). "A New Tool From Google Alarms Sites". New York Times.
Ссылки
- Поисковая система Google
- Статья о поисковой системе Google на ru-board.com
- Google: технология поиска для нового тысячелетия
- Google добавил виртуальную клавиатуру к строке поиска
В другом языковом разделе есть более полная статья Google search (англ.). |