Поисковый спам: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][отпатрулированная версия]
Содержимое удалено Содержимое добавлено
Метки: с мобильного устройства через мобильное приложение через приложение для Android
 
(не показаны 34 промежуточные версии 31 участника)
Строка 1: Строка 1:
'''Поиско́вый спам''' (''спамдексинг'') — [[сайт]]ы и страницы в [[интернет]]е, созданные с целью манипуляций результатами поиска в [[Поисковая система|поисковых машинах]] — в конечном счете, для обмана пользователя.
<noinclude>{{К удалению|2020-07-12}}</noinclude>'''Поиско́вый спам''' ('''спамдексинг'''<ref>[http://searchengineland.com/what-is-search-engine-spam-the-video-edition-15202.php ''SearchEngineLand'', Danny Sullivan's video explanation of Search Engine Spam, October 2008] {{Wayback|url=http://searchengineland.com/what-is-search-engine-spam-the-video-edition-15202.php |date=20081217170328 }} . Retrieved 2008-11-13.</ref>, '''отравление поисковых систем''' или '''веб-спам''') — [[сайт]]ы и страницы в [[Интернет]]е, созданные с целью манипуляции результатами поиска в [[Поисковая система|поисковых машинах]] — в конечном счёте, для обмана пользователя.


== Основные виды поискового [[спам]]а ==
== Основные виды ==
* Не имеющие отношения к содержимому страницы, но популярные в поисковых запросах слова в [[тег (языки разметки)|тегах]] meta keywords, description, например ''sex'', ''халява''. Этот вид спама появился, когда [[веб-дизайн]] только зарождался. В результате поисковые машины стали анализировать не только специальные теги, но и сам текст сайта.
* Не имеющие отношения к содержимому страницы, но популярные в поисковых запросах слова в [[тег (языки разметки)|тегах]] «meta keywords», «description», например «''sex''», «''[[Халява (термин)|халява]]''». В результате поисковые машины стали анализировать не только специальные теги, но и сам текст сайта.
* «Накачка» текста ключевыми словами — искусственное повышение частоты ключевого слова или выражения в тексте и (или) использование элементов [[HTML|разметки HTML]] (h1-3, strong, b, em, i) для искусственного повышения веса ключевого слова.
* «Невидимый текст», текст, невидимый для посетителя страницы, но индексируемый поисковой машиной. Применяется цвет текста, соответствующий цвету фона, текст размером в 1 пиксель, блоки текста, со стилем «display:none».
* «Невидимый текст» — текст, невидимый для посетителя страницы, но индексируемый поисковой машиной. Применяется цвет текста, соответствующий цвету фона, текст размером в 1 [[пиксель]], блоки текста со стилем «display: none».
* Ссылочный спам — ссылки, «накручивающие» link popularity и PageRank сайта. Так как поисковики, отвечая на запрос, ориентируются на количество ссылок, имеющихся на других сайтах на данный ресурс, то появилась идея как-то увеличить число таких ссылок:
* Ссылочный спам — ссылки, «накручивающие» параметр «link popularity» и [[PageRank]] сайта. Так как поисковики, отвечая на запрос, ориентируются на количество ссылок, имеющихся на других сайтах на данный ресурс, то появилась идея как-то увеличить число таких ссылок:
*# Создать небольшие сайты на бесплатном хостинге, зарегистрировать их в большом количестве тематических каталогов и с них ссылаться на основной.
*# Создать небольшие сайты на бесплатном хостинге, зарегистрировать их в большом количестве тематических каталогов и с них ссылаться на основной.
*# Принять участие в обмене ссылками.
*# Принять участие в обмене ссылками.
Строка 11: Строка 12:


Поисковые машины борются с этим, создавая фильтры, в которые добавляют сайты, ссылки с которых не учитываются при ранжировании.
Поисковые машины борются с этим, создавая фильтры, в которые добавляют сайты, ссылки с которых не учитываются при ранжировании.
* [[Дорвей|Дорвеи]] — промежуточные страницы, созданные для накрутки веса страницы при [[ссылочное ранжирование|ссылочном ранжировании]] или для организации [[Гугл-бомба|Гугл-бомбы]]. В соответствии с технологией дорвеев в поисковом индексе надо продвигать специальную страницу дорвей. А уже с этой страницы перенаправлять на рекламную. У одной рекламной может быть неограниченное число дорвеев. Поисковые машины в ответ, удаляют из своей базы данных сайты, в которых есть автоматическое перенаправление. На что спамеры отвечают простой уловкой: просят посетителя самого нажать на кнопку «Вход на сайт» или что-то подобное.
* [[Дорвей|Дорвеи]] — промежуточные страницы, созданные для накрутки веса страницы при [[ссылочное ранжирование|ссылочном ранжировании]] или для организации [[Гугл-бомба|Гугл-бомбы]]. В соответствии с технологией дорвеев в поисковом индексе надо продвигать специальную страницу дорвей. А уже с этой страницы перенаправлять на рекламную. У одной рекламной может быть неограниченное число дорвеев. Поисковые машины в ответ удаляют из своей базы данных сайты, в которых есть автоматическое перенаправление. На что спамеры отвечают простой уловкой: просят посетителя самого нажать на кнопку «Вход на сайт» или что-то подобное.
* [[Клоакинг|Маскировка]] или клоакинг — анализ переменных запроса, при котором поисковой машине отдается содержимое сайта, отличное от того, которое видит пользователь.
* [[Клоакинг|Маскировка]], или «клоакинг» — анализ переменных запроса, при котором поисковой машине отдается содержимое сайта, отличное от того, которое видит пользователь.
* [[Рерайтинг]] полезных статей с других сайтов. В результатах поиска оказывается на первый взгляд много оригинальных статей на разных сайтах, а на самом деле это один и тот же текст, только каждое предложение на каждом сайте перефразировано по-своему.


== Последствия использования поискового спама ==
== Последствия использования поискового спама ==
1) Главная проблема, порождаемая поисковым спамом, заключается в том, что он генерирует кучу мусорного контента, затрудняя эффективную работу поисковых серверов, искажает объективное ранжирование интернет-ресурсов и релевантность поисковых результатов. В итоге это во многом обесценивает Интернет как источник получения объективной информации.
* Главная проблема, порождаемая поисковым спамом, заключается в том, что он генерирует множество мусорного контента, затрудняя эффективную работу поисковых серверов, искажает объективное ранжирование интернет-ресурсов и [[релевантность]] поисковых результатов. В итоге это во многом обесценивает Интернет как источник получения объективной информации.{{нет АИ|2|06|2011}}


2) В связи с активным использованием поискового спама отношения поисковик-сайт перешли из «дружеских» во «враждебные». Если ранние поисковые машины могли доверять ключевым словам, указаниям на частоту обновления, то в связи с активным использованием этих методов для «обмана» поисковых систем более поздние версии поисковиков были вынуждены практически полностью игнорировать эти указания, критически относясь к каждой из страниц сайта, что делает затруднительным поиск «добропорядочных» страниц к редким содержимым и прописанными ключевыми словами. Например, страница с текстом средневековой песни и ключевыми «средние века, поэзия, Восточная Европа», не обладающая большим количеством ссылок с других сайтов, не содержащая в тексте слова «средние века, поэзия» врят ли будет найдена по этим ключевым словам.
* Если ранние поисковые машины могли доверять ключевым словам, указаниям на частоту обновления, то, в связи с активным использованием этих методов для «обмана» поисковых систем, более поздние версии поисковиков были вынуждены практически полностью игнорировать эти указания, критически относясь к каждой из страниц сайта, что сделало затруднительным поиск «добропорядочных» страниц c редким содержимым и прописанными ключевыми словами. Например, страница с текстом средневековой песни и ключевыми «Средние века, поэзия, Восточная Европа», не обладающая большим количеством ссылок с других сайтов, не содержащая в тексте слова «Средние века, поэзия», вряд ли будет найдена по этим ключевым словам.


== Контрмеры ==
* Страницы, заподозренные в поисковом спаме, иногда исключаются поисковой системой из результатов поиска.
* Пользователи могут использовать поисковые операторы для фильтрации. Для Google ключевое слово, которому предшествует «-» (минус), будет исключать сайты, содержащие ключевое слово на своих страницах или в URL-адресах страниц из результатов поиска. Например, поиск «- <нежелательный сайт>» удалит сайты, содержащие слово «<нежелательный сайт>» на своих страницах, и страницы, URL-адрес которых содержит «<нежелательный сайт>».


== Примечания ==
{{примечания}}


{{rq|source|topic=IT}}
== См. также ==
{{перевести|en|Spamdexing}}
* [[Поисковая оптимизация]]
* [[Дорвей]]


{{SearchEngineOptimization}}
{{SearchEngineOptimization}}
Строка 30: Строка 36:
[[Категория:Поисковые системы]]
[[Категория:Поисковые системы]]
[[Категория:Поисковая оптимизация]]
[[Категория:Поисковая оптимизация]]

[[da:Spamblog]]
[[de:Suchmaschinen-Spamming]]
[[en:Spamdexing]]
[[es:Spamdexing]]
[[fr:Spamdexing]]
[[it:Spamdexing]]
[[ja:検索エンジンスパム]]
[[pl:Spamdexing]]

Текущая версия от 18:24, 21 января 2024

Поиско́вый спам (спамдексинг[1], отравление поисковых систем или веб-спам) — сайты и страницы в Интернете, созданные с целью манипуляции результатами поиска в поисковых машинах — в конечном счёте, для обмана пользователя.

Основные виды

[править | править код]
  • Не имеющие отношения к содержимому страницы, но популярные в поисковых запросах слова в тегах «meta keywords», «description», например «sex», «халява». В результате поисковые машины стали анализировать не только специальные теги, но и сам текст сайта.
  • «Накачка» текста ключевыми словами — искусственное повышение частоты ключевого слова или выражения в тексте и (или) использование элементов разметки HTML (h1-3, strong, b, em, i) для искусственного повышения веса ключевого слова.
  • «Невидимый текст» — текст, невидимый для посетителя страницы, но индексируемый поисковой машиной. Применяется цвет текста, соответствующий цвету фона, текст размером в 1 пиксель, блоки текста со стилем «display: none».
  • Ссылочный спам — ссылки, «накручивающие» параметр «link popularity» и PageRank сайта. Так как поисковики, отвечая на запрос, ориентируются на количество ссылок, имеющихся на других сайтах на данный ресурс, то появилась идея как-то увеличить число таких ссылок:
    1. Создать небольшие сайты на бесплатном хостинге, зарегистрировать их в большом количестве тематических каталогов и с них ссылаться на основной.
    2. Принять участие в обмене ссылками.
    3. Приобретать ссылки за деньги.
    4. Ссылочный спам с гостевых книг, блогов, вики и пр.

Поисковые машины борются с этим, создавая фильтры, в которые добавляют сайты, ссылки с которых не учитываются при ранжировании.

  • Дорвеи — промежуточные страницы, созданные для накрутки веса страницы при ссылочном ранжировании или для организации Гугл-бомбы. В соответствии с технологией дорвеев в поисковом индексе надо продвигать специальную страницу дорвей. А уже с этой страницы перенаправлять на рекламную. У одной рекламной может быть неограниченное число дорвеев. Поисковые машины в ответ удаляют из своей базы данных сайты, в которых есть автоматическое перенаправление. На что спамеры отвечают простой уловкой: просят посетителя самого нажать на кнопку «Вход на сайт» или что-то подобное.
  • Маскировка, или «клоакинг» — анализ переменных запроса, при котором поисковой машине отдается содержимое сайта, отличное от того, которое видит пользователь.
  • Рерайтинг полезных статей с других сайтов. В результатах поиска оказывается на первый взгляд много оригинальных статей на разных сайтах, а на самом деле это один и тот же текст, только каждое предложение на каждом сайте перефразировано по-своему.

Последствия использования поискового спама

[править | править код]
  • Главная проблема, порождаемая поисковым спамом, заключается в том, что он генерирует множество мусорного контента, затрудняя эффективную работу поисковых серверов, искажает объективное ранжирование интернет-ресурсов и релевантность поисковых результатов. В итоге это во многом обесценивает Интернет как источник получения объективной информации.[источник не указан 4953 дня]
  • Если ранние поисковые машины могли доверять ключевым словам, указаниям на частоту обновления, то, в связи с активным использованием этих методов для «обмана» поисковых систем, более поздние версии поисковиков были вынуждены практически полностью игнорировать эти указания, критически относясь к каждой из страниц сайта, что сделало затруднительным поиск «добропорядочных» страниц c редким содержимым и прописанными ключевыми словами. Например, страница с текстом средневековой песни и ключевыми «Средние века, поэзия, Восточная Европа», не обладающая большим количеством ссылок с других сайтов, не содержащая в тексте слова «Средние века, поэзия», вряд ли будет найдена по этим ключевым словам.
  • Страницы, заподозренные в поисковом спаме, иногда исключаются поисковой системой из результатов поиска.
  • Пользователи могут использовать поисковые операторы для фильтрации. Для Google ключевое слово, которому предшествует «-» (минус), будет исключать сайты, содержащие ключевое слово на своих страницах или в URL-адресах страниц из результатов поиска. Например, поиск «- <нежелательный сайт>» удалит сайты, содержащие слово «<нежелательный сайт>» на своих страницах, и страницы, URL-адрес которых содержит «<нежелательный сайт>».

Примечания

[править | править код]