Поисковый спам: различия между версиями
Перейти к навигации
Перейти к поиску
[непроверенная версия] | [отпатрулированная версия] |
Содержимое удалено Содержимое добавлено
→Основные виды поискового спама: дополнение |
Метки: с мобильного устройства через мобильное приложение через приложение для Android |
||
(не показаны 44 промежуточные версии 40 участников) | |||
Строка 1: | Строка 1: | ||
<noinclude>{{К удалению|2020-07-12}}</noinclude>'''Поиско́вый спам''' ('''спамдексинг'''<ref>[http://searchengineland.com/what-is-search-engine-spam-the-video-edition-15202.php ''SearchEngineLand'', Danny Sullivan's video explanation of Search Engine Spam, October 2008] {{Wayback|url=http://searchengineland.com/what-is-search-engine-spam-the-video-edition-15202.php |date=20081217170328 }} . Retrieved 2008-11-13.</ref>, '''отравление поисковых систем''' или '''веб-спам''') — [[сайт]]ы и страницы в [[Интернет]]е, созданные с целью манипуляции результатами поиска в [[Поисковая система|поисковых машинах]] — в конечном счёте, для обмана пользователя. |
|||
{{sprotected}} |
|||
'''Поиско́вый спам''' (''спамдексинг'') — [[сайт]]ы и страницы в [[интернет]]е, созданные с целью манипуляций результатами поиска в [[Поисковая система|поисковых машинах]] — в конечном счете, для обмана пользователя. |
|||
== Основные виды |
== Основные виды == |
||
* Не имеющие отношения к содержимому страницы, но популярные в поисковых запросах слова в [[тег]] |
* Не имеющие отношения к содержимому страницы, но популярные в поисковых запросах слова в [[тег (языки разметки)|тегах]] «meta keywords», «description», например «''sex''», «''[[Халява (термин)|халява]]''». В результате поисковые машины стали анализировать не только специальные теги, но и сам текст сайта. |
||
* «Накачка» текста ключевыми словами — искусственное повышение частоты ключевого слова или выражения в тексте и (или) использование элементов [[HTML|разметки HTML]] (h1-3, strong, b, em, i) для искусственного повышения веса ключевого слова. |
|||
* «Невидимый текст» |
* «Невидимый текст» — текст, невидимый для посетителя страницы, но индексируемый поисковой машиной. Применяется цвет текста, соответствующий цвету фона, текст размером в 1 [[пиксель]], блоки текста со стилем «display: none». |
||
* Ссылочный спам |
* Ссылочный спам — ссылки, «накручивающие» параметр «link popularity» и [[PageRank]] сайта. Так как поисковики, отвечая на запрос, ориентируются на количество ссылок, имеющихся на других сайтах на данный ресурс, то появилась идея как-то увеличить число таких ссылок: |
||
*# Создать небольшие сайты на бесплатном хостинге, зарегистрировать их в большом количестве тематических каталогов и с них ссылаться на основной. |
*# Создать небольшие сайты на бесплатном хостинге, зарегистрировать их в большом количестве тематических каталогов и с них ссылаться на основной. |
||
*# Принять участие в обмене ссылками. |
*# Принять участие в обмене ссылками. |
||
Строка 12: | Строка 12: | ||
Поисковые машины борются с этим, создавая фильтры, в которые добавляют сайты, ссылки с которых не учитываются при ранжировании. |
Поисковые машины борются с этим, создавая фильтры, в которые добавляют сайты, ссылки с которых не учитываются при ранжировании. |
||
* [[Дорвей|Дорвеи]] |
* [[Дорвей|Дорвеи]] — промежуточные страницы, созданные для накрутки веса страницы при [[ссылочное ранжирование|ссылочном ранжировании]] или для организации [[Гугл-бомба|Гугл-бомбы]]. В соответствии с технологией дорвеев в поисковом индексе надо продвигать специальную страницу дорвей. А уже с этой страницы перенаправлять на рекламную. У одной рекламной может быть неограниченное число дорвеев. Поисковые машины в ответ удаляют из своей базы данных сайты, в которых есть автоматическое перенаправление. На что спамеры отвечают простой уловкой: просят посетителя самого нажать на кнопку «Вход на сайт» или что-то подобное. |
||
* [[Клоакинг|Маскировка]] или клоакинг |
* [[Клоакинг|Маскировка]], или «клоакинг» — анализ переменных запроса, при котором поисковой машине отдается содержимое сайта, отличное от того, которое видит пользователь. |
||
* [[Рерайтинг]] полезных статей с других сайтов. В результатах поиска оказывается на первый взгляд много оригинальных статей на разных сайтах, а на самом деле это один и тот же текст, только каждое предложение на каждом сайте перефразировано по-своему. |
|||
Подобные методы обмана и борьба с ними — типичный случай извечного противостояния оружия и защиты («сняряда и брони»). |
|||
== Последствия использования поискового спама == |
== Последствия использования поискового спама == |
||
Главная проблема |
* Главная проблема, порождаемая поисковым спамом, заключается в том, что он генерирует множество мусорного контента, затрудняя эффективную работу поисковых серверов, искажает объективное ранжирование интернет-ресурсов и [[релевантность]] поисковых результатов. В итоге это во многом обесценивает Интернет как источник получения объективной информации.{{нет АИ|2|06|2011}} |
||
⚫ | * Если ранние поисковые машины могли доверять ключевым словам, указаниям на частоту обновления, то, в связи с активным использованием этих методов для «обмана» поисковых систем, более поздние версии поисковиков были вынуждены практически полностью игнорировать эти указания, критически относясь к каждой из страниц сайта, что сделало затруднительным поиск «добропорядочных» страниц c редким содержимым и прописанными ключевыми словами. Например, страница с текстом средневековой песни и ключевыми «Средние века, поэзия, Восточная Европа», не обладающая большим количеством ссылок с других сайтов, не содержащая в тексте слова «Средние века, поэзия», вряд ли будет найдена по этим ключевым словам. |
||
<!-- |
|||
Написал и понял, что не очень -_- |
|||
== Контрмеры == |
|||
== Последствия использования поискового спама == |
|||
* Страницы, заподозренные в поисковом спаме, иногда исключаются поисковой системой из результатов поиска. |
|||
⚫ | |||
* Пользователи могут использовать поисковые операторы для фильтрации. Для Google ключевое слово, которому предшествует «-» (минус), будет исключать сайты, содержащие ключевое слово на своих страницах или в URL-адресах страниц из результатов поиска. Например, поиск «- <нежелательный сайт>» удалит сайты, содержащие слово «<нежелательный сайт>» на своих страницах, и страницы, URL-адрес которых содержит «<нежелательный сайт>». |
|||
== Примечания == |
|||
{{примечания}} |
|||
{{rq|source|topic=IT}} |
|||
--> |
|||
{{перевести|en|Spamdexing}} |
|||
{{SearchEngineOptimization}} |
|||
== См. также == |
|||
* [[Поисковая оптимизация]] |
|||
* [[Дорвей]] |
|||
[[Категория:Спам]] |
[[Категория:Спам]] |
||
[[Категория:Поисковые системы]] |
[[Категория:Поисковые системы]] |
||
[[Категория:Поисковая оптимизация]] |
[[Категория:Поисковая оптимизация]] |
||
[[da:Spamblog]] |
|||
[[de:Suchmaschinen-Spamming]] |
|||
[[en:Spamdexing]] |
|||
[[fr:Spamdexing]] |
|||
[[it:Spamdexing]] |
|||
[[ja:検索エンジンスパム]] |
|||
[[pl:Link spam]] |
Текущая версия от 18:24, 21 января 2024
Эту статью предлагается удалить. |
Поиско́вый спам (спамдексинг[1], отравление поисковых систем или веб-спам) — сайты и страницы в Интернете, созданные с целью манипуляции результатами поиска в поисковых машинах — в конечном счёте, для обмана пользователя.
Основные виды
[править | править код]- Не имеющие отношения к содержимому страницы, но популярные в поисковых запросах слова в тегах «meta keywords», «description», например «sex», «халява». В результате поисковые машины стали анализировать не только специальные теги, но и сам текст сайта.
- «Накачка» текста ключевыми словами — искусственное повышение частоты ключевого слова или выражения в тексте и (или) использование элементов разметки HTML (h1-3, strong, b, em, i) для искусственного повышения веса ключевого слова.
- «Невидимый текст» — текст, невидимый для посетителя страницы, но индексируемый поисковой машиной. Применяется цвет текста, соответствующий цвету фона, текст размером в 1 пиксель, блоки текста со стилем «display: none».
- Ссылочный спам — ссылки, «накручивающие» параметр «link popularity» и PageRank сайта. Так как поисковики, отвечая на запрос, ориентируются на количество ссылок, имеющихся на других сайтах на данный ресурс, то появилась идея как-то увеличить число таких ссылок:
- Создать небольшие сайты на бесплатном хостинге, зарегистрировать их в большом количестве тематических каталогов и с них ссылаться на основной.
- Принять участие в обмене ссылками.
- Приобретать ссылки за деньги.
- Ссылочный спам с гостевых книг, блогов, вики и пр.
Поисковые машины борются с этим, создавая фильтры, в которые добавляют сайты, ссылки с которых не учитываются при ранжировании.
- Дорвеи — промежуточные страницы, созданные для накрутки веса страницы при ссылочном ранжировании или для организации Гугл-бомбы. В соответствии с технологией дорвеев в поисковом индексе надо продвигать специальную страницу дорвей. А уже с этой страницы перенаправлять на рекламную. У одной рекламной может быть неограниченное число дорвеев. Поисковые машины в ответ удаляют из своей базы данных сайты, в которых есть автоматическое перенаправление. На что спамеры отвечают простой уловкой: просят посетителя самого нажать на кнопку «Вход на сайт» или что-то подобное.
- Маскировка, или «клоакинг» — анализ переменных запроса, при котором поисковой машине отдается содержимое сайта, отличное от того, которое видит пользователь.
- Рерайтинг полезных статей с других сайтов. В результатах поиска оказывается на первый взгляд много оригинальных статей на разных сайтах, а на самом деле это один и тот же текст, только каждое предложение на каждом сайте перефразировано по-своему.
Последствия использования поискового спама
[править | править код]- Главная проблема, порождаемая поисковым спамом, заключается в том, что он генерирует множество мусорного контента, затрудняя эффективную работу поисковых серверов, искажает объективное ранжирование интернет-ресурсов и релевантность поисковых результатов. В итоге это во многом обесценивает Интернет как источник получения объективной информации.[источник не указан 4953 дня]
- Если ранние поисковые машины могли доверять ключевым словам, указаниям на частоту обновления, то, в связи с активным использованием этих методов для «обмана» поисковых систем, более поздние версии поисковиков были вынуждены практически полностью игнорировать эти указания, критически относясь к каждой из страниц сайта, что сделало затруднительным поиск «добропорядочных» страниц c редким содержимым и прописанными ключевыми словами. Например, страница с текстом средневековой песни и ключевыми «Средние века, поэзия, Восточная Европа», не обладающая большим количеством ссылок с других сайтов, не содержащая в тексте слова «Средние века, поэзия», вряд ли будет найдена по этим ключевым словам.
Контрмеры
[править | править код]- Страницы, заподозренные в поисковом спаме, иногда исключаются поисковой системой из результатов поиска.
- Пользователи могут использовать поисковые операторы для фильтрации. Для Google ключевое слово, которому предшествует «-» (минус), будет исключать сайты, содержащие ключевое слово на своих страницах или в URL-адресах страниц из результатов поиска. Например, поиск «- <нежелательный сайт>» удалит сайты, содержащие слово «<нежелательный сайт>» на своих страницах, и страницы, URL-адрес которых содержит «<нежелательный сайт>».
Примечания
[править | править код]- ↑ SearchEngineLand, Danny Sullivan's video explanation of Search Engine Spam, October 2008 Архивная копия от 17 декабря 2008 на Wayback Machine . Retrieved 2008-11-13.
Для улучшения этой статьи по информационным технологиям желательно:
|
В другом языковом разделе есть более полная статья Spamdexing (англ.). |