Википедия:Запросы к ботоводам/Архив/Персоналии
Бот о персоналиях
Можно сделать один несложный но полезный бот: Он лезет во все под-категории Персоналий (вплоть до Хренологи Буркина Фасо) и проверяет, отнесены ли они к категории "Персоналии по алфавиту", и если нет - делает это. неон 08:17, 17 августа 2006 (UTC)
- Я уже делал такое год назад. Но проблема в том, что в эти категории попадает куча не-персоналий. Вы даже не можете представить себе сколько именно! Поэтому надо составлять список, а потом вручную вычёркивать оттуда лишнее. Это огромная работа. --CodeMonk 20:10, 18 августа 2006 (UTC)
Персоналии по алфавиту
Все статьи-разветвления для персон
Создание статей-разветвлений для статей вида (Ф, И), (Ф, И О), (Ф, И1 И2 И3) и так далее. Описание алгоритма:
Ищем название статьи в категории «Персоналии по алфавиту», выделяем в нём первое слово (тире не считается разделителем слов, так как есть фамилии вида Ф1-Ф2) — Х
Ищем все статьи с совпадающим с Х началом, запоминаем их названия (Y1-Yn), если статья о персоналии, то можно и строчку запомнить****.
Проверяем, есть ли уже статья с именем Х,
- если есть и она ((не перенаправление) или (не разветвление-статья)), то в служебную страницу *** дописываем строчку «* [[Х]]:» и на следующих строчках с отступами от начала строки [[Y1]]-[[Yn]] (для проверки позже человеком полноты заполнения статьи-разветвления). Переходим к следующей проверке Х.
- если disambig-статья (в тексте есть соответствующее сочетание), то дописываем, в строку, следующую за последней непустой строчкой перед строкой вида "[[Категория:.. или [[:]] или {{..}}, а если её нет, то в последнюю строчку "* [[Y1]]" (****если есть запомненная строка, до дописываем и её) далее до "* [[Yn]]".
- в остальных случаях записываем новую статью вида
- '''Х''':
- * [[Y1]] ****если есть соответствующая запомненная строка, то вписываем её.
- …
- * [[Yn]] ****если есть соответствующая запомненная строка, то вписываем её.
- {{disambig}}
- Дописываем строчку «* [[Х]]» в конец служебной страницы (***Проект:Работа для бота/Все статьи-разветвления для персон) для доработки человеком статей бота.
Если в названии проверяемой статьи есть ещё слова, кроме Х, то добавляем к Х следующее слово (часть названия статьи) и повторяем проверку. иначе переходим к новому слову.
**** факультативно, для более полного наполнения строчка выделяется и запоминается с начала статьи, если есть текст вида '''…''', начиная с текста после него и до конца абзаца (вроде как вводное предложение, если не правильно, то человек поправит).
Вероятно, алгоритм можно после дополнительного обдумывания использовать для всех статей, а не только персон. —Дмитрий (DaeX) 08:50, 3 ноября 2005 (UTC)
Все редиректы на персоны
Я думаю, что давно пора что-то делать с фамилиями именами и отчествами, поскольку полную систему редиректов никто не делает. Надо прошерстить категорию Персоналии, поскольку в большинстве случаев структура заглавия статей в этой категории <фамилия>[,][space]<первое имя>[space] <остальные имена>, то боту нетрудно будет сгенерировать редиректы с <имена> <фамилия>; <первое имя> <фамилия>; <фамилия>, <первое имя> и просто <фамилия>. Естественно, перед созданием редиректа проверяется нет ли уже статьи с таким именем, если есть, ссылка заносится в специальный список для ручной проверки, бот больше ничего не делает.--Begemotv2718 05:45, 17 Май 2005 (UTC)
- Боту можно поручить собрать список, но его всё равно придётся просматривать вручную. <Первое имя> <фамилия> — не всегда то, что нужно, правильно — <наиболее используемое имя или имена> <фамилия> (Карл Фридрих Гаусс, но не Карл Гаусс), кроме того, проблема с родовыми приставками перед фамилиями (фон Нейман, но Лейбниц — хотя тоже «фон»). Maxim Razin 07:34, 17 Май 2005 (UTC)
- И что в этом страшного? Если робот ошибётся просто появится лишний редирект да и всё. --Ctac (Стас Козловский) 19:50, 27 Май 2005 (UTC)
- Убедил. Лишние редиректы почти никогда не мешают.Maxim Razin 20:55, 28 Май 2005 (UTC)
- Так боты создают статьи-редиректы «Фамилия Имя Отчество», «Фамилия Имя», «Фамилия, Имя», «Имя Фамилия», «Имя Отчество Фамилия», «Фамилия» на статьи вида «Фамилия, Имя Отчество», находящихся в категории «Персоналии» и её подкатегориях? Или нет? Имхо, такой бот был бы ОЧЕНЬ полезен.--Ctac (Стас Козловский) 21:38, 23 июн 2005 (UTC)
- Убедил. Лишние редиректы почти никогда не мешают.Maxim Razin 20:55, 28 Май 2005 (UTC)
Уважаемые господа-ботовладельцы :),
прежде чем запускать боты, посмотрите Википедия:Форум#Запятая после фамилии в названии статьи? и Проект:Персоналии#Правила названия статей. Общими усилиями, вроде бы, пришли к решению следовать правилам названия статей указанных в последней ссылке. Там обговорен и вариант с приставкой: фамилия, имя + приставка (Ларошфуко, Франсуа де). --Дмитрий 13:35, 31 Май 2005 (UTC)
Пользуясь случаем, позвольте спросить: а что бот умеет или на что он способен? И как это осуществляется технически? --Дмитрий 13:42, 31 Май 2005 (UTC)
- Умеет — всё что алгоритмизуемо. ;-) --Begemotv2718 21:15, 31 Май 2005 (UTC)
Раз уж персон собрали в одной категории Персоналии по алфавиту, то упрощается задача создания всех редиректов на них. Сейчас для подавляющего большинства есть лишь статья вида Ф., И. О. Что нужно сделать (описание алгоритма):
перед записью любой статьи проверка, нет ли уже такой статьи, если есть, то ничего не делать.
redirect И О Ф
redirect И Ф
redirect Ф
redirect Ф, И
redirect Ф И
redirect Ф И О
Если название статьи из 4 слов — Ф, И1 И2 И3, то
redirect И1 И2 И3 Ф
redirect И1 И2 Ф
redirect И1 Ф
redirect Ф
redirect Ф, И1 И2
redirect Ф, И1
Для 2-х или более 4-х слов алгоритм понятен.
По поводу приставок фон ля и пр., часто видел и то и др. написание, так что не помешают оба.
Чтобы не было сомнений в работе бота, надо записать всё на страницу, которую я готов проверить и поудалять всё ненужное. --Дмитрий (DaeX) 08:28, 2 ноября 2005 (UTC)
- Полезность такого бота понятна, только вот объёмы уж очень большие. Сейчас в Википедии более 8 000 статей о персонах. Следовательно, исходя из предложенного алгоритма, потребуется создать более 40 000 статей-редиректов. Это не шутка. --CodeMonk 16:59, 2 ноября 2005 (UTC)
- И всё для того, чтобы оставить формат "Фамилия, Имя Отчество"? Ну почему мы так на это напираем?! - ни одна из других языков этого не делает - мы единственные. --Yurik 07:02, 14 июня 2006 (UTC)