Обсуждение участника:BsivkoBot/Архив/1

Без заголовка

Здесь находятся завершившиеся обсуждения. Просьба не вносить изменений.

Добро пожаловать, BsivkoBot!

От имени участников Википедии приветствую вас в её разделе на русском языке. Надеемся, вы получите большое удовольствие от участия в проекте.

Обратите внимание на основные принципы участия: правьте смело и предполагайте добрые намерения.

Если у вас возникают вопросы, воспользуйтесь справочными материалами. Если вы не нашли в них ответа на свой вопрос, задайте его своему наставнику через «Домашнюю страницу» или через панель помощи при редактировании статьи. Также вопрос можно задать на форуме помощи начинающим или Discord-сервере русской Википедии.

Если вы не можете создать статью одной правкой и намерены вернуться к её написанию позже, поставьте в начало текста шаблон {{subst:Редактирую}} для уведомления об этом других участников.

Кнопка подписи в интерфейсе редактирования вики-текста после кнопки «Курсив».
Так можно подписаться

Статьи в Википедии не подписываются (список авторов формируется автоматически и доступен в истории правок статьи); в обсуждениях при редактировании кода, пожалуйста, ставьте после сообщения четыре тильды (~~~~): они будут автоматически преобразованы в подпись и дату.

На своей личной странице вы можете сообщить некоторые сведения о себе — например, владение языками или интересы.

И ещё раз, добро пожаловать!

Hello and welcome to the Russian Wikipedia! We appreciate your contributions. If your Russian skills are not good enough, that’s no problem. We have an embassy where you can inquire for further information in your native language. We hope you enjoy your time here!

С уважением, 188.254.110.45 10:44, 13 июня 2018 (UTC)

Испавление формата дат

Бот исправил 2018-12-9 на 2018-09-12. --Браунинг (обс.) 08:34, 12 января 2019 (UTC)

Где вообще принято решение, что в английских и других иноязычных источниках должна стоять русская дата? --Deinocheirus (обс.) 13:55, 31 марта 2019 (UTC)

  • Бот в шаблонах исправлений на русский язык не производит. Мотивация и как это работает расписана на соотв. странице Участник:BsivkoBot/Формат_дат_ГГГГ-ММ-ДД#Мотивация. Bsivko (обс.) 14:07, 31 марта 2019 (UTC)
    • В аргументации по указанному адресу и в вашем замечании ниже есть одно важное упущение: в британских/австралийских и американских источниках принят разный формат представления даты — в первом случае XX Month Year, во втором — Month XX, Year. Думаю, сохранение соответствующего формата не менее важно, чем сохранение, скажем, орфографии. Если мне не изменяет память, этот вопрос обсуждался на форумах и консенсуса за ковровую замену дат не было. --Deinocheirus (обс.) 19:04, 31 марта 2019 (UTC)
      • Нужны конкретные случаи распознавания. Четёрыхзначный год и месяц как слово однозначно будут восприняты корректно, вне зависимости от UK/AU. Консенсус записан на страницах шаблонов и неоднократно обсуждался на номинациях к статусным статьям. Если же дата записана как 10-11-2000, то её и человек не распознает, бот приведёт только к ГГГГ-ММ-ДД, и будет то же самое, только в корректной форме записи. Bsivko (обс.) 19:25, 31 марта 2019 (UTC)
  • В этой статье в ссылках не указан язык. Если его указать, то шаблон переведёт всё оформление ссылки на соотв. язык. Bsivko (обс.) 14:19, 31 марта 2019 (UTC)

Шаблон компьютерная игра

Полагаю, что серверы Википедии перегружены электронными данными статей, поэтому появилась необходимость ликвидации отступов в шаблоне. Наверное, я просто что-то пропустил в обсуждении ПРОЕКТ:КИ. Да, отступы порядком увеличивают объёмы статей, раздувая мнимую важность их содержания, а критерии выдвижения в избранные, хорошие или добротные требуют определённого количества килобайтов. Поэтому основная работа по выверке материала зачастую происходит уже в процессе номинации статьи, но и после получения желаемого статуса остаются шероховатости. Наличие отступов улучшает визуальное восприятие редактируемого участником текста. В остальном же бота можно только похвалить — заслужил свою порцию комплиментов.--Роман Заморухов (обс.) 11:55, 15 января 2019 (UTC)

В прошлый раз было определённо лучше, если в качестве примера рассматривать поправку в статье Silent Hill 4: The Room. С уважением, Роман Заморухов (обс.) 12:02, 16 января 2019 (UTC)

Удаление пробела

Special:Diff/98953320 — кажется, пользы от этой правки нет. Вреда тоже, но на всякий случай обращаю внимание. --Браунинг (обс.) 11:01, 31 марта 2019 (UTC)

Переводчик «cite journal» на шаблон «статья»

В проекте КИ мы столкнулись с некооторыми сложностями использования шаблона, а также с его артефактами и отсутствием сопровождения. В связи с этим попробовали написать переводчика для преобразования его в {{статья}}. Пока что тесты прошли успешно. Если кто-то желает обработать статью, то это можно сделать. А про возможность использования открыта тема в проекте КИ. Bsivko (обс.) 20:11, 18 ноября 2018 (UTC)

  • Звучит интересно! А я правильно понял, что он позиционируется как инструмент для ручного перевода, требующий проверки, или потенциально его можно будет запустить на всех использованиях и где сможет - переведёт, где не сможет - оставит для ручной обработки? Викизавр (обс.) 23:09, 18 ноября 2018 (UTC)
    • Изначально задумывалось чтобы оно обработало всё. Т.е. сначала десяток статей, вылавливаем ошибки и правим, потом сотню статей, ищем ошибки и правим, .. И так с постепенным допиливанием бот должен суметь разрулить практически всё. Bsivko (обс.) 09:05, 27 ноября 2018 (UTC)
  • И такой вопрос - после обновления {{cite journal}} firstn и lastn стали поддерживаться, а в {{статья}} ничего такого нет и бот их слепляет вместе; насколько я понимаю, это разделение полезно для генерации метаданных en:COinS, хотя лучше у английских коллег спросить, почему они выбрали тратить кучу сил на их разделение, как автоматическое, так и ручное; может быть, можно как-то не терять эту информацию?
    Если что, поясню свою позицию - хотя {{cite journal}} и тупиковая ветвь развития, нужная для совместимости, далёкое будущее шаблонов цитирования видится на английский манер - с тщательной проверкой параметров, выдаванием ошибок и категорий, метаданными и кучей всего запрограммированного в модуль; сейчас это нереально, никто не будет тратить силы на такую громадную работу (например, англомодуль - несколько тысяч строк кода), но хочется уже сейчас делать так, чтобы в будущем возникло наименьшее число проблем. Викизавр (обс.) 23:25, 18 ноября 2018 (UTC)
  • И ещё: можно обработать Участник:Vort/CJ500? Викизавр (обс.) 23:33, 18 ноября 2018 (UTC)
    • Обработал. Сразу вылезла куча неизвестных и незадокументированных параметров:

14, adres czasopisma, at, authorlink1, author-link1, authorlink2, author-link2, author-separator, chapter, czasopismo, data, datepublished, deadlink, department, description, displayauthors, display-editors, editor, editor1-first, editor1-last, editor1-link, editor-first, editor-last, editor-link, jezyk, jstor, laydate, laysource, laysummary, miejsce, mr, name, number, oclc, oznaczenie, periodical, place, pmc, pmcid, postscript, publication-place, separator, series, subscription, trans_title, vauthors, via, wolumin, work, wydanie

Те что нашёл добавил, но с такими нужно решить что делать. Часть из них как-то попало видимо из других шаблонов, какие-то можно догогвориться конвертировать (datepublished → date → год-месяц-число; place → место). Bsivko (обс.) 00:16, 19 ноября 2018 (UTC)

Тире

    • 1) В соответствие с ВП:Тире приведите, пожалуйста. 1а) Диапазоны с тире не только в страницах встречаются, но и в томах и номерах/выпусках. 2) Если бот сумеет диапазоны до правильного форматировать, то тоже будет хорошо: если вторая цифра диапазона меньше первой, то надо что-то делать. — VladXe (обс.) 07:00, 21 ноября 2018 (UTC)
      • Насколько я понимаю, это не проблема перевода, а общее состояние для многих шаблонов, в том числе и для {{статья}}. И здесь скорее нужно уже пост-фактум обрабатывать шаблон «статья» и его поля в контексте другой задачи. И ее лучше сразу формализованно сформулировать, например «для полей „страницы“, „том“, „номер“, „выпуск“ если содержаться только цифры и знак „-“, то первый из знаков „-“ заменить на „—“, а остальные удалить». Bsivko (обс.) 09:49, 21 ноября 2018 (UTC)
        • Неверно. Допустимо «P. 11—14, 18, 25—27.», недопустимо «P. 2014–16.» и «pp. 89-99.» — VladXe (обс.) 10:13, 21 ноября 2018 (UTC)
          • Верно или неверно это вопросы к ручной обработке. У бота должны быть минимальны ложные срабатывания. И конкретно должно быть написано, что делать. Залезть по ссылке и прочитать станицы бот не умеет. Страницы могут быть в виде «2.1-2.2» или «xvii-20». И т.д. Если нет возможности формализовать задачу, то и не надо ее ставить. Bsivko (обс.) 10:32, 21 ноября 2018 (UTC)
            • Тогда проще: в полях «страницы», «том», «номер», «выпуск» заменить все чёрточки на длинное тире. — VladXe (обс.) 10:46, 21 ноября 2018 (UTC)
              • Хорошо, в ближайшее время добавлю отдельной задачей к боту. И это для полей шаблона {{статья}}. Bsivko (обс.) 10:50, 21 ноября 2018 (UTC)
                • Вообще-то и Ш:Книга тоже, разве что в разделе том оставить как есть, так как там возможна нерусская пунктуация с коротким тире, типа «Volume 5 – Chrysiogenetes». Но диапазоны страниц должны быть с длинным тире, ибо ГОСТ и ВП:Тире. — VladXe (обс.) 11:03, 21 ноября 2018 (UTC)

Свободный доступ

  • В {{cite journal}} ссылка на arXiv выдаётся с зелёным открытым замком и подсказкой "Freely accessible", а в {{статья}} этого нет, но было бы полезно иметь. Кроме того, английский шаблон проверяет число символов в bibcode и выдаёт предупреждение в случае чего (например, если викификатором три точки соединены в один символ). Сравните:
    • {{статья|автор=Refregier A.|заглавие=Weak gravitational lensing by large-scale structure|издание=[[Annual Review of Astronomy and Astrophysics]]|год=2003|том=41|выпуск=1|страницы=645—668|ссылка=|doi=10.1146/annurev.astro.41.111302.102207|arxiv=astro-ph/0307212|bibcode=2003ARA&A.41..645R.|язык=en}} Refregier A. Weak gravitational lensing by large-scale structure (англ.) // Annual Review of Astronomy and Astrophysics. — 2003. — Vol. 41, iss. 1. — P. 645—668. — doi:10.1146/annurev.astro.41.111302.102207. — Bibcode2003ARA&A..41..645R.. — arXiv:astro-ph/0307212.
    • {{Cite journal |last1=Refregier |first1=A. |date=2003 |title=Weak gravitational lensing by large-scale structure |journal=[[Annual Review of Astronomy and Astrophysics]] |volume=41 |issue=1 |pages=645–668 |arxiv=astro-ph/0307212 |bibcode=2003ARA&A.41..645R. |doi =10.1146/annurev.astro.41.111302.102207 }}Refregier, A. (2003). Weak gravitational lensing by large-scale structure. Annual Review of Astronomy and Astrophysics. 41 (1): 645–668. arXiv:astro-ph/0307212. Bibcode:2003ARA&A..41..645R.. doi:10.1146/annurev.astro.41.111302.102207. {{cite journal}}: Проверьте |bibcode=: length (справка)
    • В конце поля bibcode в обоих случаях специально добавлена лишняя точка. -- V1adis1av (обс.) 23:16, 22 ноября 2018 (UTC)
      • bibcode есть в {{статья}}, и проверку уже нужно делать там. У меня ни прав, ни квалификации изменять {{статья}} нет. Теоретически программно во время обработки бот может что-то проверить и подправить, но это неправильно, т.к. шаблон должен сам справляться с такими задачами, иначе придется ботом обрабатывать каждое редактирование каждого шаблона. Поэтому при конвертации вопрос как сохранить информацию {{cite journal}} если она есть в полях шаблона. Например, сейчас я поставил параметры «*-access» на удаление, но можно их оставить, чтобы потом их подхватывал шаблон {{статья}}. А как {{cite journal}} понимает, что arxiv в свободном доступе? Bsivko (обс.) 23:59, 22 ноября 2018 (UTC)

Диапазоны без лидирующих цифр

  • 2) Повторю вопрос: сложно сделать на Луа анализатор правильности диапазона, чтобы исправлял такое 12345-67 до 12345—12367? --VladXe (обс.) 13:55, 24 ноября 2018 (UTC)
    • На Lua лично я никогда не писал, мой бот Python'овский. По примеру не понятно что исправлять. Bsivko (обс.) 14:28, 24 ноября 2018 (UTC)
      • Неправильные диапазоны страниц, которые очень часто фигурируют на американских сайтах, например NCBI. В русской типографике до такого не дошли (разве что в х/ф "Необыкновенное чудо"), чтобы отбрасывать первые неизменяемые знаки во втором числе диапазона. --VladXe (обс.) 14:52, 24 ноября 2018 (UTC)
        • Это если второе значение больше первого, то дополнить второе отсутствующими цифрами из первого? Bsivko (обс.) 15:04, 24 ноября 2018 (UTC)
          • Да с поправкой: если обе границы диапазона числа и второе меньше первого, по дополнить недостающие разряды правой границы разрядами с левой границы. — VladXe (обс.) 15:07, 24 ноября 2018 (UTC)
            • Не совсем понятно последнее. Если можно, опишите на примерах граничных вариантов. Bsivko (обс.) 15:22, 24 ноября 2018 (UTC)
              • Я же писал: 12345-6712345—12367:
  1. 67 < 12345 =>
  2. в левой границе 5 разрядов, в правой — 2, разница = 3
  3. первые 3 разряда левой границы приписываем ко второму числу.
ИМХО, п.2 удобно делать в 10-х логарифмах, а 3 с деленим без остатка: Правая_граница := Правая_граница + Левая_граница div 10^N2 * 10^N2, где N2 — результат п. 2 --VladXe (обс.) 15:29, 24 ноября 2018 (UTC)
Вместо логарифмов можно же просто считать символы. Т.е., если поле выглядит как «N-M», где N и M это числа, и если N > M, и если длина N больше длины M, то дополнить M соответствующими старшими разрядами N? Bsivko (обс.) 15:42, 24 ноября 2018 (UTC)
Реализовал по описанию. Результат можно увидеть например так. Bsivko (обс.) 18:56, 24 ноября 2018 (UTC)

Отображение страницы Участник:Vort/CJ500

Есть претензия к отображению результата: бот зачем-то меняет содержимое столбца Старое оформление, поэтому абсолютно непонятно, что же всё-таки он делает. Просьба восстановить первоначальное состояние этого столбца, и уже к нему применить бота, записав результат в Новое оформление, а также в дальнейшем не допускать, чтобы состояние столбца Старое оформление менялось. --VladXe (обс.) 09:59, 25 ноября 2018 (UTC)

  • Бот меняет всю страницу. Что он делает написано по ссылке, подробно. Bsivko (обс.) 16:44, 26 ноября 2018 (UTC)
    • Я уже писал, что это неправильное поведение бота. «Надо что-то в консерватории поправить», возможно нужен второй узкоспециализированный алгоритм, который будет формировать из 2 страниц (Старое оформление как исходная константа и Новое оформление = предыдущая стр., обработанная ботом) таблицу. Тогда будет видно больше ошибок, причём они будут наглядные, а не так как сейчас, сначала за первый прогон одно исправили , потом за второй — второе. На этой СО на примере викификатора показано, что результат может сильно отличаться. — VladXe (обс.) 09:23, 27 ноября 2018 (UTC)
      • Какое — «это неправильное»? Бот обрабатывает всю страницу, он не должен различать колонки таблиц. Чтобы сравнить старое и новое не нужно перепиливать ботов. Достаточно например открыть два окна браузера и просмотреть параллельно две версии. Bsivko (обс.) 09:41, 27 ноября 2018 (UTC)
      • Возможно есть какие-нибудь html-ные способы поместить два варианта страницы на одну, но мне они неизвестны. Может подскажут другие участники. Bsivko (обс.) 09:52, 27 ноября 2018 (UTC)
        • Можно перед обработкой (вручную) заменить cite journal (который в левой колонке) на что-нибудь другое, а cite2 journal (который в правой) оставить, и вернуть после обработки.
          Или можно убрать из списка, получаемого get_all_redirects_to_page, ш:cite2 journal, чтобы оно его не обрабатывало (редирект почти не используется), только столбцы тогда надо поменять местами. Викизавр (обс.) 10:19, 27 ноября 2018 (UTC)

Языки

Кто-нибудь делал анализатор языка фразы кир/лат? --VladXe (обс.) 15:10, 24 ноября 2018 (UTC)

Баг-репорты

00) Почему используется Ш:нп3? Тот же нп5 более компактный и курсивонезависимый. 0) На основании чего проставляется тип = journal? См. №. 27. 1) Что в № 22? У меня вылезло куча квадратиков. 2) № 37 — перевод не показан. 3) № 42 — куда делось содержимое кавычек? 4) № 46, 50 — куда делись метки о проверке? 5) № 57 — куда делось et al. из авторства? Пока хватит. — VladXe (обс.) 14:10, 27 ноября 2018 (UTC)

  • 00) потому что не нужно бомбить читателей красным цветом 0) на основании факта «cite journal», и мапится сейчас из 7 языков (en, ru, de, es, it, fr, sv). 1) вероятно проблема браузера, у меня показаны иероглифы 2) какой перевод? там пропал формат, которого нет в шаблоне статьи. 3) ушло в параметр «цитата», который может быть когда-нибудь в шаблоне статьи появится. 4) в шаблоне статьи нет метки о проверке 5) никуда не делось, это часть имени. Bsivko (обс.) 15:25, 27 ноября 2018 (UTC)
    • 0) Можно перевести термин «мапится»? Также непонятно, тип = journal ставится только потому, что в оригинале шаблон используется «cite journal»? Очень странный критерий, в рувики с ш: Статья не только статьи бывают и т. п. 1) То есть при использовании японского языка переводятся и служебные слова? ИМХО, бот пытается быть святее Папы Римского, потому что ни Ш:Статья, ни Ш:Публикация иероглифические языки не поддерживают. 2) Перевод названия организации на рус. язык. То что статья рувики называется по-русски, еще не даёт право переводить организацию в библиограф. записи. Ошибка. 3) В Ш:Публикация есть хороший параметр примечание, ИМХО, здесь он тоже уместен. 4) Да пофиг, есть фраза о поверке, если бот её не должен съедать. См. п. 3. 5) Это неправильное поведение бота. «et al.» + «и др.» по-любому должны быть в конце списка авторов. Ошибка. — VladXe (обс.) 17:11, 27 ноября 2018 (UTC)
      • Мапится это когда есть словарь вида "ключ-значение" (en → journal, ru → журнал, ..), и по ключу идет подстановка значения. «cite journal» это и есть «ссылка на журнал», откуда определяется тип источника — журнал. 1) тут проблема адаптации русскоязычного варианта cite journal, который (слева в таблице) поперхнулся и не показывает заглавие, а оно есть; посмотрите исходный код страницы. 2) а, т.е. сохранять текст оригинала; это поправимо. 3) в шаблоне статьи такого параметра не видно. 4) Если вам пофиг, то сделайте запрос на СО {{статья}} чтобы добавили поле для фразы, я его поддержу, и будет счастье. 5) их там записали как имя автора, потому оно рассматривается цельно как имя автора. Или думайте, что делать, если указан author и несколько firstN/lastN; сейчас бот делает лидирующим автора без номера. Bsivko (обс.) 18:25, 27 ноября 2018 (UTC)
        • 0) В общем случае это неправильно, поэтому я и против этой части алгоритма. 4) Бот не должен ухудшать состояние библиограф. описание источника. Сейчас это происходит — он удаляет сведения о проверке. Если бот не умеет правильно обрабатывать строку после }}, то пусть просто переносит, а не прячет/удаляет или что он там делает. 5) Наверное надо делать проверку по всем этим author и firstN/lastN и если какое-либо значение равно «et al.», то тупо прибавлять к концу списков авторов, а не куда придётся. — VladXe (обс.) 19:43, 27 ноября 2018 (UTC)
          • 0) что неправильно? если кто-то использует не тот шаблон, то такая же проблема, как и неправильно заполненные данные; cite journal подразумевает, что это ссылка на журнал; 4) уже написал вам, что это проблема шаблона статья, который не поддерживает accessdate; добавьте поддержку, и все будет. 5) можно поробовать выкусывать все «et al.», но там ужно перебрать все варианты, всяких «"et al."» полно. И далее, если один был выкушен, то ставить в конце. И опять же, это проблема заполнения данных, потому что редакторы в шаблоне cite journal заполняются в поле editor, а не в поле автора. Bsivko (обс.) 20:12, 27 ноября 2018 (UTC)

Для улушения пока что есть мысли только либо изменять порог вероятности, либо ещё сделать отсечку по длине строки, т.к. когда букв мало, то сложнее сделать правильный выбор. Bsivko (обс.) 13:40, 27 ноября 2018 (UTC)

  • С языками все как-то нехорошо. Кучка ложных срабатываний, нет никакой гарантии, что если заголовок на одном языке, то текст на другом. Букв маловато. И пр. Хотя можно сделать для больших назвнаий (>50 символов например), тогда еще более менее. Bsivko (обс.) 15:25, 27 ноября 2018 (UTC)
    • Если честно, то раздражает, когда англоязычной статье есть запись Т. 4, № 56. Поэтому и нужен параметр язык. ИМХО, если вместо правильного французского / немецкого и т. д. языка будет стоять английский, то это меньшая ошибка, чем если будет стоять русский по умолчанию. — VladXe (обс.) 17:16, 27 ноября 2018 (UTC)
      • Умолчание это скорее неизвестный язык. Хотя поклонники удаления язык=ru вряд ли с этим согласятся. Пока что сделал отсечку по размеру но 50 симоволов, и далее распознавание. Выкатил новую версию с исправлением (2) выше в т.ч. Bsivko (обс.) 18:25, 27 ноября 2018 (UTC)
        • Удалять язык=ru нужно по одному из руководств. Остальное посмотрю потом. Надеюсь, что вылов жучков, довольно жёсткий с моей стороны, не отобьёт желание совершенствовать алгоритм. — VladXe (обс.) 20:44, 27 ноября 2018 (UTC)
          • Я помню вашу скурпулёзность на номинациях, и тут больше вопрос в моём времени, которого хорошо если хватит на всех жучков этого шаблона. И я уже успел посмотреть на cite book, и там по сравнению с cite journal всё весьма мрачно. Тем более, надеюсь, что инструмент вам поможет в уменьшении количества проблем оформления. Bsivko (обс.) 22:04, 27 ноября 2018 (UTC)
  • VladXe, я пока что добавил обработку «et al». Сейчас оно удаляет если есть все «et al» и «et al», и если было что-то из «et al.», то добавляет одно в конце. Ещё одхватывает etal из 4 параметров вида «displayauthors». Результат сейчас виден тут. Обработка идёт как для авторов (например, поле author), так и для редакторов (поле editor). Пример теста: {{cite journal|last=Dargent |first=Françoise |editor1= Ben et al.|editor2= Den et al.|editor3=Han ''et al.''}}{{статья|автор=Dargent, Françoise|ответственный=Ben ; Den ; Han et al.}}. Некоторая разница с англовариантом - отключил отсечку по числе авторов (после обработки показывает весь список без et al). Может есть другие случаи, типа «и др.»? Bsivko (обс.) 17:09, 5 января 2019 (UTC)
  • MBH удалил уже шаблон {{article}}, и под удалением находятся {{cite2 journal}} и {{cite paper}}. Моя система обрабатывает синонимы автоматически, и так как они перестали быть в википространстве синонимами, то теперь программа их не трогает. Bsivko (обс.) 17:09, 5 января 2019 (UTC)
  • У нас остались ещё какие-нибудь решаемые пожелания? А то тема вроде исчерпана, надо переходить постепенно к внедрению. Bsivko (обс.) 17:09, 5 января 2019 (UTC)
    • 6-7 посмотрю по свободе. Если не слишком затруднит, то выложите последний вариант до и после скрипта. — VladXe (обс.) 17:17, 5 января 2019 (UTC)
      • Сейчас оно, как и раньше, разделяется на две колонки — до и после. Bsivko (обс.) 17:26, 5 января 2019 (UTC)
        • 1) № 7, 12—14, 16, 17, 34, 35, 37, 40, 42, 43, 45, 47, 48, 50 — «язык не перевёлся», думаю, надо сделать несколько порогов срабатывания: для длинных названий анализируются 2-3*N символов, для коротких — N, идея: если совсем коротко, тогда пусть проставляет {{ref-mis}}; 2) просьба относится к допиливанию надфилем корпуса авианосца, но можно сделать проверку в параметре pages и аналогичных на наличие сочетаний «p.», «pp.», «P.» и «Pp.» с последующим их удалением? (№ 4, 13, 22); 3) ! по прежнему удаляется дата проверки, показанная не в параметрах (№ 19, 23, 26—28, 37, 44—46, 50), что делать — см. п. 3а; 4) японский язык в обозначениях страниц и прочего, особенно прикольно смотрится «第367巻, 第April 2009数» (№ 22, 36); 5) не знаю, сможет ли скрипт, но проставить точки в инициалах было бы желательно (№ 25, 30, 38, 49). Первые 50 проверил, что ответите? — VladXe (обс.) 18:01, 5 января 2019 (UTC)
          • 1) А что такое «длинное» название? Как его определить что оно длинное? И можно пример с {{ref-mis}}, как вы его видите? Bsivko (обс.) 18:59, 5 января 2019 (UTC)
            • 1) По скольким символам названия сейчас определяется язык заголовка? 1а) № 7: Mignone, Flavio; Graziano Pesole. mRNA Untranslated Regions (UTRs) (неизв.). — 2011. — 15 August. — doi:10.1002/9780470015902.a0005009.pub2.VladXe (обс.) 19:06, 5 января 2019 (UTC)
              • Сейчас если больше 50 символов, то пробует определить язык. Bsivko (обс.) 19:29, 5 января 2019 (UTC)
                • А если уменьшить до 25 символов? В результате работы алгоритма вычисляется какой-либо процент достоверности? Если да, то при значении менее 75 % пусть определяет по 50 символов, если опять достоверность менее 75 %, то |язык=mis. — VladXe (обс.) 19:37, 5 января 2019 (UTC)
          • 2) «p.» сейчас подправим, напишу пару распознавалок. Bsivko (обс.) 18:59, 5 января 2019 (UTC)
          • 3) дату проверки сейчас оставлю как параметр accessdate, далее его или его аналог нужно включить в шаблоне «статья»; если досбавлять, то наверно через ГОСТ, в виде «дата обращения». Bsivko (обс.) 18:59, 5 января 2019 (UTC)
            • 3) Есть костыльное решение (пока соотв. параметр не появится в ш:Статья): выводить accessdate через ш:{{v}} — если нельзя … герцогиню, приходится довольствоваться служанкой. Долго потом переделать обратно под параметры ш:Статья? — VladXe (обс.) 19:16, 5 января 2019 (UTC)
              • Так в шаблоне статьи сейчас нет средств для вывода. Технически и минимум ошибок проще всего оставить параметр и дождаться добаления его в шаблоне статьи. Там соответственно accessdate просто переименовать, или оставить как синоним, чтобы выводил «проверено». Bsivko (обс.) 19:29, 5 января 2019 (UTC)
          • 4) а что можно сделать с японским? оно же по шаблону пишет оригинал и названия параметров, исходя из «язык=ja»; в названии тоже ничего не придумывает, оставляет как есть. Bsivko (обс.) 18:59, 5 января 2019 (UTC)
            • Пендаля дать редакторам шаблона статья, чтобы не включали иероглифы, где не надо. Закрыли эту тему, скрипт не виноват. — VladXe (обс.) 19:09, 5 января 2019 (UTC)
          • 5) Здесь сами параметры такие, например Langenhan T, Aust G, Hamann J. Можно попробовать смотреть по маске «[пробел][1-2 прописные буквы][,]», и далее если, то ставить точку. Но боюсь что могут появиться ложные срабатывания. Bsivko (обс.) 18:59, 5 января 2019 (UTC)
        • Далее выборочно. 6) № 65 — скрипт спутал № и комментарий; 7) № 81 — некорректное обработка [[Video]]; 8) № 92 — некорректная обработка номера журнала; 2а) № 92 — для п. 2 добавить проверку на «С.» и «с.» (рус.); 9) Параметр PMC / pmc можно прикрутить? 3а) ! Думаю, скрипт должен по ключевому слову «Проверено» заполнять параметр Accessdate. — VladXe (обс.) 18:04, 5 января 2019 (UTC)
          • 6) В 65 стоит issue=April 2007, issue это номер. Кто-то неправильно заполнил поле. Bsivko (обс.) 18:59, 5 января 2019 (UTC)
          • 7) В англовики ссылка на «Video (magazine)», и в Нп она передается. Проблема с альтернативной предполагаемой ссылкой в рувики. Пока что заменяю на ссылку в англовики (если нет статьи в рувики), она с меньшей вероятностью совпадёт. Bsivko (обс.) 18:59, 5 января 2019 (UTC)
          • 8) Здесь значение исходного параметра volume= 51 (4). Так назвали «том» в оригинале. В названии тома вообще все что угодно может быть. Bsivko (обс.) 18:59, 5 января 2019 (UTC)
          • 9) Запрос на добавление в том числе его висит тут. Пока что до него судя по всему нет никому дела. Bsivko (обс.) 18:59, 5 января 2019 (UTC)
            • Пункты 6—9 к работе скрипта отношения не имеют. Жду п. 1—3. В следующий раз буду другие номера смотреть.VladXe (обс.) 19:19, 5 января 2019 (UTC)
  • Внес правки по пунктам 2, 3, 7. Разница с предудыщим например так. accessdate не удаляется, лидирующие p. pp. для страниц удаляются, ссылка на англовики если нет в рувики. Bsivko (обс.) 19:25, 5 января 2019 (UTC)
    • А п. 2а реализовать? (добавить проверку на «С.» и «с.» [рус.], см. № 91) — VladXe (обс.) 19:31, 5 января 2019 (UTC)
    • П. 3 в костыльном варианте делать не будете? (пожалейте меня, просматривать эту простыню в коде вообще нет мочи). — VladXe (обс.) 19:33, 5 января 2019 (UTC)
      • Проблема костыля в том, что если добавят таки параметр accessdate, то придется потом писать распознавание костыля, чтобы оно вернуло его в созданный параметр; и новый параметр вместе с костылём будет писать 2 разных даты о «проверено». Bsivko (обс.) 19:45, 5 января 2019 (UTC)
        • Тогда будем считать, что вопрос на уровне скрипта решён, но проверять я его не буду. Уже пора памятку составлять, какие проблемы решаются исключительно на уровне ш:Статья. — VladXe (обс.) 19:58, 5 января 2019 (UTC)
  • Добавил распознавание по маске пункта 5. См. что получилось. Ложных срабатываний вроде нет. Bsivko (обс.) 23:06, 5 января 2019 (UTC)
  • Добавил запрос-обсуждение для пункта 3. Думаю, чем больше поддержат, тем быстрее осуществиться. Bsivko (обс.) 23:35, 5 января 2019 (UTC)

Продолжение

  • Не могу понять, почему после 340-й все останавливается. Есть подозрение, что на одной странице столько не переваривает. Или шаблон anchor не может. Bsivko (обс.) 13:59, 27 ноября 2018 (UTC)
    • В Медиавики есть ограничение на размер страницы с раскрытыми шаблонами. ИМХО последние изменения ш: cite journal увеличили его «счётный размер», поэтому раньше не отображались шаблоны после 490, то теперь после 340-го. — VladXe (обс.) 14:06, 27 ноября 2018 (UTC)
      • Понятно, спасбио. А то я уже несколько раз вытался понять в чем дело, и оно вдруг то рассосётся, то вот сейчас прыгнет на другое место. Bsivko (обс.) 16:45, 27 ноября 2018 (UTC)

Пробелы между параметрами

После первого прогона увидел недостаток: бот удаляет пробелы перед «|», что плохо сказывается на форматировании кода: шаблон статья переносится лишь в пробелах значений параметров, учитывая, что экраны у всех разные, вкл. вертикальные у телефонов, надо дать больше места для переходов на др. строку. — VladXe (обс.) 04:12, 29 мая 2019 (UTC)

  • Не понял в чем конкретно проблема. Бот шаблон переводит в один формат окончания строки, включая именование шаблона. Если пробел-перевод строки, то он в каждом параметре. Bsivko (обс.) 08:19, 29 мая 2019 (UTC)
  • Кажется, я понял в чем проблема. Она наверно хорошо видна на этом диффе. Т.е. когда имя шаблона имеет пустое окончание, а у остальных параметров стоит в конце пробел. Попробую вариант решения — чтобы символ окончания параметра не был пустым, а если так, то ставился бы как минимум пробел. Bsivko (обс.) 11:23, 23 июня 2019 (UTC)

Шаблоны Не переведено

Не нравится, что используется Ш:нп3: во всей библиограф. записи «русск.» является единственным кириллическим элементом. Так может для единообразия заменить его на Ш:нп5 с [en]? — VladXe (обс.) 04:19, 29 мая 2019 (UTC)

  • Если это предложение использовать для кириллических ссылок Нп3, латинских Нп5, японских что-то ещё, то оно явно должно звучать в другом месте. П окрайней мере, о подобной практике или консенсусе мне не известно. Bsivko (обс.) 08:20, 29 мая 2019 (UTC)
    • Нет, это предложение не использовать нп3, а использовать нп5 для единообразия записи: раз всё латиницей, то и языковая метка должна быть ей же. — VladXe (обс.) 11:18, 26 июня 2019 (UTC)
      • Есть похожее предложение — раз у нас русскоязычный раздел, то запись языков должна быть на русском. Обычным людям все эти en, de, nr, ja неочевидны. Bsivko (обс.) 11:36, 26 июня 2019 (UTC)

Не насаждайте нп3 там, где по всей статье нп5

Просьба не перемешивать шаблоны "не переведено" и не насаждать ложно-синие шаблоны {{нп3}}, хотя бы там, где по всей статье стоят честно-красные {{нп5}} (они же {{iw}}). Примеры: [1], [2]. Либо проверяйте, какой тип шаблонов "не переведено" используется в статье, либо вовсе отмените искусственное насаждение "нп3", ибо оно неконсенсусно. Спасибо, — Adavyd (обс.) 08:02, 11 июля 2019 (UTC)

  • По шаблонам Нп нет консенсуса. И такого, о котором вы говорите. Bsivko (обс.) 08:43, 11 июля 2019 (UTC)
  • Согласен с ботоводом, что консенсуса за использование исключительно нп5 нет, в то же время алгоритм выявления, какой из шаблонов нпХ используется в статье, многократно усложнит бота. Если сравнить, какой объём работы по замене шаблонов источников делает бот, то пройти ручками и заменить нп3 на нп5/нп4/нп2 не сопоставимо проще. — VladXe (обс.) 08:57, 11 июля 2019 (UTC)

Лишний пробел

Совсем уж мелочь, но раздражает: перед }} пробел не нужен. — VladXe (обс.) 11:17, 26 июня 2019 (UTC)

Неадекватные результаты при обработке шаблона, содержащего ошибки

Статья Кошка#Генетика кошки, все сноски в первом абзаце, списки авторов. Видимо, сначала нужно было разобраться, что и почему сломано в {{cite journal}}.--Yellow Horror (обс.) 14:37, 26 июня 2019 (UTC)

  • Если ошибки были в первоначальном шаблоне, то какие претензии к боту? Что он их показал? Так нечего на зеркало пенять… — VladXe (обс.) 14:49, 26 июня 2019 (UTC)
  • А что там сломано? В оригинале указаны в некоторых случаях только имена (first, т.е. first name), last name видимо, забыли. Бот их перенес в авторство, разделив через ; — полное содежание персоны (ФИО) разделяются именно так. Или, другими словами, как вы предлагаете обрабатывать подобные случаи? (есть firstN, нет lastN и наобормот). Bsivko (обс.) 19:54, 26 июня 2019 (UTC)
    • В первую очередь, я очень сильно сомневаюсь, что "JU; JC; DR; Team; K; S; M; J; R; N;" является перечнем чьих бы то ни было имён. Явно какой-то глюк. Можно ли оценить кол-во шаблонов с подобными ошибками (есть firstN, нет lastN и наобормот) по всей Википедии?--Yellow Horror (обс.) 21:02, 26 июня 2019 (UTC)
      • 1) Это не имена, а инициалы, которые почему-то в оригинале оторваны от фамилий. В этом случае виноваты другие редакторы (не ботовод), которые так заполнили оригинальный шаблон на источник. 2) Логично, если такого добра много, то надо в работе бота делать обрабатывать такие случаи. :-( — VladXe (обс.) 21:11, 26 июня 2019 (UTC)
    • Я просмотрел сноски с подсвеченными ошибками в предшествовавшей ботоправке версии статьи Кошка и сопоставил их с аналогичными сносками в англовике. По первому впечатлению, непарные first/last имена стоит просто игнорировать. Но поскольку все примеры из одной статьи, не могу судить насколько это решение применимо глобально.--Yellow Horror (обс.) 21:18, 26 июня 2019 (UTC)
      • Если все согласны, то встроить игнорирование пары не проблема. Но как мне кажется, редактора потенциально могут заполнить только одно поле (first1=Вася Пупкин), и в таких случаях мы потеряем информацию. Если после преобразования получаются фрагменты вида ;UC;W;F;, что по-моему, также очевидно, требует вмешательства редакторов, как и до правки. Что вы об этом думаете? Bsivko (обс.) 21:21, 26 июня 2019 (UTC)
        • Вы правы насчёт опасности потери информации. Особенно если примеры из статьи Кошка нетипичны. Я пока вообще не понимаю, как подобный код шаблона мог возникнуть: {{cite journal | author = M. Miyazaki, T. Yamashita, Y. Suzuki, Y. Saito, S. Soeta, H. Taira, and A. Suzuki | year = 2006 | month = October | title = A major urinary protein of the domestic cat regulates the production of felinine, a putative pheromone precursor | journal = Chem. Biol. | volume = 13 | issue = 10 | pages = 1071–1079 | pmid = 17052611 | doi = 10.1016/j.chembiol.2006.08.013 | format = PDF | first1 = M | first2 = T | first3 = Y | first4 = Y | first5 = S | first6 = H | first7 = A | issn = 1074-5521 | accessdate = 2010-05-26 | lang = en }}--Yellow Horror (обс.) 21:35, 26 июня 2019 (UTC)
          • У меня гипотеза, что редактор в author написал всё, а в firsti указал первые буквы из этого всего. Больше похоже на непонимание того, как шаблон устроен. Bsivko (обс.) 21:45, 26 июня 2019 (UTC)
            • Пока выяснил, что к нам вышепроцитированный шаблон (и видимо все остальные проблемные шаблоны со страницы Кошка) попал именно в таком виде из англовики. Там некорректное заполнение было позже исправлено, а у нас осталось.--Yellow Horror (обс.) 21:53, 26 июня 2019 (UTC)
              • Я бы предложил понаблюдать и посмотреть, насколько такие случаи систематичны. Еще, вероятно, есть какой-нибудь способ определить, как часто в таких шаблонах указан first и не указан last. Каким-нибудь поиском. Bsivko (обс.) 22:26, 26 июня 2019 (UTC)
                • Может, стоит шаблоны с непарными полями имён пока пропускать, собрать статистику и примеры, чтобы решить что с ними дальше делать? Сноски в статье Кошка я уже руками поправил, если что.--Yellow Horror (обс.) 22:40, 26 июня 2019 (UTC)
                  • Здесь тогда можно попробовать сделать так. Дополняю боту проверку на наличие парных, бот логирует этот факт, делает перевод. Далее я уже смотрю логи. Которые я и так смотрю, там пишет неизвестные параметры и пр. Если случаи простые и их немного, то сам разрулю. Bsivko (обс.) 22:52, 26 июня 2019 (UTC)
            • ИМХО, просто редактор перенёс все lastN и firstN в author, а убрать firstN забыл или не посчитал нужным (зачем, если отдельно не отображаются?) Всё от человеческой лени или невнимательности. — VladXe (обс.) 16:34, 27 июня 2019 (UTC)
              • Было подумал, что оригинальный cite journal как-то реагирует на эту ситуацию. Сейчас посмотрел в англовики — нет, он оставляет и author, и все first/last. Если кто-то удаляет например все first, то он должен был увидеть что что-то не так в ссылке. Но видимо, не посмотрел.. Bsivko (обс.) 18:07, 27 июня 2019 (UTC)
  • По сотне статей получилось что-то следующее:
Инкская горлица:cite journal  :first field is absent, last field 'editor-last' with value 'Alan Poole ' is present.
Ceratobatrachidae:cite journal  :first field is absent, last field 'last' with value 'Rafe M. Brown, Cameron D. Siler, Stephen J. Richards, Arvin C. Diesmos i David C. Cannatella ' is present.
Ceratobatrachidae:cite journal  :first field is absent, last field 'last' with value 'Fang Yan, Ke Jiang, Kai Wang, Jie-Qiong Jin, Chatmongkon Suwannapoom, Cheng Li, Jens V. Vindum, Rafe M. Brown i Jing Che ' is present.
Муравьи-бульдоги:cite journal :first field is absent, last field 'last' with value 'Imai Hirotami T., Taylor Robert W.' is present.
Муравьи-бульдоги:cite journal :first field is absent, last field 'last' with value 'Taylor Robert W.' is present.
Муравьи-бульдоги:cite journal :first field is absent, last field 'last' with value 'Gadau Jürgen, Helmkampf Martin, Nygaard Sanne, Roux Julien, Simola Daniel F., Smith Chris, Suen Garret, Wurm Yannick, Smith Christopher D.' is present.
Муравьи-бульдоги:cite journal :first field is absent, last field 'last' with value 'Imai irotami T., Crozier Ross H., Taylor Robert W.' is present.
Муравьи-бульдоги:cite journal :first field is absent, last field 'last' with value 'Imai Hirotami T., Taylor Robert W.' is present.
Муравьи-бульдоги:cite journal :first field is absent, last field 'last' with value 'Crozier R., Dobric N., Imai H.T., Graur D., Cornuet J.M., Taylor R.W.' is present.
Муравьи-бульдоги:cite journal :first field is absent, last field 'last' with value 'Ward Philip S., Brady Seán G.' is present.
Муравьи-бульдоги:cite journal :first field is absent, last field 'last' with value 'Hasegawa Eisuke, Crozier Ross H.' is present.
Муравьи-бульдоги:cite journal :first field is absent, last field 'last' with value 'Taylor Robert W.' is present.
Муравьи-бульдоги:cite journal :first field is absent, last field 'last' with value 'Andersen A. N.' is present.
Wuhua jurassica:cite journal  :first field is absent, last field 'last' with value ' B. Wang and H. C. Zhang. ' is present.
Lepilemur hubbardorum:cite journal  :first field is absent, last field 'last11' with value ' Prosper ' is present.
Dorymyrmex biconis:cite journal :first field is absent, last field 'last' with value 'Moglich Michael H.G., Alpert Gary D.' is present.
Psaltoda:cite journal :first field is absent, last field 'last' with value 'Moulds Maxwell Sydney ' is present.
Hesterniasca lata:Cite journal  :first field is absent, last field 'last' with value 'C. Y. Cai, D. Y. Huang, and A. Solodovnikov. ' is present.
Camelomecia janovitzi:cite journal  :first field is absent, last field 'last' with value 'Barden P., Grimaldi D. ' is present.
Camelomecia janovitzi:Cite journal :first field is absent, last field 'last' with value 'Perrichot V.,  Wang B., Engel M. S. ' is present.
Mastotermes nepropadyom:Cite journal  :first field is absent, last field 'last' with value 'P. Vrsansky and D. Aristov. ' is present.
Dorymyrmex brunneus:cite journal :first field is absent, last field 'last' with value 'Moglich Michael H.G., Alpert Gary D.' is present.
Linguamyrmex vladi:cite journal  :first field is absent, last field 'last' with value 'Phillip Barden, Hollister W. Herhold, [[Гримальди, Дэвид|David A. Grimaldi]].' is present.
Linguamyrmex vladi:cite journal  :first field is absent, last field 'last' with value 'Barden P., [[Гримальди, Дэвид|Grimaldi D.]] ' is present.
Linguamyrmex vladi:cite journal  :first field is absent, last field 'last' with value '[[Длусский, Геннадий Михайлович|Dlussky G. M.]], [[Гримальди, Дэвид|Grimaldi David]]. ' is present.
Linguamyrmex vladi:cite journal  :first field is absent, last field 'last' with value 'McKellar R. C., Glasier J. R. N., Engel M. S. ' is present.
Savannasaurus elliottorum:cite journal  :first field is absent, last field 'last' with value ' Poropat S. F., Mannion P. D., Upchurch P., Hocknull S. A., Kear B. P., Kundrát M., Tischler T. R., Sloan T., Sinapius G. H. K., Elliott J. A., Elliott D. A. ' is present.
  • Народ походу, часто использует last (без номера) для указания полного имени. Этот частный случай наверно можно уже не рассматривать. Bsivko (обс.) 00:04, 27 июня 2019 (UTC)
  • И в списке один случай когда указан last11, а first11 либо забыли, либо его не должно быть. Bsivko (обс.) 00:08, 27 июня 2019 (UTC)
  • Отключил пустой first (без firstN) для наличия last. На второй сотне такой результат:
Hadronyche infensa:cite journal  :first field is absent, last field 'last2' with value ' Gray ' is present.
Hadronyche infensa:cite journal  :first field is absent, last field 'last3' with value ' Balit ' is present.
Hadronyche infensa:cite journal  :first field is absent, last field 'last4' with value ' Raven ' is present.
Hadronyche infensa:cite journal  :first field is absent, last field 'last5' with value ' Stokes ' is present.
Hadronyche infensa:cite journal  :first field is absent, last field 'last6' with value ' Porges ' is present.
Hadronyche infensa:cite journal  :first field is absent, last field 'last7' with value ' Tankel ' is present.
Hadronyche infensa:cite journal  :first field is absent, last field 'last8' with value ' Turner ' is present.
Hadronyche infensa:cite journal  :first field is absent, last field 'last9' with value ' White ' is present.
Hadronyche infensa:cite journal  :first field is absent, last field 'last10' with value ' Fisher ' is present.
Животные:cite journal :first field is absent, last field 'last1' with value 'Eernisse D. J., Albert J. S., Anderson F. E.' is present.
Lepilemur milanoii:cite journal  :first field is absent, last field 'last11' with value ' Prosper ' is present.
Сифака Верро:cite journal  :first field is absent, last field 'editor-last1' with value '  Proulx' is present.

Bsivko (обс.) 08:44, 27 июня 2019 (UTC)

    • C Hadronyche infensa ситуация как с кошкой. В author все, а в lastN тжс по частям. И в англовики уже исправили, а тут нет. Можно попробовать сделать эвристически, например если author больше скажем 20 символов, то не обращать внимания на lastN/firstN. Bsivko (обс.) 09:50, 27 июня 2019 (UTC)
  • Пока что после обработки тысяч статей нашлось несколько аналогичных случаев, исправлял вручную. Bsivko (обс.) 13:20, 3 июля 2019 (UTC)
    • Кстати, логи ведутся? Можно где-нибудь увидеть, в каких статьях бот проставил язык=und? — VladXe (обс.) 14:05, 3 июля 2019 (UTC)
      • За последнюю неделю записал сюда. Часть из них через контрольный список исправлена, и исправится если будет след. проход. То чего нет в контрольном списке, уже вручную. Bsivko (обс.) 15:10, 3 июля 2019 (UTC)
      • В общем там много разных случаев. Есть ссылки непонятно куда. Есть ссылки на журанлы где не поймешь какой язык. Есть журналы на нескольких языках. И т.д. На днях прикручивал систему, которая пробует по содержимому найти статью в англовики, и оттуда определить язык по категории, карточке, ВД. После этого несколько поубавилось. Bsivko (обс.) 15:16, 3 июля 2019 (UTC)
        • Спасибо. Ещё идея: оперировать названиями журналов. Вряд ли в «British Journal of Photography» или «American Journal of Primatology» статья будет не на английском. Хотя в том же "Texas Journal of Science" уже может быть и на испанском — Мексика рядом. — VladXe (обс.) 15:49, 3 июля 2019 (UTC)
          • Контрольный список так и делает — по названиям. Но туда же вносить нужно то, что не вряд ли, а если выходило на одном языке все время издания. Какой-нибудь канадский журнал может и на английском, и на французском. И т.д. Bsivko (обс.) 15:58, 3 июля 2019 (UTC)
  • Запустил бота по пройденным статьям описанного лога. Так как контрольный список стал полнее, то исправляет ранее неучтенные моменты. Где-то 1к статей, из них бот правит немногим менее половины. Поэтому часть «und» из пройденного сегодня будет исправлена. Bsivko (обс.) 14:00, 7 июля 2019 (UTC)
  • До нынешнего момента работал по тематикам. Например, берётся категория медицинстких препаратов, выбирается из них где есть cite journal, пару-тройку статей первый проход, далее смотрим что появляется и заносим в контрольный список. Далее если занесли, уже обрабатывается списком. След запуск столько же или побольше, например 5 статей. Заносим контрольный список. И т.д. Так формируется тематическая категория. На сейчас тематика исчерпала, уже не нахожу крупных образований по темам. Вместе с тем, к нынешнему моменту накопился опыт обработки. Придумал как автоматически определять язык журналов по категориям в англовики, по викиданным и по содержанию карточек. Эта автоматизация нашла язык за сегодня для более 600 наименований, плюс оно определяет тип источника (magazine, newspaper, ..). Аналогично с проставлением ссылок. Последние пару дней отлаживал этот механизм, добавил кэширование, и тем работа идёт шустрее. Где-то 3-го июля изменил логи на json-формат, и далее их просто обрабатывать программно. Сейчас пробую обрабатывать всё подряд блоками по 50 статей. Далее после обработки всех статей (их осталось 11к) вытягиваем из лога наиболее встречаемые, и если что, прописываем в контрольный список и далее второй заход уже по тем, что прописали. Где-то также работал по тематикам. В принципе, буду еще смотреть на известные источники (типа «Наука и жизнь») и добавлять их в контрольный список. Bsivko (обс.) 20:18, 8 июля 2019 (UTC)

|тип=journal

К чему это? Этот параметр нужен только для источников необычных типов. Sneeuwschaap (обс.) 21:04, 29 июня 2019 (UTC)

  • И где это написано? — VladXe (обс.) 21:12, 29 июня 2019 (UTC)
    • Вы когда-нибудь видели библиографические ссылки в литературе? Обсуждалось же. Sneeuwschaap (обс.) 09:22, 1 июля 2019 (UTC)
      • Cite_pmid не имеет отношения ни к {{статья}}, ни к {{cite journal}}. Bsivko (обс.) 10:20, 1 июля 2019 (UTC)
        • Ну как же не имеет, коллега. Да хоть бы и не имел — речь-то идёт о внешнем виде библиографических ссылок, а через какие шаблоны они сделаны, тут ни при чём. Sneeuwschaap (обс.) 10:34, 1 июля 2019 (UTC)
          • Обсуждения шаблонов находятся на соответствующих страницах. Если А ссылается на Б, то Б не зависит никаким образом от А. Консенсуса на этот параметр в указанных мною шаблонах нет. И параметр типа в шаблоне {{статья}} с соотв. указанием присутствует много где, вне зависимости от перевода {{cite journal}}. Bsivko (обс.) 11:02, 1 июля 2019 (UTC)
          • И кстати, консенсус использования параметра типа по этому вопросу отражён в описании параметра типа шаблона {{статья}}. Bsivko (обс.) 11:11, 1 июля 2019 (UTC)
            • Коллега, какая разница, каким техническим способом сделана та или иная библиографическая ссылка? Если уж об этом говорить, приведённое мной обсуждение на самом деле касается именно шаблона {{статья}}, и факт его вызова через Cite pmid не имеет значения (Вы же не будете утверждать, что {{статья}} должна давать разные результаты при таком вызове и при непосредственном использовании?). В описании в документации шаблона ничего не говорится об обязательности параметра «тип», и вообще «консенсус» надо определять не по неведомо откуда взявшейся документации, а по практике использования. На том месте могут писать «сб. науч. тр.», могут «сб. ст. такой-то конф.», могут «дис. … канд. таких-то наук», но не пишут «журнал» — ни в литературе, ни в Википедии. Sneeuwschaap (обс.) 12:10, 1 июля 2019 (UTC)
              • Разница в том, что если Cite_pmid сделан через {{статья}}, то это проблема Cite_pmid. Переделывайте тогда Cite_pmid под его консенсус. Документация прямо указывает как использовать параметр, где явно написано, что следует указывать журнал, и никаких «необычных типов» не наблюдается. Bsivko (обс.) 12:17, 1 июля 2019 (UTC)

(неизв.)

Заявлять, что источники написаны на неизвестном языке, видимо, тоже потребовала какая-то документация? Sneeuwschaap (обс.) 08:00, 2 июля 2019 (UTC)

  • Да. И не на неизвестном языке, а указание того, что язык неуказан. Bsivko (обс.) 08:04, 2 июля 2019 (UTC)
    • Значит, ваш бот перестал Вам подчиняться. Примечание 84 в статье «Марс»: "Марсианские хроники: ископаемая речная дельта (неизв.). Всплывающее разъяснение: «на неизвестном языке». Sneeuwschaap (обс.) 08:14, 2 июля 2019 (UTC)
      • Т.е. нужно пройти по ссылке и проставить язык. Вот так. Bsivko (обс.) 09:51, 2 июля 2019 (UTC)
        • Чудесно. Массовые ошибки вашего бота должны исправлять редакторы. А до тех пор читатели будут думать, что Википедию пишут деятели, которые даже язык источника опознать не в состоянии. Sneeuwschaap (обс.) 08:08, 3 июля 2019 (UTC)
          • Массовые ошибки уже допустили редакторы, тупо скопировав cite journal из другого раздела и не указав язык. Bsivko (обс.) 09:08, 3 июля 2019 (UTC)
            • Нет, коллега. До бота в статьях не было абсурдных пометок, а после — есть. Если вашему боту что-то неизвестно, это не более чем факт его биографии, которому в статьях не место. Как и пометкам о русском языке источников, кстати. Sneeuwschaap (обс.) 10:58, 3 июля 2019 (UTC)
              • До бота по умолчанию читатели считают, что по ссылке русский язык. Но после копипасты из другого языкового раздела это не так. Этот недочёт исправляет бот. Bsivko (обс.) 11:03, 3 июля 2019 (UTC)

Перевод в Публикация|статья

Предлагаю изменить функцию робота на перевод cite journal в {{публикация|статья|…}}. В {{публикация}} есть соавторы, есть имена и фамилии для пяти авторов и т. д. Со своей стороны могу помочь с правилами для перевода Grumbler (обс.) 22:07, 6 июля 2019 (UTC)

Обсуждение деятельности в принципе

Скажите, было какое-то обсуждение по ВП:МНОГОЕ этих изменений? Потому что я считаю их вредными - они нарушают мою возможность использовать шаблоны в разных языковых разделах википедии.·Carn 08:59, 17 августа 2019 (UTC)

  • Если я правильно понял, Вы хотите использовать шаблоны источников рувики в других языковых разделах без изменений? — VladXe (обс.) 09:04, 17 августа 2019 (UTC)
    • Да, раздражает, когда переносишь что-то, и приходится менять "Файл:" на "File:" к примеру. Лишняя работа. Для шаблонов это обычно решается просто редиректами или шаблоном, который вызывает другой шаблон с несколько изменёнными параметрами. Но вот если из "last=" и "first=" можно автоматически склеить автора, то наоборот уже нет. ·Carn 10:04, 17 августа 2019 (UTC)
      • Так сделайте в соотв. разделах клоны Ш:Книга и К:Статья и переносите спокойно. Почему к нам из англовики можно всякий не соответствующим нашим руководствам шаблоны тащить, а в их разделы нельзя? — VladXe (обс.) 10:17, 17 августа 2019 (UTC)
        • Наши руководства касаются только внешнего вида получающихся строк. Я вот работаю со статьями, когда источники часто англоязычные. И в целом у нас люди понимают английский (язык международного общения), а они русский нет. И вот такие вот правки ботом, в результате которых теряется информация не есть хорошее дело. Эти шаблоны принципиально у нас и англовики отличаются тем, что у них фамилии отделены, а у нас - нет.·Carn 11:35, 17 августа 2019 (UTC)
          • Теряется не информация, а оформление, как раз руководству не соответствующее. Человек же по параметру author легко восстановит фамилию (она — первая, если вообще есть). — VladXe (обс.) 11:38, 17 августа 2019 (UTC)
      • Вы обращаетесь не в тот раздел. Попросите коллег в англовики поддерживать «файл» и все остальное. Рувики никаким боком не связана с вашей деятельностью в других разделах. Bsivko (обс.) 10:45, 17 августа 2019 (UTC)
  • В принципе, все изменения проводятся в рамках масштаба правила ВП:МНОГОЕ. Использовать какие-либо шаблоны вам никто не запрещает. Если вы их использовали, то это уже не ваша собственность. Bsivko (обс.) 09:52, 17 августа 2019 (UTC)
    • Я вас спрашиваю, на основании каких обсуждений ваш бот ходит и подряд многое меняет (причём мне плюсы от этой деятельности вообще не ясны - участников не знающих технический английский у нас крайне мало, минусы же я ясно вижу и некоторые обозначил), а вы мне говорите, мол, это не твоя собственность? Я правильно интерпретировал ситуацию?·Carn 10:04, 17 августа 2019 (UTC)
      • На основании неисправимого несоответствия Ш:cite journal руководству рувики ВП:БИБГРАФ. Приведение статей в соответствие с нормативными актами рувики является полезной деятельностью, включая правки, попадающие под ВП:МНОГОЕ. Единственное исключение: вошёл в режим редактирование, нажал кнопку викификатора, сохранил. Действие бота к такому не относится. — VladXe (обс.) 10:23, 17 августа 2019 (UTC)
      • Участников проекта - это миллионы русскоязычных редакторов. Ваше личное мнение о знаниях участников никаким образом это не отражает. Я интерпретирую так, что одержимое статей живет по правилам сообщества, а не по вашему мнению. Здесь же получается так, что если кто то не знает Язык, то должен страдать. Так это не так. Кроме того, язык включает знание многих аспектов типографики, оформления, пунктуации и пр. элементов, которых в Рувики фактически не знает никто. Глупо оформлять русскоязычный текст через призму англоязычных шаблонов. Это подходит толко для уровня по-быстрому или для дилетантов. Bsivko (обс.) 10:55, 17 августа 2019 (UTC)
        • Это всё аргументы для дискуссии, которая должна быть, а которой не было, насколько я понимаю. ВП:МНОГОЕ "относится к малозначительным, но зато массовым, производимым во множестве статей изменениям.", так что это всё стоит обсудить. Выявить какие неточности позволяет себе шаблон cite journal и складывать из вставленных в него параметров строку, которая будет удовлетворять нашим правилам, это менее трудозатратно, чем ходить ботом менять параметры, согласитесь.·Carn 11:19, 17 августа 2019 (UTC)
          • Уже сообщили вам, что все это уже на соответствующем уровне обсуждено, отлажено и выверено. Но никто вам не запрещает открыть ещё одно обсуждение. Bsivko (обс.) 11:30, 17 августа 2019 (UTC)
            • «Ещё одно»? Так я, собственно, к вам пришёл узнать, было ли хоть какое-то обсуждение. И так и не получил вразумительного ответа. Хотя вы себя ведёте так, как будто я, слепой, этого ответа не вижу.·Carn 11:37, 17 августа 2019 (UTC)
              • Вы спросили были или нет, вам ответили что были. Если есть какие-то проблемы в других языковых разделах - то обращайтесь в эти разделы, это не забота бота. Bsivko (обс.) 12:24, 17 августа 2019 (UTC)
                • Ссылки на обсуждение я от вас не дождусь, да?·Carn 14:33, 17 августа 2019 (UTC)
                  • Вы и не спрашивали никаких ссылок, а телепаты в отпуске. Если речь идёт про перевод cite journal, то эта тема обсуждалась с ноября 2018 года на СО шаблона cite journal, и ещё в десятке разных мест. Консенсус перевода написан прямым текстом на странице шаблона. Нарушать Не используйте этот шаблон в новых статьях конечно можно новичкам, ленивым редакторам или тем, кому некогда этим заниматься. Bsivko (обс.) 14:45, 17 августа 2019 (UTC)
              • Так это обычный способ участника отвечать на претензии. Тут не только не было полноценного анонсирования, тут ещё и реализация корявая, причём сообщения об ошибках не воспринимаются. Естественно, лучше иметь единый для всей Википедии {{cite journal}}, а в местном разделе локализовать только его отображение, сделав его обёрткой для {{публикация}}. Sneeuwschaap (обс.) 15:25, 17 августа 2019 (UTC)

Выводы Carn

Поискал обсуждения, понял, что, действительно, никакого консенсуса нет. Bsivko - будете продолжать утверждать обратное?
Конечно, обёртку над шаблоном надо постоянно менять потому что английский шаблон всё время меняется. Однако и замена ботом тоже порождает ошибки, так что никаких неоспоримых преимуществ не имеет, просто изменения шаблона сложнее "пропихнуть", т.к. надо доказать что оно не вызовет ошибок и согласовать изменение защищённой страницы.
В том числе нет консенсуса что надо везде тащить ГОСТ, как священный грааль, кстати.
Название шаблона "статья" и прочие русицизмы не соответствуют давешниму консенсусу, возможно сейчас по-факту ситуация поменялась, но я широкого обсуждения не видел пока.
Сейчас схожие проблемы обсуждаются на Википедия:К удалению/10 мая 2019#Шаблон:Cite news
Может быть @colt_browning: прокомментирует.·Carn 09:14, 26 августа 2019 (UTC)

  • На мой взгляд, работа по замене {{cite journal}} на {{статья}} сейчас чуть-чуть вредна, поскольку, как было справедливо замечено выше, теряется информация об авторах по отдельности (плюс в модулях CS1 отличная обработка ошибок, которой нет в шаблоне статья). ЕМНИП, были и другие проблемы, вроде русскоязычного оформления для англоязычных статей, но сейчас они решены. Замечу, что в плане обработки баг-репортов Bsivko действует образцово — оперативно и качественно. К оформлению по ГОСТу у многих участников давно есть вопросы, но ни у кого нет сил+желания делать опрос. — Браунинг (обс.) 10:01, 26 августа 2019 (UTC)
    • А вы о каких обработках ошибок которых нет в «статья» говорите? Почему бы эту обработку не добавить в шаблоне «статья»? Обсуждаемый процесс в том числе для этого и предназначен — чтобы мы могли в русскоязычном разделе контролировать шаблоном ошибки и адаптировать различные проявления к русскоязычному разделу проекта. Bsivko (обс.) 11:10, 26 августа 2019 (UTC)
      • Я о красных надписях типа тех, что на странице Участник:Vort/CJ в левом столбце на строках 12, 45, 50. Добавить можно, конечно, но сейчас по факту этого нет. В {{cite web}} подобную проверку ошибок добавлял Advisor, но, во-первых, тогда это вызвало бурное обсуждение и серьёзные возражения (не сама подсветка ошибок, а то, что́ считалось ошибками), во-вторых, это дублирование работы, уже сделанной в модулях WP:CS1. Вероятно, правильнее всего было бы настроить CS1-шаблоны так, чтобы их оформление соответствовало нашим руководствам, после чего сделать {{статья}} CS1-шаблоном (получив даром и обработку ошибок, и совместимость с англоязычными шаблонами), но мне этот путь не нравится, поскольку как раз не нравится текущее оформление, зафиксированное нашими руководствами. Поэтому я предпочёл бы, чтобы сначала было определено, что сообщество сейчас думает про оформление, а потом уже проводилась унификация (которая сама по себе, конечно, благо), желательно на основе CS1. — Браунинг (обс.) 11:24, 26 августа 2019 (UTC)
        • В указанных случаях это валидация URL на некоторые выборочные ошибки. Ссылки у нас используются в куче шаблонов, далеко не только в потомках CS1. И у CS1-шаблонов нет монополии на способность проверить, на те же RFC. Было бы более продуктивно придумать как сделать проверку для любого из шаблонов и для любого параметра. И далее не сидеть в окопах CS1, а распространить эту практику на все шаблоны рувики со ссылками. Этим у нас сейчас кто-нибудь занимается? Bsivko (обс.) 19:05, 26 августа 2019 (UTC)
          • Вы, кажется, недооцениваете могущество тёмной стороны Силы CS1. — Браунинг (обс.) 07:42, 27 августа 2019 (UTC)
            • А можно пояснить смысл вашего комментария? В проверке ошибок указанного списка нет сложностей (и соотв. могущества). Если авторы этих проверок не хотят распространять их на другие шаблоны, то это говорит либо о их лени-нежелании, или некомпетентности. Bsivko (обс.) 07:48, 7 сентября 2019 (UTC)
              • Своим комментарием я лишь обратил ваше внимание на то, что проверки CS1 далеко не исчерпываются валидацией URL, о которой вы сказали в своём предыдущем комментарии. Ничего более. — Браунинг (обс.) 17:26, 12 сентября 2019 (UTC)
                • Я тогда просмотрел список проверок CS1, и не нашёл ничего сверхестественного и нетривиального. Пока что не понятно, что подобная практика то ли отрицается для других шаблонов, то ли не распространяется на них, а существует в некой призакрытой тёмной группе CS1. Bsivko (обс.) 18:15, 12 сентября 2019 (UTC)
  • Согласно решению АК, опросы и голосования без итога устаревают после 2 календарных лет. Итога в опросе по ссылке выше я не вижу, так что ссылаться на него уже нельзя. — VladXe (обс.) 10:10, 26 августа 2019 (UTC)
  • Все ссылки на существующий консеснус даны выше, начиная с документации шаблона и заканчивая обсуждениями десятков участников. Из нового. cite journal по своей сути предназначен для другого раздела, и по определению содержит ошибки. Из очевидного, он банально содержит ссылки на англовики-страницы, которые превращаются в лучшем случае в красные ссылки. В шаблоне из-за англоязычной традиции есть куча вещей, непонятных русскоязычным читателям (например, как вы прочитаете pages=769–78? оченьвидно, что абсолютное большинство русскоязычных читателей будет обескуражено). Все остальное по тексту уже какие-то холивары, не относящиеся к технической стороне вопроса, т.е. это не к боту. Bsivko (обс.) 10:11, 26 августа 2019 (UTC)
    • "по определению содержит ошибки" — непонятно, что имеется в виду. Замечания про красные ссылки и эти дурацкие диапазоны типа 769–78 абсолютно верные, и это прекрасно, что ваш бот это исправляет; но это не имеют никакого отношения к тому, какой именно шаблон использовать, это спокойно можно править и внутри cite journal. — Браунинг (обс.) 17:26, 12 сентября 2019 (UTC)

Автор с ;

Вот здесь бот произвёл замену

на

По моему надо было использовать запятую, а не точку с запятой. Тоша (обс.) 20:37, 2 января 2020 (UTC)

  • Интересный случай. Он посчитал, что first и author это разные ФИО. Тогда добавлю логику, что если есть first и author, но нет last, то это одно ФИО. Bsivko (обс.) 20:43, 2 января 2020 (UTC)
  • Внес изменения. Теперь должно преобразовываться для первого примера в автор=Gromov, Mikhael. Bsivko (обс.) 21:20, 2 января 2020 (UTC)

Внешение ссылки на таксонах

Одновременно с переделкой шаблонов источников бот проставляет шаблон Внешние ссылки, зачастую пустой. Точно ссылку дать не могу, но точно помню, что массовая расстановка шаблона запрещена (даже какого-то редактора наказали за это). Плюс пустой он точно не нужен в статьях, только счётчик байт накручивает. — VladXe (обс.) 17:27, 27 июня 2019 (UTC)

  • Смысл пустого в том, что при появлении данных в ВД он станет непустым. И это происходит повсеместно. Расстановка происходит только в рамках других (существенных) правок (т.е. не накрутка бота и не спам страниц наблюдения). Для животных он уже присутствует в половине статей, т.е. типичен. А вручную гоняться за ним нецелесообразно. Bsivko (обс.) 17:48, 27 июня 2019 (UTC)
    • Я предупредил, что такое поведение бота наказуемо, а Вы там сами смотрите. — VladXe (обс.) 18:01, 27 июня 2019 (UTC)
      • Пока посмотрел, что где-то только в 10% плюс минус лапоть в случаях шаблон внешних ссылок появляется. Еще по наблюдениям, просмотрев БРЭ и Британику, далеко не все статьи получают отражение в них. Если бы последнее было хотя бы в половине случаев, то шаблон точно бы имел смысл почти всегда. Здесь же бось что большой риск не сколько в полезности шаблона, а в появлении нервно реагируюбщего участника с неординарным мышлением. Пока отключу шаблон в этой тематике. В будущем может выродится какой-нибудь импорт ссылок из БРЭ с простановкой шаблона если его нет. Bsivko (обс.) 19:17, 27 июня 2019 (UTC)
  • Пробую сейчас так: если указано одно из свойств P1417 или P2924, то включается добавление внешних ссылок. Bsivko (обс.) 16:52, 30 июня 2019 (UTC)
    • Правильное решение, пустых Ш:ВС не будет. Но всё равно: нет консенсуса на расстановку ботом этого шаблона в статьях. — VladXe (обс.) 17:03, 30 июня 2019 (UTC)

нп3

В этой правке шаблон нп3 вставлен ошибочно. --Браунинг (обс.) 04:04, 3 июля 2019 (UTC)

  • Добрый день. Там несколько нп3, но если правильно понимаю, то речь идет о «Слоун, Нил». Тут вопрос, как authorlink = Слоун, Нил попало в cite journal? Судя по правкам, его внесли вручную так при «переводе». Нужно будет посмотреть как часто такое встречается и/или придумать как это обрабатывать. Как минимум сделать логи-предупреждения для кириллицы в authorlink. Bsivko (обс.) 09:27, 3 июля 2019 (UTC)
  • Для этого случая создал перенаправление, по идее WinterheartBot должен найти и исправить, для всех ссылок подобного автора (хотя она тут одна). Bsivko (обс.) 10:46, 3 июля 2019 (UTC)
  • Добавил логирование кириллических authorlink (где есть хотя бы один символ кириллицы). По крайней мере, понаблюдаем за такими случаями. Пока что рабочим решением кажется поиск статьи по названию русскоязычном разделе, и если есть, то ставить обычную викиссылку, а не Нп. Надеюсь, с другими языками (вне рус и англ) подобных пробле мне будет. Эти хаки творить должны были только русскоязычные участники. Bsivko (обс.) 11:28, 3 июля 2019 (UTC)
  • Пока что за 3 дня две находки
{'title': 'Рани (Доктор Кто)', 'reason': 'cyrillic authorlink', 'data': {'authorlink_field_name': 'authorlink', 'authorlink_field_value': 'Дейвис, Расселл Ти'}},
{'title': 'Pressure (альбом Open Space)', 'reason': 'cyrillic authorlink', 'data': {'authorlink_field_name': 'authorlink', 'authorlink_field_value': 'Бухарин, Андрей Валерьевич'}},

Их обработало уже хорошо. До этого было обработано около 7к шаблонов, и там скорее всего осталось несколько случаев. Bsivko (обс.) 17:03, 5 июля 2019 (UTC)

  • За прошедшее время событий несколько увеличилось. Так, за последние три дня:
{'title': 'Zen Arcade', 'reason': 'cyrillic authorlink', 'data': {'authorlink_field_name': 'authorlink', 'authorlink_field_value': 'Дэвид Фрике'}},
{'title': 'Эллипс', 'reason': 'cyrillic authorlink', 'data': {'authorlink_field_name': 'authorlink', 'authorlink_field_value': 'Айвори, Джеймс (математик)'}},
{'title': 'Эллипс', 'reason': 'cyrillic authorlink', 'data': {'authorlink_field_name': 'authorlink', 'authorlink_field_value': 'Бессель, Фридрих Вильгельм'}},
{'title': 'Black Sabbath', 'reason': 'cyrillic authorlink', 'data': {'authorlink_field_name': 'authorlink', 'authorlink_field_value': 'Кастальский, Сергей Евгеньевич'}},
{'title': 'Сегре, Беньямино', 'reason': 'cyrillic authorlink', 'data': {'authorlink_field_name': 'authorlink', 'authorlink_field_value': 'Фройденталь, Ханс'}},
{'title': 'Deal With Silence', 'reason': 'cyrillic authorlink', 'data': {'authorlink_field_name': 'authorlink', 'authorlink_field_value': 'Бухарин, Андрей Валерьевич'}},
{'title': 'The Seeds of Love', 'reason': 'cyrillic authorlink', 'data': {'authorlink_field_name': 'authorlink', 'authorlink_field_value': 'Азеррад, Майкл'}},

Bsivko (обс.) 20:07, 8 июля 2019 (UTC)

Пробел между инициалами

По правилам русского языка должен быть. Можно ли сделать добавление пробела, а не только точек после каждого инициала, как в этой правке?--Yellow Horror (обс.) 11:13, 9 июля 2019 (UTC) P.S. И если можно, то лучше сразу неразрывный пробел.--Yellow Horror (обс.) 11:14, 9 июля 2019 (UTC)

  • Сейчас для инициалов есть отдельная распознавательная фунцкия, которая если видит две прописные буквы, то расставляет точки. Например, Name FS, Pio LS,Name F.S., Pio L.S.,. Так понимаю, речь идет только о пробеле между инициалаами, т.е. Name F. S., Pio L. S.,. Если неразрывный пробел, то это должен быть какой его код? или вариант что-то типа &nbsp; ? Bsivko (обс.) 12:27, 9 июля 2019 (UTC)
    • Последнее. Или как делает бот Citing Bot в подшаблонах Cite doi / Cite pmid: {{nobr|Фамилия И. О.}}. — VladXe (обс.) 12:34, 9 июля 2019 (UTC)
      • Пока что изменил логику и включил в тесты следующие варианты:
'a'→'a'
'John T,' → '{{nobr|John T.,}}'
'Name FS, Pio LS,' → '{{nobr|Name F. S.,}} {{nobr|Pio L. S.,}}'
'Name FS, Pio LS' → '{{nobr|Name F. S.,}} {{nobr|Pio L. S.}}'
  • Если все как ожидалось, то тогда сегодня продолжу ботом. Bsivko (обс.) 13:16, 9 июля 2019 (UTC)
    • Сразу недочёт: запятую надо вынести из-под шаблона — это отдельная семантическая единица. — VladXe (обс.) 13:32, 9 июля 2019 (UTC)
      • Она же тогда будет переноситься на следующую строку, а запятые по не переносятся. Bsivko (обс.) 13:33, 9 июля 2019 (UTC)
      • Хотя сейчас поигрался с хромом, типа того

AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, AAAAAA, и оно не переносит. Оно точно переноситься не будет? Bsivko (обс.) 13:36, 9 июля 2019 (UTC)

'a'→'a'
'John T,' → '{{nobr|John T.}},'
'Name FS, Pio LS,' → '{{nobr|Name F. S.}}, {{nobr|Pio L. S.}},'
'Name FS, Pio LS' → '{{nobr|Name F. S.}}, {{nobr|Pio L. S.}}'
  • Bsivko (обс.) 13:47, 9 июля 2019 (UTC)
  • Вообще говоря, хорошо бы, если имеет смысл и возможно без ложных срабатыаний, перенести последнее на уровень форматирования ФИО в шаблонах. Например, для полей где могут быть ФИО (например, в шаблоне «статья» для «автор» «ответственный», аналогично для шаблона «книга» и т.п.) распознавать конструкции Фамилия И.О. и преобразовать ее в {{nobr|Фамилия И. О.}}. Только чтобы не получалось потом какого-нибудь {{nobr|{{nobr|Фамилия И. О.}}}} или чего подобного. Bsivko (обс.) 14:02, 9 июля 2019 (UTC)
    • Второе скорее, у шаблона 5 (!) перенаправлений. Как Вам {{nobr|{{S|{{s|{{Ы|Фамилия И. О.}}}}}}}} после 4 прохода ботом? — VladXe (обс.) 14:52, 9 июля 2019 (UTC)
      • Да, поэтому если такое делать, надо будет хорошо продумать это и протестировать. Пока есть только идея обрабатывать только простой текст. Т.е. если есть внутри текстового блока шаблон вики ({{..}}), то этот шаблон синтаксически разбирается и смотрится что у него за параметры, и далее процедура повторятся до тех пор, пока не останется голый текст без шаблонов. При этом если на пути встречается s, nobr или их синонимы, то такое не обрабатывается. Bsivko (обс.) 15:09, 9 июля 2019 (UTC)
  • После запуска на второй статье встречаем такой пример:
'Bicalho, Mda G' → 'Bicalho, {{nobr|Mda G.}},'
  • В конце всякие et al не отличает. И по идее, лучше бы подобное и не различало. Обработал еще 30 статей и добавил в логи выше. Есть случаи когда имена не сокращаются и захватывается часть имени. Есть дефисы в именах. Есть случаи когда в конце точка. С другой стороны, в такой реализации бот хуже не делает, только подправляет в сторону nobr >90% случаев. Bsivko (обс.) 22:59, 9 июля 2019 (UTC)
    • Надо ...et al; ..., et al.; ...Jr научить обрабатывать. Это как минимум не вежливо, когда первые 4 группы инициалов через пробел и с точкой, а пятый / младший — нет. Отдельной строкой надо ...III научить сохранять, а не преобразовать в ...I. I. I.. — VladXe (обс.) 07:38, 10 июля 2019 (UTC)
    • Не нашёл в примерах: 3-4 буквы в инициалах он штатно обрабатывает? — VladXe (обс.) 07:41, 10 июля 2019 (UTC)
  • То, что сейчас происходит, выходит за рамки расстановки точек, которые задумывались изначально. Все эти хотелки et al, Jr, III уже относятся к другой задаче. Т.е. добавление непробельного форматирования для всех полей, где есть ФИО. Потому что сейчас далее начнется давайте для «Пупкин В.В.» добавим nobr и каких-нибудь запятых. Т.е. для перевода нужно, чтобы делалось
'Name FS, Pio LS,' → 'Name F. S., Pio L. S.,'
  • Что решает проблему англоязычных названий. И этого достаточно (ошибок тут нет, у нас 99% ссылок так оформлено). Расстановку nobr нужно уже делать отдельной задачей, и распространять ее на другие шаблоны («статья» «книга») и т. д. Поэтому я сейчас откатываю на обычный пробел, а nobr делаем отдельно. Bsivko (обс.) 11:25, 10 июля 2019 (UTC)
  • Вернул в первоначальный вариант без nobr. Добавил пробел между инициалами. Для перевода бот работает в таком режиме. nobr рассматриваем отдельной задачей. Bsivko (обс.) 18:38, 10 июля 2019 (UTC)

Форматирование авторов

На основании и полученном опыте предыдущего раздела «Пробел между инициалами» рассмотрим следующее. Если правильно понимаю, то можно в автоматическом режиме форматировать некоторые недочёты оформления параметров авторов. Т.е. это может быть рассстановка пробелов, простановка nobr и т.п. В первом приближении нужно разобраться для каких шаблонов и их полей может применяться данная функция. Если посмотреть на {{статья}} и {{книга}}, то в них предположительно можно обработать в таком ключе:

  • статья: автор, ответственный, автор издания;
  • книга: автор, ответственный;

Вероятно, есть другие шаблоны, где можно сделать то же самое. Также не исключено, что вышеприведенные два списка некорретны (что-то лучше не трогать или что-то еще можно захватить). В этом боте cite journal обрабатывается до форматирования шаблонов, потому править cite journal отдельно нет смысла. Также, запланирован перевод cite book, и его тоже лучше не трогать. Я бы предложил рассматривать оригинальные шаблоны (не опирающиеся на другие, как Cite pmid) на кириллице, которые претендуют на какой-то стандарт оформления (сопряженным например с правилами ГОСТа).

Второе, нужно рассмотреть примеры обработки, как бы оно могло быть обработано, и под них затачивать функционал. Например,

'a'→'a'
'John T,' → '{{nobr|John T.,}}'
'Name F.S., Pio L.S.,' → '{{nobr|Name F. S.,}} {{nobr|Pio L. S.,}}'
'Name F.S., Pio L.S.' → '{{nobr|Name F. S.,}} {{nobr|Pio L. S.}}'
'Вася Пупкин' → 'Вася Пупкин'
'Пупкин В.В.' → '{{nobr|Пупкин В. В.}}'
'Пупкин В.В.' → '{{nobr|Пупкин В.В.}}'
'Name F.S, Pio L.S., et al' → '{{nobr|Name F. S.,}} {{nobr|Pio L. S.,}} {{nobr|et al.}}'
'Name F.S, Pio L.S., и др.' → '{{nobr|Name F. S.,}} {{nobr|Pio L. S.,}} {{nobr|и др.}}'
'Людвик XVII' → '{{nobr|Людвик XVII}}'
'[[Ванин, Иван Иванович|Vanin II]]' → '{{nobr|[[Ванин, Иван Иванович|Vanin II]]}}'
'{{Нп3|Карл XV|Карл XV|en|Carl XV}}' → '{{Нп3|Карл XV|Карл X.V.|en|Carl XV}}'

Поятно, что это примеры для примеров.

Это все уже в рамках дозадачи для Оформление параметров шаблонов. Bsivko (обс.) 18:57, 10 июля 2019 (UTC)

  • Зачем вверху неправильные варианты? Ведь уже обсуждалось, что запятая в nobr быть не должна. Можно разделять переносом строки et al. / и др. 7-я, 11-я и 12-я строки содержат ошибки: не проставлен пробел; II — это инициалы, должны быть через точку с пробелом, а XV — порядковый номер, никаких точек. Думаю, надо исключить все реально встречающиеся римские буквы из обработки, а также не обрабатывать ситуацию рус. имя + лат. «инициалы», которые номер. Меньшее зло, когда бот II сочтёт за номер — он же ничего не ухудшил (строка 11), чем когда он внесёт ошибку и переведёт номер в инициалы (строка 12). — VladXe (обс.) 20:41, 10 июля 2019 (UTC)
    • Так вопрос в написании правильных вариантов. Выше написано, что это примеры примеров. Потому как MD — это римское 1500 или инициалы? Мне не нужны фразы «содержат ошибки». Мне нужны конкретные примеры как правильно и как недопустимо (т.е. тесты для определения, что недопустимый вариант не получается). Bsivko (обс.) 21:22, 10 июля 2019 (UTC)
      • 12-я Строка — не допустима. Римские цифры из двух символов, используемые как номера: II, IV, VI, IX, XI, XX, XL + ХХ (рус.). Даже XL (40) избыточен, но вдруг. Есть вариант: бот после переработки их в инициалы после Ш:nobr ставил шаблон {{что}}, чтобы люди потом перепроверили. Если перед римскими цифрами стоит кириллица, то преобразование не производить. — VladXe (обс.) 08:53, 11 июля 2019 (UTC)
        • Хорошо. Сегодня попробую собрать набор примеров для этого описания. Bsivko (обс.) 08:58, 11 июля 2019 (UTC)
          • Попробуйте в примеры найти фамилию с 3 инициалами (для контраста). — VladXe (обс.) 09:00, 11 июля 2019 (UTC)
            • Примеры распишу вручную, чтобы можно было видеть то, что хочется видеть. И далее уже запустим по реальным статьям. 3 инициалов я кстати не видел (когда без точек) и когда-то мы вроде договорились оставаться на двух. Еще, эта логика она же для полей имен авторов. Там я тож не припомню чтобы использовалось римские цифры. Римские видел например в номерах томов, но мы же ФИО там не обрабатываем. Bsivko (обс.) 10:04, 11 июля 2019 (UTC)

  • Маскирование «Фамилия И.»:
'John T,' → '{{nobr|John T.}},'
'John T;' → '{{nobr|John T.}};'
'John T.,' → '{{nobr|John T.}},'
'John T.;' → '{{nobr|John T.}};'
'Пупкин В;' → '{{nobr|Пупкин В.}};'
'Пупкин В.;' → '{{nobr|Пупкин В.}};'
'Пупкин В,' → '{{nobr|Пупкин В.}},'
'Пупкин В.,' → '{{nobr|Пупкин В.}},'
  • Маскирование «Фамилия И.О.»:
'John WV,' → '{{nobr|John W. V.}},'
'John WV;' → '{{nobr|John W. V.}};'
'John WV.,' → '{{nobr|John W. V.}},'
'John WV.;' → '{{nobr|John W. V.}};'
'John W.V,' → '{{nobr|John W. V.}},'
'John W.V;' → '{{nobr|John W. V.}};'
'John W.V.,' → '{{nobr|John W. V.}},'
'John W.V.;' → '{{nobr|John W. V.}};'
'Пупкин ЦФ;' → '{{nobr|Пупкин Ц. Ф.}};'
'Пупкин ЦФ.;' → '{{nobr|Пупкин Ц. Ф.}};'
'Пупкин ЦФ,' → '{{nobr|Пупкин Ц. Ф.}},'
'Пупкин ЦФ.,' → '{{nobr|Пупкин Ц. Ф.}},'
'Пупкин Ц.Ф;' → '{{nobr|Пупкин Ц. Ф.}};'
'Пупкин Ц.Ф.;' → '{{nobr|Пупкин Ц. Ф.}};'
'Пупкин Ц.Ф,' → '{{nobr|Пупкин Ц. Ф.}},'
'Пупкин Ц.Ф.,' → '{{nobr|Пупкин Ц. Ф.}},'
'Пупкин ЦФ, Иванов И' → '{{nobr|Пупкин Ц. Ф.}}, {{nobr|Иванов И.}}'
  • Если не считать, что 2—5, 10, 12—13, 14 — нарочито ошибочны [1) хоть пронумеровали б примеры, 2) ну не встречал я только одну точку], то претензий нет. Иногда встречается такие инициалы: А.-А., вариант А-А не помню, но как бот будет его обрабатывать? — VladXe (обс.) 11:16, 12 июля 2019 (UTC)
  • Теоретически, могут быть И.О. перед фамилией. Еще могут быть кириллица и латиница в одной строке. Bsivko (обс.) 23:41, 11 июля 2019 (UTC)
    • 1) Не теоретически, а вполне практически, очень часто встречается, что инициалы до автора. Более того, часто только первый автор записан ФИО, а второй и последующие — ИОФ. По идеи всё это надо приводить к ВП:БИБГРАФ. 1а) Но это только в авторах (!), в редакторах и пр. (после слеша) по ГОСТу правильно ИОФ. 2) Кириллица и латиница в одной строке быть могут, боту не пофиг? Вот в одной ФИО — явно либо ошибка, либо номер. Такое не обрабатывать и если номер не является римским числом (включая однобуквенные I, V, X, L), то можно маркировать ш:Кто. — VladXe (обс.) 11:16, 12 июля 2019 (UTC)
  • Отсутствие обработки вложенных шаблонов:
'{{nobr|John T,}} John T,' → '{{nobr|John T,}} {{nobr|John T.}},'
  • «et al» - точка, удаление курсива, только в конце строки, кириллица пропускается (после что-то аналогичное с «и др»):
'John D. et al' → '{{nobr|John D.}} {{nobr|et al.}}'
'John D. et al.' → '{{nobr|John D.}} {{nobr|et al.}}'
'John D. et al' → '{{nobr|John D.}} {{nobr|et al.}}'
'Пупкин В. et al' → '{{nobr|Пупкин В.}} et al'
'John D. 'et al' ' → '{{nobr|John D.}} {{nobr|et al.}}'
'John D. ''et al'' ' → '{{nobr|John D.}} {{nobr|et al.}}'
  • 1) et al. можно переносить! nobr во второй части не нужен. 2) Курсив не убирать, в бактериологии  et al. в авторстве таксона пишется в курсиве, возможно по аналогии и в статьи так будет. Только точку добавить в курсиве. 3) Ещё забыли англовариант с запятой перед «, et al.» (есть же у них вариант «, and»), это у бота вызовет затруднение? — VladXe (обс.) 11:16, 12 июля 2019 (UTC)
  • Римские:
'John II' → 'John II'
'John II;' → 'John II;'
'John II,' → 'John II,'
'John II.' → 'John II.'
'John IV' → 'John IV'
'John VI' → 'John VI'
'John IX' → 'John IX'
'John X' → 'John X'
'John XI' → 'John XI'
'John XX' → 'John XX'
'John XL' → 'John XL'
  • Может вернёмся к варианту с Ш:что? Латиницу по умолчанию переделывать и ставить шаблон, а вот кириллическую фамилию и латинские «инициалы» не переделывать, потому что это точно номер. Вероятность, что монархи/папы/патриархи будут авторами статей минимальна, а вот англоязычные Иван-Иванычи или Ксеркс-Иванычи могут встретиться. — VladXe (обс.) 11:16, 12 июля 2019 (UTC)
  • Еще вопрос, нужно ли из всех двух подряд идущих пробелов делать один. Bsivko (обс.) 23:41, 11 июля 2019 (UTC)
    • Да, «экономика должна быть экономной». только надо отличать вариант многострочного форматирования:
{{статья
 | автор    = 
 | заглавие = 
 | язык     = 
 | издание  = 
 | год      = 
 | страницы = 
 | doi      = 
}}
В таком виде и оставить, лишние пробелы не убирать. — VladXe (обс.) 11:16, 12 июля 2019 (UTC)
  • Порой встречается — народ почему-то использует cite journal чтобы сослаться на youtube, и указывает в авторах не ФИО. И потом получается FlatbushZombies T.V. Bsivko (обс.) 22:13, 17 июля 2019 (UTC)
    • Как я писал выше: все человеческие ошибки не отследишь. Итог: сами себе злобные покемоны. — VladXe (обс.) 22:20, 17 июля 2019 (UTC)

Пометка бота

Добрый день, Если вы ботом вносите правки, просьба помечать буквой "б" --Sergei Frolov (обс.) 05:09, 15 июля 2019 (UTC)

Johnny's Jr. July 15, 2019.

Johnny's Jr.新しく掲載しました、査読お願いします。--春川楓 (обс.) 03:50, 17 июля 2019 (UTC)

Добрый день! Бот помещает Шаблон:Внешние ссылки перед шаблоном Шаблон:s-end. Это некорректное расположение — см. пример такой правки. В общем случае Шаблон:Внешние ссылки следует располагать после Шаблон:s-end // vh16 (обс.) 22:09, 31 августа 2019 (UTC)

  • Добоый день! Бот был в отпуске, потому пишу только сейчас. Да, есть такая проблема. Спасибо за сообщение и что исправили. До настоящего времени перебирал и исправлял правки вручную для набора статистики. Сейчас явно нужно комплексное решение, + появились наработки в эьлм направлении. Сегодня еще раз пересмотрю правки «внешние ссылки». И далее предполагаю решение — это чтобы бот не вставлял ничего внутри тегов HTML и вики-шаблонов. Bsivko (обс.) 10:04, 6 сентября 2019 (UTC)
  • Нашелся ещё один случай с refbegin/refend. Тут внутри тега-шаблона не поможет, похоже нужно обрабатывать определённые пары. Или как-то находить их. Bsivko (обс.) 16:34, 6 сентября 2019 (UTC)
  • Пока сделал так, что обнаруживается один из закрывающих шаблонов ("refend", "s-end", "end box"), то вставка выполянется в строке после такого шаблона. Может есть ещё какие парные шаблоны такого рода, если что, список надо будет дополнить. Bsivko (обс.) 17:09, 6 сентября 2019 (UTC)

Некорректная замена дефиса

День добрый! Насколько понимаю, одно из назначений бота — замена «-» на «—» в диапазонах страниц? Однако, вот здесь бот заменил дефисы в тэге , что привело к отображению закомментированного текста… Лапоть (обс.) 07:54, 9 октября 2019 (UTC).

  • Да, вы все правильно описали и хорошо что заметили, спасибо. От комментариев лучше защитить, в ближайшее время подправлю бота. Bsivko (обс.) 08:06, 9 октября 2019 (UTC)
  • Ок! Кстати: это случайно не с вами мы лет 8 назад дискутировали по поводу оцифровки сознания на форуме Исходников? Лапоть (обс.) 09:27, 9 октября 2019 (UTC).
  • Добавил игнорирование для случаев, если в обрабатываемых параметрах (по правке дефиса) присутствует <!--. Эти случаи логируются, и там уже посмотрим как они выглядят. Bsivko (обс.) 10:49, 9 октября 2019 (UTC)

Внешние ссылки

[4] - бот зачем-то добавил пустой шаблон ВС. А здесь в итоге получилась полностью дублирующая ссылка. По идее, если Warheroes единственная ссылка в ВС, его не нужно добавлять. ShinePhantom (обс) 18:10, 23 октября 2019 (UTC)

  • Дублирующую ссылку как раз таки нужно переводить на шаблон как стандартный способ проставления ссылок. Распознавания героев страны (пока что) у бота нет. Bsivko (обс.) 19:30, 23 октября 2019 (UTC)
  • Первое похоже на минорную реакцию на карточку персоны, но вроде её я отключал.. Нужно посмотреть. Bsivko (обс.) 19:41, 23 октября 2019 (UTC)

Описание правок бота

Просьба изменить: грамота — это совсем другое (грамотность — ближе, но всё же несколько другое; лучше всего было бы разбить на «орфография», «пунктуация», «стиль»). NBS (обс.) 10:15, 26 октября 2019 (UTC)

Ещё одна проверка при замене шаблона

Доброго времени суток. Просьба добавить в бот ещё одну проверку: содержимое параметра заглавие не должно заканчиваться на точку, но если там 3 точки, оно должно быть заменено на многоточие. Если в алгоритме заглавие подвергается действию викификатора, то фразу после «но» игнорировать. — VladXe (обс.) 10:24, 2 ноября 2019 (UTC)

  • Добрый день! Викификатора бот не трогает. Не должно заканчиваться - это точку нужно удалить? Заглавие это для переводных шаблонов или других? (хотелось сразу бы список) Bsivko (обс.) 11:17, 2 ноября 2019 (UTC)
    • Да, точку надо удалить, если их не 3. (Когда в одной статье я удалил 4-й раз точку в этом параметре, мне надоело, написал сюда). Ш:Статья, Ш:Публикация, Ш:Книга, Ш:Cite web, Ш:Cite web 2 — там везде точки ставятся автоматом. Может ещё в каких клонов Ш:Cite web такая фича есть, но я ими не пользуюсь + времени жалко на выяснение. Единственная просьба — ради удаления только точек статью ботом не трогать. — VladXe (обс.) 11:34, 2 ноября 2019 (UTC)
      • Т.е. в «Ш:Статья, Ш:Публикация, Ш:Книга, Ш:Cite web, Ш:Cite web 2» точки ставятся автоматом, и последняя одна точка лишняя и удаляется. Да, понятно, что правка незначительная и делается с другой, значимой правкой. Если многоточие, то замена на символ «…». Две точки удалять или в многоточие? Bsivko (обс.) 16:54, 2 ноября 2019 (UTC)
        • ИМХО, две точки лучше удалить — скорее это 2 раза нажатая одиночная точка, чем третья ненажатая из многоточия. — VladXe (обс.) 16:58, 2 ноября 2019 (UTC)
          • Пример обработки. Все верно? Bsivko (обс.) 17:31, 2 ноября 2019 (UTC)
            • Да. — VladXe (обс.) 17:44, 2 ноября 2019 (UTC)
              • Хорошо, добавил эту задачу для бота. До разных страниц он добирается с разной скоростью, и если есть какие статьи с точками, то можно целенаправленно обработать. Bsivko (обс.) 18:06, 2 ноября 2019 (UTC)
                • Спасибо за усовершенствование. Не стоит овчинка выделки, точки ещё ботоправить. Главное, чтобы в больше точек не плодил (даже если бот просто их копирует с оригинала, последняя правка, а значит и претензии — к нему). — VladXe (обс.) 19:31, 2 ноября 2019 (UTC)
                  • Хорошо. Ситуация такова, что оригинал создают участники, и бот использует как есть то что есть, он просто так точно не должен ничего придумывать. Но если есть известные случаи, то можем их обрабатать ботом. Bsivko (обс.) 19:37, 2 ноября 2019 (UTC)
                  • Заметил первую точку, удалённую автоматически. Раз так быстро, то явление достаточно частое. И даже две. Может на итальянском точки это нормально. Bsivko (обс.) 19:07, 3 ноября 2019 (UTC)
                  • Случаи походу разные. Есть инициалы, есть несколько предложений в заголовке, и др. Измнения весьма позитивны, детально на это смотреть прекращаю. Bsivko (обс.) 22:02, 4 ноября 2019 (UTC)
                    • Пофиг, точка автоматом для всех ставится, неудобство только в коде, для читателя всё по правилам. — VladXe (обс.) 03:42, 5 ноября 2019 (UTC)

форматирование шаблон-карт

Зачем ваш бот ровные красиво-удобные шаблон карты превращает в волнисто-скомканные? — Капитан Герхард (обс.) 12:12, 9 ноября 2019 (UTC)

  • Сейчас это особенность техпроцесса. Чтобы найти одинаковые, чтобы отличить «издатель» от «  издатели  » и т.п. происходит переход к упрощённой форме. Bsivko (обс.) 12:46, 9 ноября 2019 (UTC)
  • Сегодня реализовал распознавание шаблон-карт табличного вида. После пуска на полтора десятке статей вроде все выглядит хорошо. Но сейчас он включён только для шаблонов КИ. Bsivko (обс.) 12:50, 7 января 2020 (UTC)

Дублирование ссылки

В статье Витвинский, Валентин Фёдорович вставленный ботом шаблон просто продублировал единственную внешнюю ссылку на сайт "Герои страны". Если есть мнение, что использование шаблона ВС лучше, чем стандартный раздел, то, видимо, стоит делать проверку на подобный случай и удалить раздел "Ссылки" совсем. — Гдеёж?-здесь 08:56, 24 ноября 2019 (UTC)

  • Это правка 23 октября, поиск и удаление дублирующей warheroes ссылки было добавлено где-то в это время, и вероятно 23 числа еще не было (была 25-го по истории). В общем случае бот пробует распознать и удалить дублирующие ссылки, но это не всегда получается (ВД и в статье могут использоваться например различные идентификаторы). Для этой статьи попробую сделать отдельный запуск. Bsivko (обс.) 09:56, 24 ноября 2019 (UTC)
  • Обработал. Последняя версия бота успешно распознала warheroes для этой статьи. Bsivko (обс.) 09:57, 24 ноября 2019 (UTC)

Замена дефиса на тире

Добрый день, Замена дефиса на тире как-то коробит взгляд [5] --Sergei Frolov (обс.) 09:17, 15 декабря 2019 (UTC)

  • Добрый день. По правилам оформления дефиса точно не должно быть при обозначении диапазонов. Могут быть варианты ndash/mdash, но точно не тире. Bsivko (обс.) 14:30, 15 декабря 2019 (UTC)
  • В указанной ссылке общая проблема оформления (в страницах пишцтся страницы, а не слова). Исправил. Bsivko (обс.) 14:35, 15 декабря 2019 (UTC)

allpages в cite book

Добрый вечер! Ваш бот совершает ошибку при переводе шаблона cite book: параметр «allpages» он заменяет на параметр «страницы», а надо заменять на параметр «страниц». V for Vendetta (обс.) 15:07, 28 декабря 2019 (UTC)

ref-sfn

Добрый день. Ваш бот ломает ref'ы: 12. В шаблоне {{Cite book}} параметр |last= автоматически подставляется в/вместо |ref=. // Maqivi (вер) 04:59, 29 декабря 2019 (UTC)

  • Добрый день. Здесь пожалуйста поподробнее. Сейчас по ссылке вижу один Ref ref=Cross, Livingstone, которому добавляется по форматированию пробел, и он работает как ref. Параметры last имеют значения Ehrman и Kelhoffer и переходят вместе с first в поле «автор», откуда Ehrman, Bart и Kelhoffer, James A. соответственно. Не могу понять в чем проблема, которую вы описываете. Bsivko (обс.) 10:33, 29 декабря 2019 (UTC)
  • Если правильно понимаю, связка с книгой должна быть через ref, т.е. так а не через автора. Так? Bsivko (обс.) 10:44, 29 декабря 2019 (UTC)
    • Да, в шаблоне Cite book |ref= не пишут, а берут данные для ref из |last=. Когда ваш бот переносит данные из |last= в |автор=, то связь с шаблоном {{sfn}} теряется. // Maqivi (вер) 11:17, 29 декабря 2019 (UTC)
  • Пока что сделал так: если в исходом есть last и нет ref, то создаётся ref со значением last. Пример как в этой правке. Если в тексте есть sfn на last, то они переключатся на ref. Bsivko (обс.) 10:55, 29 декабря 2019 (UTC)
    • Да, можно сделать ref со значением last, но они нужны не в шаблонах, которые в примечаниях, а те, которые в списках Литературы и Ссылки. Есть проблема когда есть параметры last1, last2 и т.д., с ними работает шаблон {{sfnp}}. Раньше TextworkerBot расставлял шаблоны с проблемами в шаблонах sfn. Если ваш бот возьмёт и эту задачу, то проблему с неработающими ссылками можно будет постепенно решить. // Maqivi (вер) 11:17, 29 декабря 2019 (UTC)
      • Только сейчас понял вашу правку в статье Sabre Wulf :-). Спасибо за разъяснение. Пока что отлючил обработку статей где есть {{sfnp}}. Статей таких немного, но они используют разные шаблоны из англовики. Далее предполагаю написать обработку, когда распознаются sfnp|A|B|.., для всех шаблонов с A|B проставляется ref A, B, и далее sfnp заменяются на sfn|A, B. Bsivko (обс.) 12:46, 29 декабря 2019 (UTC)

Archiveurl

Почему-то архивированные копии переносятся в параметр "ссылка" https://ru.m.wikipedia.org/wiki/%D0%A1%D0%BB%D1%83%D0%B6%D0%B5%D0%B1%D0%BD%D0%B0%D1%8F:%D0%A1%D1%80%D0%B0%D0%B2%D0%BD%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B2%D0%B5%D1%80%D1%81%D0%B8%D0%B9/104325426 так и должно быть? --Subvert (обс.) 08:36, 3 января 2020 (UTC)

издательство журнала «Вокруг света»

Для статьи из журнала 2012 года было добавлено издательство «Молодая гвардия», но судя по статье Вокруг света (журнал) с 1993 года его выпускает другое издательство. Вообще, ввиду изменчивости, я лично думаю, что для журналов и газет лучше по возможности указывать ISSN, и только там, где это невозможно, указывать город издания и издательство, издавшее цитируемый выпуск журнала или газеты. Illustr (обс.) 10:29, 3 января 2020 (UTC)

  • Понял, спасибо за сообщение. Простановку можно попробовать сделать по годам, но пока что убрал из контрольного списка. Bsivko (обс.) 10:35, 3 января 2020 (UTC)

Заменять "éditeur" на "издательство", а не "ответственный"

А "lieu" на "место", если я правильно понял. Вот пример такой правки. Источники из французской статьи. Hdfan2 (обс.) 04:22, 4 января 2020 (UTC)

Ломается ссылка на автора книги

Бот сломал ссылку на автора

Было: Грин, Брайан. Ткань космоса. — Penguin Books Ltd., 2005. — ISBN 978-0-14-101111-0.
Стало: [[Грин, Брайан|Грин, Брайан]][[:en:Грин, Брайан|[англ.]]]. Ткань космоса (неопр.). — Penguin Books Ltd., 2005. — ISBN 978-0-14-101111-0.
  • Гм.. особенность в том, что authorlink это уже ссылка, она не должна быть в квадратных скобках. Но раз случай есть, надо внести правки. Сейчас исправлю, спасибо. Bsivko (обс.) 10:13, 6 января 2020 (UTC)
  • И посмотрел по логам — этот случай не единственный. Bsivko (обс.) 10:13, 6 января 2020 (UTC)
  • Еще вы добавили authorlink2 - эта ссылка используется для второго автора, которого не указано, для одного автора нужен authorlink. Bsivko (обс.) 10:28, 6 января 2020 (UTC)

Недостаточно доказательств в правке от 21 июня 2019 BsivkoBot

  • Хочу сообщить что ваших доказательств и ссылок подтверждающих ваши слова в отредактированной 21.06.2019 Участник:Bsivko и его ботом BsivkoBot не достаточно ,что бы модерация Wikipedia посчитала данную редактуру за проверенную страницу Rocks`sDiamonds.
  • И не нужно мне доказывать обратное,что ошибаюсь я.

—(UTC)Участника:31.173.242.116 (Не зарегестрирован в системе Wikipedia) |(обс.) 16:27, 12 января 2020

Ошибки бота по НП Краснодарского края

Добрый день. Недавно бот добавлял в статьи раздел "Население" (табл./график) + "Примечание". Я просмотрел небольшую часть статей и понял, что часто бот часто делал это как-то наобум -- вставлял посреди другого раздела, нарушая его целостность [6], [7], [8], [9], [10], [11], или вставлял ниже Примечаний [12], добавил таблицу при имеющейся [13], попутно делал делал какие-то бессмысленные правки [14], [15] ДолбоЯщер (обс.) 14:30, 23 января 2020 (UTC)

  • Добрый день. Бот запускался в рамках этого запроса и в нем было сразу понятно, что все случаи неформализуемы и верятны сбои. Коллега Лиманцев сообщил, что все просмотрит и подправит если что-то не так. Попробуйте обратится к нему. Bsivko (обс.) 14:50, 23 января 2020 (UTC)
    • Пользуясь случаем, еще благодарю уважаемого Bsivko за помощь! Уважаемый ДолбоЯщер, восхищен Вашей работой - никто не делает лучше и скрупулезнее Вас!

По теме. Почти все видимые ошибки связаны со старым вкладом, с его непонятной разверткой статьи (чаще всего это раздел Улицы под рубрикацией третьего уровня, также встречается скрытый текст). Благодаря выверке обнаружились большие залежи неполных ошибочных статей. По работе бота - все это легко поправимо. — Лиманцев (обс.) 15:21, 23 января 2020 (UTC)

Alyona Alyona. Официальная страница в Инстаграмме

Добрый день. Подскажите, пожалуйста, почему бот удалил ссылку на официальный подтверждённый сайт певицы Alyona Alyona в Instagram? — Mike Somerset (обс.) 13:39, 31 января 2020 (UTC)

Название статьи не всегда подходит для шаблонов

Коллега, согласитесь, что неудачная правка бота. --НоуФрост❄❄ 19:31, 31 января 2020 (UTC)

  • Не соглашусь. Для оформления ссылки на официальный сайт у нас есть шаблон {{Официальный сайт}} и ВД. Есть два варианта: 1) указать через параметр шаблона 2) исправить/дополнить свойство P856. Вы какой предпочитаете? Bsivko (обс.) 00:01, 1 февраля 2020 (UTC)
    • Для оформления ссылки на официальный сайт у нас есть масса вариантов и нигде не регламентировано, что это обязательно должен быть какой-либо шаблон. Некорректность правки бота заключается в том, что для читателя рождена неудобоваримая фраза вместо совершенно корректной. Исключите пожалуйста подобные правки бота, поскольку они не регламентируются никаким правилом и ухудшают качество статьи. --НоуФрост❄❄ 11:49, 1 февраля 2020 (UTC)
      • У шаблона есть параметры, где все это можно указать. Bsivko (обс.) 15:37, 1 февраля 2020 (UTC)
        • Слушайте. Вероятно вы меня не слышите. В статье была ссылка и оформлена она была надлежащим шаблоном. И выглядело это гораздо лучше, чем текущее оформление. Поэтому такие ботоправки и ручные добавления не надо совершать, пожалуйста. --НоуФрост❄❄ 15:43, 1 февраля 2020 (UTC)
          • Могу согласиться только с тем, что у списка не может быть официального сайта, в ВД официальный сайт другого понятия. Поэтому это свойство я убрал из ВД. Bsivko (обс.) 16:54, 1 февраля 2020 (UTC)
  • Это вообще безобразие — ведь вы правите уникальное название (я про «Новая газета (New gazette)»). И их много — Новая газета (значения) --НоуФрост❄❄ 19:44, 31 января 2020 (UTC)
    • Что такое New gazette? Ссылка оформляется на одном языке, а не на сборище разных, никем не обозначенных языков. В вашем списке газет Нью-Йорка не наблюдается. Кроме того, начать нужно с того, что должны быть найдены ссылки на другие газеты. Bsivko (обс.) 23:50, 31 января 2020 (UTC)
      • «Новая газета» («New gazette») — это издание с двумя параллельными названиями, выходившее в Нью-Йорке, в 1980—1983 годах. Оно имеет эти два названия, которые проставлены в шаблоне и не имеет никакого отношения к «Новая газета» на которую бот поставил викификацию. Источник был указан совершенно корректно, бот мистифицировал источник. Исключите пожалуйста подобные правки бота, поскольку они не регламентируются никакими правилами и ухудшают качество статьи. --НоуФрост❄❄ 11:49, 1 февраля 2020 (UTC)
        • Спасибо за разъяснение и информацию. Во-первых, нужно сделать вот так. Далее, такое викифицируется вот так. Бота я переконфигурировал, но забыл перезапустить, это правда. Что касается названия, то содержание параметра используется для названия, а не чего-либо другого. У меня большие сомнения, что на первой странице газеты она именуется со скобками (по вашей ссылке название одно на одном языке, второе на другом). Поэтому если ссылка оформляется на русском языке, то нужно русскоязычное. Если на анголоязычный выпуск с англоязычным названием, то лучше «New gazette». Bsivko (обс.) 15:37, 1 февраля 2020 (UTC)
          • А мне оба нравятся. Она именовалась и на русском и на английском. --НоуФрост❄❄ 16:30, 1 февраля 2020 (UTC)
            • Интересно как. Скобок там кстати не видно, и названий больше, чем два. Bsivko (обс.) 16:54, 1 февраля 2020 (UTC)
              • Мне плохо понятно, где вы прочитали, что скобки отменили в русском языке для обозначений альтернативных названий. Что касается транслитерации, то я решил её не приводить и я в этом ни разу не отклонился от источника — моё право. Я не поставил там ссылку на другое издание, как вы и не назвал газету «только по русски» во избежание введения в заблуждение. --НоуФрост❄❄ 22:21, 1 февраля 2020 (UTC)
                • Значение параметра — название газеты. Газета называется либо «Новая газета», либо «New gazette». Она не называется «Новая газета (New gazette)». Для идентификации источников требуется точное значение всех параметров (название, место, время, номер и т.д.). Bsivko (обс.) 22:41, 1 февраля 2020 (UTC)
                  • Коллега, я тоже лет 30 назад был программистом. Да, в языке программирования параметр должен называться жёстко. Но шаблон — не язык программирования. Читатели — не процессор. Моё дело, как редактора — донести до читателя то, что надо по смыслу статьи. Я успешно справляюсь с этой задачей. Когда мне начинают мешать боты и их программисты — я возражаю. Дело ботов и их программистов услышать эти возражения, сравнить их с правилами. После того, как программист в правилах не найдёт свои мысли — он должен выкинуть их (мысли свои) на помойку. Если было вам непонятно, то я конкретизирую. Ваше утверждение — «Газета называется либо „Новая газета“, либо „New gazette“. Она не называется „Новая газета (New gazette)“». — не основано ни на источниках, ни на правилах Википедии. Это ваша придумка. --НоуФрост❄❄ 22:49, 1 февраля 2020 (UTC)
                    • Где вы видели, чтобы в уважаемом журнале ссылки оформлялись со скобками на непонятные языки и транслитерации? Рисовать скобки и придумывать собственный грамматический ряд это ваши придумки. Читатель не должен догадываться о том, что редактор чего-то выдумал и нарисовал то, что ему в голову пришло. Название указывается как есть, без каких-либо придумок. Делаю откат как участник, а не как бот. Bsivko (обс.) 00:24, 2 февраля 2020 (UTC)

Внешние ссылки, UTM-метки

Во многих случаях работа бота полезна, но вот правку на странице Лео Мура считаю вредной, — проверьте, без расширений ссылки ведут на общую страницу каталога и по существу становятся бесполезными. Один раз правку откатил, но бот повторяет её снова. - Gerarus (обс.) 18:07, 2 февраля 2020 (UTC)

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya