Нужно добавить обработку usurped unfit которые есть в en:Template:Cite web. Их можно задавать в новом параметре url-status или существующем deadlink. При usurped unfit оригинальная ссылка не показывается. Это необходимо чтобы не направлять (защищать) читателей на рекламный/спам/поддельный/проданный/угнанный сайт (а также не кормить перехватчиков трафиком от переходов по ссылкам из более посещаемого сайта Википедии). Пример: WP:СОО special:diff/119228049 ; подходящее действие usurped unfit по гайду en:WP:Citing sources#Preventing and repairing dead links; но нет аналога в ruwiki и другие участники просто удаляют "мёртвую" ссылку special:diff/119232086. Сунприат20:52, 8 января 2022 (UTC)[ответить]
В en оставляется "Archived from", что соответствует ожиданиям пользователя как в изменяемом увиденном названии открытого сайта/url так и в скорости прогрузки из архива. Арх.ссылка может быть прямой, но url короткий webcitation.org/5yo0HaAk7 или материал бывает перепечатан (сохранён) на другом сайте (доступен или тоже нет, а в архиваторах нашлась перепечатка и оригинал совсем подменится полями перепечатки) - оригинальный url лучше организованно сохранять, чем создавать закомментированные url (могут пригодиться для поиска альтернативных архивов) в конце сносок. Ситуация удаления/замены сама по себе конфликтна и не описана в гайдах, вариант с параметром используется и есть в гайдах. Сунприат04:05, 9 января 2022 (UTC)[ответить]
А как быть со страницами, где информация меняется в зависимости от даты обращения? Это не usurped, но unfit, приделается сюда же? Например, ссылка в сноске при утверждении, что в 2019 году директором был Орлов, но в 2022 году там будет уже Соколова. Важно ещё, чтобы всякие боты версию архивной страницы на свой вкус не меняли. — 188.123.231.313:13, 9 января 2022 (UTC)[ответить]
Если по современной ссылке нет данных, на именно которые была отсылка для подтверждения, но они есть в старой архивной копии, тогда да - "When the original URL has been ... or is otherwise unsuitable" - современная ссылка не подходит для подтверждения, переход по ссылке будет заставлять пользователя искать несуществующее, мало смысла отправлять по ссылке на несуществующее подтверждение когда по двум ссылкам информация не один в один, а есть только в архиве. Сунприат17:12, 9 января 2022 (UTC)[ответить]
Если по оригинальной ссылке сейчас не тот контент, который нужен для подтверждения сведений Википедии, а архив отсутствует или непригоден для той же цели, то смысла в такой сноске нет — её нужно удалять, а сведения помечать шаблоном «Нет источника» с последующей заменой источника или удалением этих сведений. Поэтому скрытие оригинальной ссылки без указания ссылки на архив должно как минимум давать видимое в режиме редактирования предупреждение.— Yellow Horror (обс.) 16:11, 24 октября 2022 (UTC)[ответить]
dima_st_bk, здесь следует также учесть, что в En нет параметра deadlink, они используют url-status. Соответственно если внедрять url-status без переделки deadlink это будет страх и ужас. Потом никаких концов не найдёте, где ссылки дохлые, где сменившие содержимое, а где живые. Боты и люди постараются. Возможным решением будет слияние параметров и ликвидация deadlink из документации. При этом надо обязательно поставить замены в викификаторе, объёмы огромные. 185.16.137.13217:17, 24 октября 2022 (UTC)[ответить]
dima_st_bk, при этом надо сразу заменить deadlink/deadurl/dead-url на url-status и в других шаблонах-АИ, чтобы редакторы не путались, а скрипты могли универсально распознавать пометки: 70 шаблонов. И, повторюсь, добавить всё это в стандартный викификатор. Далее, я бы удалил из кода все dead-url, почти не используется, но усложняет. В статьях всего 6 тысяч включений, обновить ботом. 194.50.12.5600:18, 12 ноября 2022 (UTC)[ответить]
Предлагаю кроме https://ru.wikipedia.org/?diff=128011940 сделать простое решение: если указана архивная ссылка, есть deadlink=yes И url пуст - игнорировать url.То есть,
Я пока сходу вижу такую проблему — если кто-то поставит архив на условный webcitation и удалит оригинал, а потом условный webcitation умрёт, то оригинал ссылки для восстановления архива придётся искать в истории правок. -- dima_st_bk19:22, 21 января 2023 (UTC)[ответить]
Поддерживаю. Возникла такая же проблема с угнанными сайтами. Кроме того, имхо, для совместимости лучше как раз поступить идентично англовики; usurped/unfit. Sleeps-Darkly (обс.) 10:17, 16 мая 2023 (UTC)[ответить]
Обновил шаблон, пусть так побудет неделю. Если не выявится ошибок/возражений, то буду заменять везде и писать ответственным за ботов/скрипты. -- dima_st_bk18:12, 17 мая 2023 (UTC)[ответить]
Предварительный итог
Параметры live/dead/unfit поддерживаются уже 4 месяца, на форумах проблем не замечено. Примеры:
Почти везде добавил url-status (а также алиасы access-date/arhive-url/archive-date). Вижу, что @Iniquity обновляет citations из enwiki, там в таком случае тоже заедет url-status. Кажется, после переноса citations всё будет готово для замены в инструментах. -- dima_st_bk15:13, 26 ноября 2023 (UTC)[ответить]
Что за ерунда про то, что в параметре |first = «В конце должна стоять точка»? Точка должна стоять не в параметре, а шаблон сам должен добавлять её в своём выводе (при необходимости), как он делает для параметра |author =. Аналогичный шаблон в английском разделе успешно справляется с этой задачей, так почему бы не сделать по-нормальному и тут? — Mikhail Ryazanov (обс.) 16:24, 13 января 2022 (UTC)[ответить]
В связи с внедрением соглашения о датах нужна категория, отслеживающая неверное заполнение параметров date, access-date и archive-date. На мой взгляд для всех трёх хватит одной общей. 185.16.137.12914:40, 15 января 2022 (UTC)[ответить]
Шаблону нужен параметр «nodot», которым можно было бы убирать точку после заголовка, когда там уже есть знак препинания, необходимый по контексту заголовка.— Yellow Horror (обс.) 14:12, 11 февраля 2022 (UTC)[ответить]
Шаблон ответственнен за простановку ссылок на категорию без включения в неё статьи. Демо: [[:Категория:Википедия:Cite web (неверный код языка)| ?.]] → ?.
Данная ссылка ставится в случае, если существует шаблон ref-xxx, но не существует ххх в шаблоне ЯзыкПоКоду.
Яркий пример выше: #Языковые коды ru-RU, en-GB, en-US - эти коды работают, исправлять из нет надобности.
По сути это избыточная проверка, форматированный код этого места в шаблоне.
Предлагаю также рассмотреть необходимость раскрытия/переписывания шаблонов, которые используются в cite web: результаты тестов для {{lang}} и {{ref-ru}}, ref-und, {{ref-en}}, которые являются дважды обертками шаблона {{ref-info}}.
Также предлагаю дополнить свитч if lang-xxx = ru значением en - как и в других случаях, развертка {{ref-en}} до {{ref-info}} должна быть гораздо менее затратна, чем применение {{ref-en}} через ref-{{{lang}}}, так как английский - наиболее частый язык в источниках.
Не проблема, добавлю лишь, что лучше использовать модуль напрямую, то есть #invoke, а не через обертку шаблоном. Например, в случае навшаблонов, замена ш:navbox на invoke снижает размер включений примерно на треть. ~~~~ Jaguar K · 22:13, 9 мая 2022 (UTC)[ответить]
Коллега, я не могу понять, какую именно метрику вы меряете? Открыл одну из версий и в NewPP limit report все числа отличаются от приведённых в таблице. Моя логика такая: время мерять надо не так и в целом мерять не надо (экономия может не возникнуть на одном примере, но наверняка возникнет при нескольких вызовах с одной страницы), мерять надо Post‐expand include size. Медведь Никита (обс.) 08:26, 10 мая 2022 (UTC)[ответить]
На странице сверху шаблон cite web - его и меряю, с разным lang. Это и есть Post‐expand include size Измерения провожу на другой странице, где кроме шаблона ничего нет, через предпросмотр. upd: на странице черновика, возможно, играет роль, что тесты не в ОП. https://i.imgur.com/x6jBt5W.png - 2139 en ~~~~ Jaguar K · 15:52, 10 мая 2022 (UTC)[ответить]
Левый язык, напр, eng выдает ошибку луа. шаблон Humanize date, кстати, кривой - конструкция {{#time: j xg Y | 12 May 2014 }} → 12 мая 2014 рабочая, а шаблон нет. Стоит выяснить, для чего он (кроме задания год-месяц) нужен. p.s. {{#time: j xg Y | 12 May 275}} → 12 мая 0275 ~~~~ Jaguar K · 00:25, 14 мая 2022 (UTC)[ответить]
Про левый язык — спасибо, я не начинал пока что тестировать код в этом смысле, просто набросал канву, чтобы тестировать производительность сначала (не детально, но масштаб — не работает ли в 10 раз медленнее — и вроде выяснилось, что все в порядке). Пофиксил. Медведь Никита (обс.) 07:52, 14 мая 2022 (UTC)[ответить]
Да, шаблон Humanize date какой-то странный, есть ощущение, что его надо внимательно прочесть и переписать, но пока что я оставил у себя вызов его напрямую, чтобы не гоняться сразу за всеми зайцами. Медведь Никита (обс.) 07:55, 14 мая 2022 (UTC)[ответить]
@Medvednikita, планируете заливать вашу версию в шаблон? Например, правка на удивление бесполезна, хотя обычно снижает размер включений на треть. Можно, конечно, порезать шаблоны "дата", убрав викификацию, но, например, замена шаблона дата на упрощенный вариант его же [1] бесполезна (выигрыш всего 32к, а нужно порядка 300к).upd: я не все шаблоны раскрыл, так что ложный вызов, наверное. ~~~~ Jaguar K · 12:25, 20 июня 2022 (UTC)[ответить]
Кажется, обсуждаемый кейс с автонумерацией мало отношения все же имеет. Заливать планирую, но после сессии (я преподаю в вузе). Сначала нужно чуть переделать данные, дополнительно добавив из еще одного источника, потом сделаю в песочнице имеющихся модулей, потом буду делать тесты… В общем после сессии, там все-таки не на пару минут. Медведь Никита (обс.) 19:11, 20 июня 2022 (UTC)[ответить]
В Шаблон:Cite web/doc#Примеры приведены примеры. Все параметры в шаблонах примеров приведены в одинаковом виде, однако в результате мы видим варианты «(неопр.)», «(англ.).», «(неопр.).», «(неопр.).», «(неопр.).» — без точки либо с точкой после скобки. Во-первых, непонятна причина отсутствия/наличия точки, во-вторых, точка после скобки кажется лишней. Kalendar (обс.) 07:40, 12 мая 2022 (UTC)[ответить]
Если я всё правильно понял, то точка, которая вторая, наличествует всегда (строки 68-71), но между языком и этой точкой могут как присутствовать, так и отсутствовать format, deadlink (и его синонимы), website, pages, page, publisher, date — и вот только потом эта точка. Но в некоторых примерах всех этих параметров нет, тогда они и оказываются подряд. Возможно, изначально подразумевалось, что этой точкой заканчивается date, но она случайно попала наружу? Не знаю. Медведь Никита (обс.) 08:57, 12 мая 2022 (UTC)[ответить]
Помета ссылок, требующих регистрации и/или оплаты для просмотра источника
Предлагаю добавить параметр, которым можно было бы помечать такие ссылки. Визуально он может отображаться пиктограммой замка. В англоязычной версии шаблона это уже сделано. Кроме предупреждения читателя, что для осуществления ВП:ПРОВ по данному источнику требуются дополнительные действия (регистрация и/или оплата), параметр можно использовать как сигнал ботоархиватору ссылок, что данную ссылку бесполезно архивировать, потому что в архиве заведомо не будет необходимого для ВП:ПРОВ контента.— Yellow Horror (обс.) 09:47, 16 июня 2022 (UTC)[ответить]
Запрет на архивацию был бы полезен, постоянно вылезают эти мусорные архивы ютуба и прочего видео, а также интерактивных ГИС-систем. Если кто не знает, они нормально не архивируются сервисом web.archive.org, но бот упорно их лепит. 185.16.139.2812:14, 27 июля 2022 (UTC)[ответить]
Ютуб таки иногда успешно архивируется. Интерактивные страницы, разумеется, нет. Вообще, полноценной веб-энциклопедии (но не Википедии) нужен собственный сервис архивации веб-источников, на котором сохранялся бы заверенная системой копия содержимого веб-страницы as is в момент создания ссылки на источник.— Yellow Horror (обс.) 15:57, 24 октября 2022 (UTC)[ответить]
Для такой системы всё упирается в финансы, хранить копии миллионов страниц крайне накладно в плане объёма, особенно, если это видео или фото. Кроме того, пока что ни один архиватор не может сохранить все 100 % страниц в корректной форме. То есть проверять успешность всё равно приходится вручную. По-моему внедрить можно и здесь, достаточно чтобы бот сидел на потоке и проверял каждую правку на добавление ссылок, и сразу шлёпал архив того же дня. 194.50.15.8816:10, 24 ноября 2022 (UTC)[ответить]
HumanizeDate
Требует множества циклов внутри шаблона ради отображения дат вроде 2022-05
Предлагаю как-то так (правка): {{#iferror:{{#time:jxgY|{{{date|{{{datepublished|}}}}}} }} | оставшийся код с HumanizeDate и year/month}}
Это не поможет если в проблемную категорию статья попадает не из-за шаблона в тексте статьи, а из-за использования шаблона в других шаблонах. MFot (обс.) 08:30, 8 июля 2022 (UTC)[ответить]
Я создал копию этого шаблона, которая делает то, что нужно - то есть, в нужном случае помещает страницу в категорию Категория:Википедия:Cite web (не указан язык) безотносительно того, в каком пространстве статей эта страница находится. С точки зрения вики-кода шаблона это означает замену кода | <span class="hidden-ref" style="display:none">'''{{ref-und}}'''</span>{{#ifeq:1|{{#invoke:String|replace|{{{title|}}}|[0-9А-яЁё«»:;,…!? \(\)\.—№\/\&\#+-]+|1|1|false}}||{{#if:{{NAMESPACE}}||[[Категория:Википедия:Cite web (не указан язык)]]}}}} на следующий: | <span class="hidden-ref" style="display:none">'''{{ref-und}}'''</span>[[Категория:Википедия:Cite web (не указан язык)]]. MFot (обс.) 07:47, 12 июля 2022 (UTC)[ответить]
Против правки в таком виде, смотрите описание категории. Примеры: Обсуждение шаблона:Книга => 1 Обсуждение шаблона:Cite Web => 1Cite WebДля вашей задачи достаточно убрать проверку пространства имен:
<span class="hidden-ref" style="display:none">'''{{ref-und}}'''</span>{{#ifeq:1|{{#invoke:String|replace|{{{title|}}}|[0-9А-яЁё«»:;,…!? \(\)\.—№\/\&\#+-]+|1|1|false}}||[[Категория:Википедия:Cite web (не указан язык)]]}}
Поставил отклонение: методом удаления текста можно искать и в ОП, в предварительном просмотре. Чтобы находить проблему оптимально иное решение, в частности подсветка конкретной ссылки. 185.16.139.2812:09, 27 июля 2022 (UTC)[ответить]
А, сломали значит. Ещё в прошлом году прекрасно работало. В любом случае предложение поддержки не получило и не решает проблему. С тем же успехом есть ctrl+f = lang. 185.16.139.2812:27, 27 июля 2022 (UTC)[ответить]
Дополнение: также полезно будет разделить мёртвые и пока ещё живые ссылки по параметру deadlink (yes и no). В первом случае всегда нужна замена, во втором, участнику достаточно проверить работоспособность ссылки и удалить битый архив в случае жизни источника. Yellow Horror, знаю вас беспокоит данная тема, отдаю на контроль. 185.16.139.2800:44, 28 июля 2022 (UTC)[ответить]
В последнее время неработающие ссылки на webcitation.org массово расставлял InternetArchiveBot. Я дважды жаловался на такое поведение на странице обсуждения на Мете. В первый раз мне ответили, что ожидают возможного восстановления работы сайта, во второй раз, что «проблема обсуждается». До чего они там дообсуждались я не знаю, и прежде чем заниматься удалением ссылок на нерабочие архивы хотелось бы убедиться, что это не очередной фронт войны с ветряными мельницами. Заниматься заменой ссылок на умерший архив вручную я тоже не нанимался.— Yellow Horror (обс.) 10:35, 28 июля 2022 (UTC)[ответить]
Yellow Horror, описанная проблема решается очевидным способом: поднять тему здесь на форуме, пригласить владельца. Нет реакции — выключить бота. Дальше сам засуетится, там интересы целого вебархива на кону. Никакой технической сложности не проставлять webcitation конкретно в Рувике для бота нет. 185.16.139.2811:10, 28 июля 2022 (UTC)[ответить]
Если включить теорию заговора, то webcitation, как единственный другой архиватор, проставляется для видимости конкуренции и отсутствия аффилированности. Поэтому добровольно его не уберут, как бы плохо не работал сайт. В подтверждение сказанного бот продолжает удалять archive.is, который умеет делать снимки и владеет множеством зеркал, спасая пользователей от блокировок в разных странах. То есть реальный конкурент уничтожается, а фиктивный насаждается. Архивы иных контор бот также не ставит. 185.16.139.2811:15, 28 июля 2022 (UTC)[ответить]
Я давно уже убедился, что участники Википедии, обладающие более обширными ресурсами, чем рядовой редактор (ботоводы, инженеры по шаблонам, координаторы различных сообществ редакторов и т.п.) делают некоторые вещи просто потому, что могут, возводя принцип ВП:ПС в абсолют. Им без разницы, как это отражается на других редакторах, а тем более — на читателях Википедии. Убедить их остановиться (и подумать) практически невозможно, а уж включить задний ход — это вообще из области ненаучной фантастики. Так что я по большей части предпочитаю не вступать в конфронтацию с очередным паровым катком, а убраться с выбранной им дороги.— Yellow Horror (обс.) 21:20, 28 июля 2022 (UTC)[ответить]
Проблема до сих пор нигде и никем не решается. Бот стал их заменять, но хорошо если найдёт хотя бы половину. На практике многое умерло окончательно и бот такие ссылки не убирает, а учёта нет и рядовые редакторы не знают. Напомню, что в Рувике более чем 91 650 статей с дохлыми архивами, что ставит под сомнение желание сообщества соблюдать ВП:ПРОВ. Чем раньше начнётся системная работа, тем лучше. Код шаблона дополнить две минуты, не понимаю, в чём сложность. 194.50.12.23719:38, 11 октября 2022 (UTC)[ответить]
Вообще-то сертификат вроде действительный и очень свежий, но вероятно он выписан для сайта webcitation.org, и браузеры считают его для www.webcitation.org недействительным. Админы сайта напортачили. Другое дело что с сертификатами чем дальше, тем больше будет проблем, вон сейчас и сбербанк из за них испытывает сложности. Хотя даже с исключением безопасности webcitation действительно DB Connection failed сейчас, но даже до этого webcitation запоминал сайты в неправильной кодировке с крюказябрами. Заменять ботом вероятно не всегда можно, а категория сама по себе вопрос не решит, ну соберёте Вы 100 тысяч страниц в такую категорию и руками её вычищать никто не будет, а менять широко использующийся шаблон ради глюка, который возможно починят в будущем, вероятно никто не желает. — Туча21:19, 11 октября 2022 (UTC)[ответить]
Дело не только в сертификате. Весь текущий год сайт выдаёт «DB Connection failed». Это конец. Категория позволит редакторам а) видеть проблему, щепетильные участники обычно всегда смотрят, куда засыпалась их статья и б) создавать запросы к petscan по тематикам, это пригодится проектам. Кроме того, мы реально не знаем, сколько из них deadlink=yes, а сколько deadlink=no. Масштаба проблемы не видно: первые требуют немедленной замены, вторые — нет (например, по ВО надо заменять около тысячи ссылок, а всего webcitation там 5 тысяч). 194.50.12.23722:16, 11 октября 2022 (UTC)[ответить]
AlphaRho, параметр publisher не должен содержать доменных имён или URL, см. документацию. Сам домен без протокола вписывается в параметр website. Пример: |website = google.ru. 194.50.15.8815:53, 24 ноября 2022 (UTC)[ответить]
Удаление скрытых языков
Предлагаю удалить скрытые языки (ref-ru и ref-und) из шаблона: они сильно увеличивают размер включений (после удаления у Россия появляется 5% запас по размеру включений), они захламляют код, они используются 7 участниками (поиск по наличию .hidden-ref в персональных стилях), их можно реализовать через персональные стили чем-то вроде .citation span[lang=und]::after { content: " (неопр.)"; font-weight: bold; font-size: 85%; color: #72777d; }. Возражения? Обсуждение длится неделю. -- dima_st_bk16:06, 24 ноября 2022 (UTC)[ответить]
Речь не о ложном языке, а об отсутствующем и русском. <span class="hidden-ref" style="display:none;">{{ref-und}}</span> и <span class="hidden-ref" style="display:none;">{{ref-ru}}</span>. Какие редакторы это увидят? Семь участников у которых есть hidden-ref: display? Я выше привёл пример, как можно вывести через стили почти такую же метку. -- dima_st_bk19:38, 24 ноября 2022 (UTC)[ответить]
У тебя есть права это исправить. Пометка об отсутствии указания языка быть должна, и по мне её надо показывать всем. Вымарывать её совсем — шаг в обратном направлении. Для сокращения есть и другие неудачные решения. 194.50.15.8821:27, 24 ноября 2022 (UTC)[ответить]
Кроме того, удаление und никак не увеличит запас размера включений по банальной причине: вместо und туда внесут настоящие коды и размер окажется тот же самый. Смысл трогать ради кратковременного эффекта? 194.50.15.8821:37, 24 ноября 2022 (UTC)[ответить]
Эффект будет кратковременный и потому бессмысленный — на место und поставят код языка и нагрузка вернётся к прежнему состоянию. А обёртку скрытия надо снять. 194.50.15.8807:39, 25 ноября 2022 (UTC)[ответить]
Мне кажется, что в ноябрьских обновлениях шаблона что-то сломалось. В статье Skullgirls есть сноска 114:
{{cite web|url=http://www.1up.com/features/best-of-e3?pager.offset=1|date=2011-06-10|accessdate=2015-11-22|publisher=[[1UP.com|1UP]]|title=1UP's Best Games of E3 2011|lang=en|archiveurl=https://web.archive.org/web/20110722034822/http://www.1up.com/features/best-of-e3?pager.offset=1|archivedate=2011-07-22|deadlink=404}}
. И сейчас она рендерится как
[%ССЫЛКА_НА_WEB.ARCHIVE.ORG% 1UP's Best Games of E3 2011] (англ.). 1UP (10 июня 2011). Дата обращения: 22 ноября 2015. [%ССЫЛКА_НА_WEB.ARCHIVE.ORG% Архивировано] 22 июля 2011 года.
Мне безразлично как будет оформлено что ссылка больше недоступна (или как ранее через серый текст в скобках у оригинала, или как в других сносках через приписку "архивировано из оригинала" тогда как главной ссылкой становится архивная), но дублироваться ссылки явно не должны. xplt (обс.) 07:54, 17 декабря 2022 (UTC)[ответить]
Возможно, я не очень хорошо выразился. Спецификаторами в квадратных скобках из сообщения выше я попытался показать куда ведет ссылка. Сейчас обе ссылки (вместо только одной) ведут на Web.Archive. xplt (обс.) 12:37, 17 декабря 2022 (UTC)[ответить]
dima_st_bk, кроме того, субъективно много ложнопомеченных битыми ссылок. То есть живые ссылки сейчас подменяются дохлыми. Эффективное решение — добавить зачистку ссылок на webcitation в викификатор, как это сделали в скрипте ВО. Через год это сведёт проблему на нет. 194.50.12.12112:12, 25 декабря 2022 (UTC)[ответить]
Пару недель назад я изменил логику отображения ссылок, сделав её как в енвики. Главной стараемся показать живую ссылку - если основная живая, то её (deadlink=no/(пусто)), если она мертва, то ссылку на архив. -- dima_st_bk02:22, 30 декабря 2022 (UTC)[ответить]