Википедия:Список запрещённых сайтов

Короткая ссылка-перенаправление

Для защиты проекта от спамеров, массово размещающих ссылки на коммерческие и прочие неприемлемые сайты, а также для ограничения возможности ссылаться на сайты, признанные неавторитетными для статей Википедии, существует техническая возможность запрета добавления активных (кликабельных) ссылок на заданные сайты или разделы сайтов. Существует два различных технических механизма, реализующих эту функцию:

  1. Более старый, основанный на описании URL-а заблокированного сайта регулярными выражениями. Состоит из общего для всех проектов Фонда блэклиста, локального блэклиста Русской Википедии и локального «белого списка», имеющего приоритет перед двумя блэклистами выше.
  2. Более новый, пополняемый через страницу Служебная:BlockedExternalDomains, список заблокированных доменов хранится здесь. Не требует знания регулярных выражений, но позволяет заблокировать лишь весь домен целиком, а не только часть разделов сайта.

Правку, вносящую активную ссылку, подпадащую под любое определение в блэклистах и не подпадающую ни под одно определение в белом списке, невозможно внести, кроме случаев, когда её вносит бот (исключение ввели для возможности корректной архивации обсуждений, содержащих ссылки, внесённые в спам-лист уже после их размещения).

Сайты вносятся в и исключаются из локальных чёрных и белых списков по обсуждению на странице ВП:Изменение спам-листа, по результатам обсуждения на ВП:КОИ, а также решением администраторов в случае массового спама. Глобальный блэклист меняется по обсуждениям на meta:Talk:Spam blacklist.

Ведётся два журнала попыток внесения правок со спам-ссылками: Special:Log/spamblacklist для ссылок, заблокированных старым методом, Special:Log/abusefilterblockeddomainhit для ссылок, заблокированных новым методом.

Старый метод

Основы регулярных выражений

Регулярное выражение — паттерн (образец, шаблон) для синтаксического разбора текста.

Выражение может состоять из следующих частей (конкретные примеры и полная информация приведены по ссылкам, тут только небольшой обзор):

  • Обычные символы (все, кроме представленных в пункте ниже) — записываются как есть.
  • Спецсимволы ( [ ] \ ^ $ . | ? * + ( ) { } ) — используются в качестве служебных для обозначения классов символов, группировки и т. п. При необходимости использовать спецсимволы в качестве обычных они должны быть экранированы с помощью знака \. То есть . обрабатывается как любой символ, \. — как точка.
  • Управляющие символы — представляют собой замену для некоторых символов, вывод которых может быть затруднён (\t — знак табуляции, \r — возврат каретки и т. д.).
  • Символьные классы — набор символов в [ ], представляют собой подстановку любого из набора символов. Например, [abc] означает любой из символов a, b, c; [0-9] — цифра от 0 до 9. Существуют сокращенные записи для частоиспользуемых классов (\d — только цифры, \S — непробельные символы и т. п.)
  • Символы позиционирования внутри строки — определяют, в каком месте строки должно встречаться искомое выражение.
  • Квантификаторы — подставляются после символа, класса или группы и определяют, сколько раз может повторятся выражение. Например, * означает, что предыдущий символ, класс символов или группа может повторятся сколько угодно. То есть a* — любая последовательность букв a.

Конкретные примеры

Суть Выражение Разъяснение Пример срабатывания Пример несрабатывания
Обычная блокировка сайта \bexample\.com \b обозначает начало слова (слова разделяются пробелами, точками и пр.). Нужно для того, чтобы запись abc\.com не блокировала сайт dabc.com
Точка экранируется обратным слэшем \
http://example.com
http://www.example.com
http://www.example.com/sd
http://eexample.com
http://example.ru
http://examplee.com
Блокировка подсайта \bsite1\.example\.com См. выше http://site1.example.com
http://www.site1.example.com
http://site1.example.com/bla
http://example.com
http://site2.example.com
Блокировка сайта за исключением главной \bexample\.com\.*\/ / — спецсимвол, его нужно экранировать обратным слэшем \. Вставлен, так как главная — единственная страница сайта без слеша.
\.* вставлено для блокирования ссылки вида example.com.
http://www.example.com/sd
http://www.example.com/
http://www.example.com
Блокировка сайта в разных доменных зонах \bexample\.(?:com|ru|us) Выражение в скобках — группа, | означает выбор одного из выражений, ?: - служебный модификатор, который в простых случаях не влияет на результат разбора, но влияет на его производительность http://www.example.ru
http://www.example.com
http://example.us/qw
http://www.example.by
Блокировка определённых подстраниц сайта \bexample\.com\.*\/(?:mp3|video)
\.* вставлено для блокирования ссылки вида example.com./mp3
http://www.example.com/mp3
http://www.example.com/video
http://example.com/video/tag
http://www.example.com
http://www.example.com/mp2
Блокировка подсайтов \.example\.com Лидирующая \. будет отсекать подсайты (так как он начинается с точки), оставляя главный сайт незаблокированным. http://www.example.com
http://abc.example.com
http://example.com

Новый метод

Для добавления домена в спамлист на странице Служебная:BlockedExternalDomains достаточно ввести в соответствующие поля сам домен и комментарий, а затем нажать кнопку «Отправить». После этого домен будет добавлен на страницу MediaWiki:BlockedExternalDomains.json. Там же можно откорректировать имеющуюся информацию.

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya