Цепочки изолированных кластеров (сильно связных компонент) разных размеров будем склеивать, используя символ "_".
Размер кластера будем указывать явно, числом. Например, цепочка «_1_1» — это такие статьи, на которые есть ссылки только из статей-сирот (Кластер размера 1 ссылается на кластер размера 1).
О структуре кластеров пока не можем и мечтать. Научная классификация топологических типов кластеров разных размеров — открытый вопрос. Начало цепочки всегда обозначает разделитель "_".
цепь «_1» — это статьи-сироты, или сирота0 (статьи, на которые ссылаются только статьи-сироты, входят в цепочку «_1_1»).
цепь «_2» — это всегда кольцо. Единственная возможная топология.
цепь «_3» — существует ровно пять типов топологий ссылок, от простого однонаправленного кольца, до полного ориентированного графа, который в данном случае совпадает с двунаправленным кольцом.
цепь «_4» — 83 различные топологии[1], только для минимальных сильносвязных компонент 15 топологических типов[2]. Далее виды узоров из ссылок растут несметно (классификация минимальных сильносвязных компонент завершена для кластеров размером не более 12[2]).
Полная развёртка графа ссылок технически возможна, но для практического применения работает слишком медленно. Главная компонента связности выявлена; анализ показал, что, за исключением учтённых в рамках проекта статей, все статьи русского раздела входят в единый связанный кластер.
Анализ применяется для кластеров размером не более 20. Периодически проводится проверка наличия кластеров произвольно большого размера, обычно не дающая результатов.
Ссылки
↑Последовательность A035512 в OEIS // Number of unlabeled strongly connected digraphs with n nodes.
↑ 12Последовательность A130756 в OEIS // Number of minimally strongly connected digraphs on n vertices, up to isomorphism.