Я просто пишу программу на C++, которая вычисляет коэффициент кластеризации [CC] (локальный и глобальный) неориентированного графа в формате dot. Моя проблема в том, что результат моей программы не соответствует выводу R (с библиотекой igraph):
Моя программа:
The cluster coefficient of "0" is: 0.257 (88/342)
The cluster coefficient of "1" is: 0.444 (40/90)
The cluster coefficient of "10" is: 1.000 (2/2)
The cluster coefficient of "2" is: 0.418 (46/110)
The cluster coefficient of "11" is: 1.000 (2/2)
The cluster coefficient of "12" is: 0.667 (8/12)
The cluster coefficient of "3" is: 0.346 (54/156)
The cluster coefficient of "5" is: 0.571 (24/42)
The cluster coefficient of "13" is: 1.000 (12/12)
The cluster coefficient of "4" is: 0.607 (34/56)
The cluster coefficient of "7" is: 0.679 (38/56)
The cluster coefficient of "14" is: 1.000 (6/6)
The cluster coefficient of "15" is: 0.833 (10/12)
The cluster coefficient of "16" is: 1.000 (6/6)
The cluster coefficient of "17" is: 0.733 (22/30)
The cluster coefficient of "9" is: 0.833 (10/12)
The cluster coefficient of "18" is: 0.714 (30/42)
The cluster coefficient of "19" is: 1.000 (6/6)
The cluster coefficient of "6" is: 1.000 (2/2)
The cluster coefficient of "8" is: 0.733 (22/30)
Где "" – это Узлы графа, а числа (n/m) – это "связи между вершинами в его окрестности" (n) и " количество возможных связей между ними" (m) соответственно (описание из Википедии ) И вывод из R:
0 0.2631579 x (+2 links)
1 0.4666667 x (+2 links)
2 0.4181818
3 0.3461538
4 0.6071429
5 0.6190476 x (+2 links)
6 1.0000000
7 0.6785714
8 0.6666667 x (-2 links)
9 0.8000000
10 1.0000000
11 1.0000000
12 0.6666667
13 1.0000000
14 1.0000000
15 0.8333333
16 1.0000000
17 0.7333333
18 0.7142857
19 1.0000000
Где первое число в каждой строке — это Node, второе — его локальная CC, а третье — моя аннотация, если она не соответствует моему выводу (с указанием числа ссылок (n) мне нужно добавить/удалить, чтобы соответствовать выходным данным R).
Вторая проблема заключается в том, что глобальный CC из R не соответствует моему определению или определению Википедии (если только я не понял формулу неправильно). Результат R для этого графика равен 0,458891, а мой — 0,742.
Поэтому я сделал это вручную: я вычислил CC для 8 и сопоставил результат своей программы. Итак, мой вопрос заключается в том, что «возможно ли, что в библиотеке igraph есть ошибка?» а если ответ "нет": "что мне не хватает?"
Графический файл такой:
graph {
1 -- 0;
10 -- 0;
10 -- 2;
11 -- 0;
11 -- 2;
12 -- 0;
12 -- 1;
12 -- 3;
12 -- 5;
13 -- 0;
13 -- 3;
13 -- 4;
13 -- 7;
14 -- 0;
14 -- 1;
14 -- 4;
15 -- 0;
15 -- 2;
15 -- 3;
16 -- 0;
16 -- 15;
16 -- 3;
17 -- 0;
17 -- 1;
17 -- 2;
17 -- 5;
17 -- 7;
17 -- 9;
18 -- 0;
18 -- 1;
18 -- 2;
18 -- 3;
18 -- 4;
18 -- 7;
19 -- 0;
19 -- 18;
19 -- 3;
2 -- 0;
2 -- 1;
3 -- 0;
3 -- 2;
4 -- 0;
4 -- 1;
4 -- 3;
5 -- 0;
5 -- 2;
5 -- 3;
6 -- 0;
6 -- 3;
7 -- 0;
7 -- 1;
7 -- 2;
7 -- 3;
7 -- 4;
8 -- 0;
8 -- 1;
8 -- 2;
8 -- 3;
8 -- 4;
8 -- 5;
9 -- 0;
9 -- 1;
9 -- 5;
}
Способ, которым я рассчитал CC с помощью R, заключается в загрузке графа (или создании нового, поскольку он не может читать точечные файлы) в переменную "f", для например, и выполнение transitivity(f) для глобального CC и transitivity(f, "local") для локального.
Большое спасибо за чтение и извините за мой плохой английский.