nx.adjacency_matrix计算邻接矩阵与真实结果不一致:解决办法记录
- 问题描述
-
- 原来的代码
- 实际运行输出
- 理论结果
- 调试过程
- 解决方案
-
- 修改后的代码
- 修改代码后的运行结果
- 函数说明
问题描述 我自己根据edgelist计算的邻接矩阵,与调用networkx.adjacency_matrix(g)返回的结果不一样,经过调试发现了问题原因以及解决办法,记录如下。
原来的代码
edgelist = [
(0, 1),
(1, 3),
(2, 4),
(1, 5),
(1, 3),
(5, 5),
(1, 3)
]
"""由于nx.MultiGraph()可累计多条重复边作为权重,所以(1,3)出现3次权重是3"""
g = nx.MultiGraph()# 无向多边图
g.add_edges_from(edgelist)
adj = sp.lil_matrix(nx.adjacency_matrix(g))
print(adj.todense())
实际运行输出
[[0 1 0 0 0 0]
[1 0 3 0 0 1]
[0 3 0 0 0 0]
[0 0 0 0 1 0]
[0 0 0 1 0 0]
[0 1 0 0 0 1]]
理论结果
[[0 1 0 0 0 0]
[1 0 0 3 0 1]
[0 0 0 0 1 0]
[0 3 0 0 0 0]
[0 0 1 0 0 0]
[0 1 0 0 0 1]]
节点id从0开始。对于边(1,3),矩阵的第二行第四列应当为权重3,可以看到实际运行输出结果中,3却出现在了第二行第三列!
调试过程 查看了networkx.adjacency_matrix()的源代码,其中有一条说明如下:
def adjacency_matrix(G, nodelist=None, weight='weight'):
"""Return adjacency matrix of G.Parameters
----------
G : graph
A NetworkX graphnodelist : list, optional
The rows and columns are ordered according to the nodes in nodelist.
If nodelist is None, then the ordering is produced by G.nodes().weight : string or None, optional (default='weight')
The edge data key used to provide each value in the matrix.
If None, then each edge has weight 1.
...
...
"""
return nx.to_scipy_sparse_matrix(G, nodelist=nodelist, weight=weight)
第二个参数的说明需要格外注意!对于nodelist这个参数,说明是这样的:邻接矩阵的行和列的排序按照nodelist中节点顺序来!如果不传这个参数,默认是按照传进来的图G调用G.nodes()时返回的节点的顺序!
所以我查看了我传进去的图g的节点默认顺序是什么样的:
edgelist = [
(0, 1),
(1, 3),
(2, 4),
(1, 5),
(1, 3),
(5, 5),
(1, 3)
]
"""由于nx.MultiGraph()可累计多条重复边作为权重,所以(1,3)出现3次权重是3"""
g = nx.MultiGraph()# 无向多边图
g.add_edges_from(edgelist)
print(g.nodes())
adj = sp.lil_matrix(nx.adjacency_matrix(g))
print(adj.todense())
运行结果居然:
[0, 1, 3, 2, 4, 5]
[[0 1 0 0 0 0]
[1 0 3 0 0 1]
[0 3 0 0 0 0]
[0 0 0 0 1 0]
[0 0 0 1 0 0]
[0 1 0 0 0 1]]
图g的节点列表居然不是按照从小到大的顺序排列,id为3的节点居然是第三而不是第四位序,这就是为什么边(1,3)的权重会写在矩阵的第三列…因为矩阵第三列对应节点3!
那…为什么图g的节点列表不是排好序的,为什么是[0, 1, 3, 2, 4, 5]这个顺序?
因为:加新边sdd_edges的时候会自动加新节点!!!
边(0,1)加进去的时候,节点列表是[0,1];加边(1, 3)的时候,节点列表[0,1,3];…。所以节点默认列表的顺序,跟你加新边时候哪个节点先出现有关系。
解决方案 那么在添加新边之前,先把节点按id从小到大顺序排好同意添加,就可以了。
具体就是:在g.add_edges_from(edgelist)操作之前,先把edgelist中的节点抽取出来按顺序排好,用操作g.add_nodes_from()把节点统一添加进图g中。修改后的代码如下:
修改后的代码
edgelist = [
(0, 1),
(1, 3),
(2, 4),
(1, 5),
(1, 3),
(5, 5),
(1, 3)
]
"""由于nx.MultiGraph()可累计多条重复边作为权重,所以(1,3)出现3次权重是3"""
g = nx.MultiGraph()# 无向多边图""" 节点id按照顺序排!!否则生成的邻接矩阵不一样 """
nodeset = sorted(set(itertools.chain(*edgelist)))
g.add_nodes_from(nodeset)g.add_edges_from(edgelist)
print(g.nodes())
adj = sp.lil_matrix(nx.adjacency_matrix(g))
print(adj.todense())
修改代码后的运行结果
[0, 1, 2, 3, 4, 5]
[[0 1 0 0 0 0]
[1 0 0 3 0 1]
[0 0 0 0 1 0]
[0 3 0 0 0 0]
[0 0 1 0 0 0]
[0 1 0 0 0 1]]
函数说明 nodeset = sorted(set(itertools.chain(*edgelist)))这行的功能,是把edgelist中的元素展开,去重,按顺序排序。分开演示就是:
edgelist = [
(0, 1),
(1, 3),
(2, 4),
(1, 5),
(1, 3),
(5, 5),
(1, 3)
]
""" 把edgelist中的每个(a,b)元素打平成a,b """
nodes = list(itertools.chain(*edgelist))
print(nodes)
# 输出:
# [0, 1, 1, 3, 2, 4, 1, 5, 1, 3, 5, 5, 1, 3]""" 利用set元素唯一的性质,将重复元素去重 a,a => a """
nodeset = set(nodes)
print(nodeset)
# 输出:
# {0, 1, 2, 3, 4, 5}""" set中的元素是无序、非空、唯一的,所以对set再sorted一下,确保顺序是对的 """
nodeset = sorted(nodeset)
print(nodeset)
# 输出:
# [0, 1, 2, 3, 4, 5]
推荐阅读
- 用Python构建一个简单的推荐系统
- Python降低XGBoost 过度拟合的多种方法
- 如何在Ubuntu 18.04中使用Keras,Tensorflow和Python 3实现图像搜索引擎
- LeetCode|LeetCode 热题 HOT 100 第四十九天 152. 乘积最大子数组 中等题 用python3求解
- flask|Python flask2.0与flask_script与出现不兼容问题解决及 KeyError: ‘migrate‘ 错误解决办法,数据库迁移migrate
- 如何在Windows中使用Python重新启动本地或网络计算机
- 使用appJar(基于Tkinter的UI)使用Python创建非常简单的图形用户界面
- 如何在Windows中使用pyinstaller从Python脚本创建可执行文件(.exe)
- 大数据|基于数字孪生的智能车间管控