Neo4j是一款開源圖數(shù)據(jù)庫,Py2neo提供了使用Python語言訪問Neo4j的接口。本文介紹了使用Py2neo的NodeMatcher和RelationshipMatcher查詢圖中的節(jié)點(diǎn)和關(guān)系,以及通過執(zhí)行Cypher語句的查詢方式。本文使用的Py2neo是2021.1之后的版本,手冊(cè)請(qǐng)戳這里:
The Py2neo Handbook
一、連接Neo4j數(shù)據(jù)庫
本文中會(huì)用到多種數(shù)據(jù)類型,在此一并引用
import numpy as np
import pandas as pd
from py2neo import Node,Relationship,Graph,Path,Subgraph
from py2neo import NodeMatcher,RelationshipMatcher
配置Neo4j數(shù)據(jù)庫的訪問地址、用戶名和密碼:
neo4j_url = '訪問地址'
user = '用戶名'
pwd = '密碼'
在此時(shí)間段之前訪問數(shù)據(jù)庫的方式為:
graph = Graph(neo4j_url, username=user, password=pwd)
在此時(shí)間段之后的版本訪問數(shù)據(jù)庫的方式為(就是這么不兼容):
graph = Graph(neo4j_url, auth=(user, pwd))
以下圖為例:
- 圖中包含一些Person節(jié)點(diǎn),每個(gè)Person節(jié)點(diǎn)有name、age、work屬性;
- 其中“趙趙”節(jié)點(diǎn)是多l(xiāng)abel的節(jié)點(diǎn),除了有Person標(biāo)簽,它還有Teacher標(biāo)簽;
- Person和Person節(jié)點(diǎn)之間有同事、鄰居、學(xué)生、老師等關(guān)系;
- 圖中還有一些Location節(jié)點(diǎn),它們之間有包含關(guān)系;
- Person節(jié)點(diǎn)和Location節(jié)點(diǎn)之間有“到訪”關(guān)系,“到訪”關(guān)系具有date和stay_hours兩個(gè)屬性。
二、 通過graph.schema查詢圖中節(jié)點(diǎn)和關(guān)系有哪些類型
查看節(jié)點(diǎn)的類型用graph.schema.node_labels
,查看關(guān)系的類型用graph.schema.relationship_types
,它們的返回值類型都是frozenset,是不能增刪元素的集合。
>>>graph.schema.node_labels
frozenset({'Location', 'Person', 'Teacher'})
>>>graph.schema.relationship_types
frozenset({'到訪', '包含', '同事', '學(xué)生', '老師', '鄰居'})
三、使用NodeMatcher查詢節(jié)點(diǎn)
首先創(chuàng)建一個(gè)NodeMatcher對(duì)象,用match
來指明要匹配哪種label的節(jié)點(diǎn),用where
來表示篩選條件(有兩種方法)。需要注意的是,匹配成功返回的是NodeMatcher的對(duì)象,要轉(zhuǎn)化成Node對(duì)象,可以用first取出符合條件的第一個(gè)節(jié)點(diǎn),或者轉(zhuǎn)化成節(jié)點(diǎn)的list。
>>>node_matcher = NodeMatcher(graph)
>>>node = node_matcher.match("Person").where(age=20).first()
>>>node
Node('Person', age=20, name='李李', work='腳本之家')
>>>nodes = list(node_matcher.match("Person").where(age=35))
>>>nodes
[Node('Person', age=35, name='王王', work='腳本之家')]
where條件有兩種寫法,一種是把要匹配的屬性和值寫成key=value的形式,例如上面的where(age=20),這種寫法只能按照值是否完全一致來匹配,不能按照值的大小來篩選,如果寫成下面這樣是會(huì)報(bào)錯(cuò)的:
node = node_matcher.match("Person").where(age>20).first() # 錯(cuò)誤
想要按照值的大小篩選或者做一些字符串的模糊匹配,可以把條件表達(dá)式寫成一個(gè)字符串,整體放在where語句中,在這個(gè)字符串中,可以用 _ 來代指匹配到的節(jié)點(diǎn)。下面兩個(gè)例子,第一個(gè)是匹配work屬性為“月亮XX”模式的Person節(jié)點(diǎn),另一個(gè)是匹配age大于20的Person節(jié)點(diǎn)。
>>>node = node_matcher.match("Person").where("_.work =~ '月亮.*'").first()
>>>node
Node('Person', 'Teacher', age=45, name='趙趙', work='月亮中學(xué)')
>>>nodes = list(node_matcher.match("Person").where("_.age > 20"))
>>>nodes
[Node('Person', age=35, name='王王', work='腳本之家'),
Node('Person', age=30, name='張張', work='腳本之家'),
Node('Person', 'Teacher', age=45, name='趙趙', work='月亮中學(xué)')]
將NodeMatcher返回的結(jié)果轉(zhuǎn)化為Node數(shù)據(jù)類型或者Node的list之后,訪問其中的屬性也就十分簡(jiǎn)單了,如上面最后一例的結(jié)果,訪問其中第一個(gè)節(jié)點(diǎn)的name屬性:
四、 使用RelationshipMatcher查詢關(guān)系
RelationshipMatcher的match方法有三個(gè)及以上參數(shù):
- 第一個(gè)參數(shù)是節(jié)點(diǎn)的序列或者set,可以為None,為None表示任意節(jié)點(diǎn)均可;
- 第二個(gè)參數(shù)是關(guān)系的類型,可以為None,為None表示任意類型的關(guān)系均可;
- 第三個(gè)參數(shù)開始是要匹配的屬性,寫成key=value的形式。
match方法的返回值是RelationshipMatcher類型,需要通過first轉(zhuǎn)化成Relationship數(shù)據(jù)結(jié)構(gòu),或者轉(zhuǎn)化為list。
舉例說明:
列1:比如想要查詢“李李”節(jié)點(diǎn)的所有關(guān)系。先查詢出節(jié)點(diǎn),再查詢節(jié)點(diǎn)的關(guān)系,r_type=None表示任意類型的關(guān)系均可。返回的關(guān)系包括到訪、同事。
>>>node1 = node_matcher.match("Person").where(name='李李').first()
>>>relationship = list(relationship_matcher.match([node1], r_type=None))
>>>relationship
[到訪(Node('Person', age=20, name='李李', work='腳本之家'), Node('Location', name='祿口機(jī)場(chǎng)'), date='2021/7/16', stay_hours=1),
同事(Node('Person', age=20, name='李李', work='腳本之家'), Node('Person', age=30, name='張張', work='腳本之家')),
同事(Node('Person', age=20, name='李李', work='腳本之家'), Node('Person', age=35, name='王王', work='腳本之家'))]
例2:查詢“李李”和“張張”的關(guān)系,兩個(gè)節(jié)點(diǎn)的順序表示了要匹配的關(guān)系的方向。所以在整個(gè)圖中“李李”和“張張”節(jié)點(diǎn)之間的同事關(guān)系是雙向的,但是查詢結(jié)果只給出了從“張張”節(jié)點(diǎn)到“李李”節(jié)點(diǎn)的一條關(guān)系。
>>>node1 = node_matcher.match("Person").where(name='李李').first()
>>>node2 = node_matcher.match("Person").where(name='張張').first()
>>>relationship = list(relationship_matcher.match((node2,node1), r_type=None))
>>>relationship
[同事(Node('Person', age=30, name='張張', work='腳本之家'), Node('Person', age=20, name='李李', work='腳本之家'))]
例3:詢圖中某一類關(guān)系,第一個(gè)參數(shù)為None,第二個(gè)參數(shù)r_type指定關(guān)系類型,這里查詢了圖中所有的同事關(guān)系。
>>>relationship = list(relationship_matcher.match(None, r_type='同事'))
>>>relationship
[同事(Node('Person', age=20, name='李李', work='腳本之家'), Node('Person', age=30, name='張張', work='腳本之家')),
同事(Node('Person', age=20, name='李李', work='腳本之家'), Node('Person', age=35, name='王王', work='腳本之家')),
同事(Node('Person', age=35, name='王王', work='腳本之家'), Node('Person', age=20, name='李李', work='腳本之家')),
同事(Node('Person', age=30, name='張張', work='腳本之家'), Node('Person', age=20, name='李李', work='腳本之家'))]
例4: 在查詢關(guān)系時(shí)按照屬性的值篩選,可以將該屬性寫為key=value的形式作為match方法的第三個(gè)參數(shù)。這里,查詢圖中的到訪關(guān)系,并且stay_hours屬性為1。
>>>relationship = list(relationship_matcher.match(None, r_type='到訪', stay_hours=1))
>>>relationship
[到訪(Node('Person', age=20, name='李李', work='腳本之家'), Node('Location', name='祿口機(jī)場(chǎng)'), date='2021/8/24', stay_hours=1)]
雖然Py2neo的手冊(cè)上沒有寫,但其實(shí)RelationshipMatcher也可以接上where方法,按照屬性的值篩選關(guān)系。上面這個(gè)例子也可以寫作下面這種形式,效果是一樣的。
relationship = list(relationship_matcher.match(None, r_type='到訪').where(stay_hours=1))
同樣,在where方法中也可以寫一個(gè)字符串表達(dá)式,實(shí)現(xiàn)按值大小來篩選關(guān)系。例如要篩選出所有到訪關(guān)系,且stay_hours>=1的關(guān)系時(shí),可以這樣寫:
>>>relationship = list(relationship_matcher.match(None, r_type='到訪').where("_.stay_hours>=1"))
>>>relationship
[到訪(Node('Person', age=20, name='李李', work='腳本之家'), Node('Location', name='祿口機(jī)場(chǎng)'), date='2021/8/24', stay_hours=1),
到訪(Node('Person', age=20, name='劉劉', work='地球電子商務(wù)公司'), Node('Location', name='祿口機(jī)場(chǎng)'), date='2021/8/24', stay_hours=4)]
如何訪問返回的結(jié)果中的各個(gè)屬性呢,Relationship其實(shí)是包含了一對(duì)起止節(jié)點(diǎn):start_node和end_node,包含了關(guān)系的類型,而關(guān)系的屬性是以字典形式存在的,可以用get方法來獲取屬性的值。
獲取關(guān)系的起止節(jié)點(diǎn):
>>>print(relationship[0].start_node['name'])
>>>print(relationship[0].end_node['name'])
李李
祿口機(jī)場(chǎng)
獲取關(guān)系的類型的文本字符串
>>>print(relationship[0])
>>>print(type(relationship[0]).__name__)
(李李)-[:到訪 {date: '2021/8/24', stay_hours: 1}]->(祿口機(jī)場(chǎng))
到訪
獲取關(guān)系中的屬性和值
>>>print(relationship[0].keys())
>>>print(relationship[0].values())
>>>print(relationship[0].get('date'))
dict_keys(['date', 'stay_hours'])
dict_values(['2021/8/24', 1])
2021/8/24
五、通過執(zhí)行Cypher語句查詢
NodeMatcher和RelationshipMatcher能夠表達(dá)的匹配條件相對(duì)簡(jiǎn)單,更加復(fù)雜的查詢還是需要用Cypher語句來表達(dá)。Py2neo本身支持執(zhí)行Cypher語句的執(zhí)行,可以將復(fù)雜的查詢寫成Cypher語句,通過graph.run方法查詢,返回的結(jié)果可以轉(zhuǎn)化為pandas.DataFrame或者pandas.Series對(duì)象,從而和其他數(shù)據(jù)分析工具無縫銜接。
例如:要查詢Person節(jié)點(diǎn),并滿足work屬性為“腳本之家”。Cypher語句中可以使用WHERE接條件表達(dá)式,使用AS將返回的屬性改名,返回多個(gè)屬性時(shí),用xxx AS x, yyy AS y。graph.run方法之后再接to_data_frame()
可以將返回的數(shù)據(jù)變成pandas的DataFrame
對(duì)象,并且用AS改過的屬性名即為DataFrame中的列名。
cypher_ = "MATCH (n:Person) \
WHERE n.work='腳本之家' \
RETURN n.name AS name, n.age AS age "
df = graph.run(cypher_).to_data_frame() # pd.DataFrame
例2:查詢一個(gè)已知節(jié)點(diǎn)和其他哪些節(jié)點(diǎn)有關(guān)系,有什么樣的關(guān)系。Cypher語言查詢關(guān)系時(shí)用 或者 > 表示方向,這里需要返回type(r),直接返回r的話結(jié)果里是空值。
>>>cypher_ = "MATCH (n:Person)-[r]->(m:Person) \
WHERE n.name='李李' \
RETURN type(r) AS type,m.name AS name"
>>>df = graph.run(cypher_).to_data_frame() # pd.DataFrame
例3:Cypher語言還可以查詢路徑,因?yàn)椴淮_定返回的路徑數(shù)量,所以最好先將結(jié)果轉(zhuǎn)化為pandas.Series,再遍歷訪問其中每條路徑的節(jié)點(diǎn)和關(guān)系。
這里查詢的是“趙趙”節(jié)點(diǎn)和“王王”節(jié)點(diǎn)之間的關(guān)系路徑,關(guān)系指定為同事或鄰居,關(guān)系不超過4層。
>>>cypher_ = "MATCH path=(m:Person)-[:同事|鄰居*1..4]->(n:Person) \
WHERE m.name='趙趙' AND n.name='王王' \
RETURN path"
>>>s = graph.run(cypher_).to_series()
>>>print(len(s))
>>>s[0]
Path(Node('Person', 'Teacher', age=45, name='趙趙', work='月亮中學(xué)'),
鄰居(Node('Person', 'Teacher', age=45, name='趙趙', work='月亮中學(xué)'),
Node('Person', age=30, name='張張', work='腳本之家')),
同事(Node('Person', age=30, name='張張', work='腳本之家'),
Node('Person', age=20, name='李李', work='腳本之家')),
同事(Node('Person', age=20, name='李李', work='腳本之家'),
Node('Person', age=35, name='王王', work='腳本之家')))
這里查詢到的關(guān)系路徑數(shù)量?jī)H有1條。從上圖的結(jié)果中也可以看出來,Path是一個(gè)比較復(fù)雜的結(jié)構(gòu),Path中的節(jié)點(diǎn)和關(guān)系分別用nodes和relationships表示,并且是按照路徑上節(jié)點(diǎn)和關(guān)系的順序分別存放的。這里給出一段示例代碼,對(duì)每一個(gè)路徑都做了直接打印path數(shù)據(jù)結(jié)構(gòu)和自己組織路徑文本。
for path in s:
# 直接打印path
print(path)
# 獲取路徑中的節(jié)點(diǎn)和關(guān)系
nodes = path.nodes
relationshis = path.relationships
# 自己組織路徑文本
path_text = ""
for n,r in zip(nodes, relationshis):
# 每次加入一個(gè)節(jié)點(diǎn)和一個(gè)關(guān)系的類型
path_text += "{} - {} - ".format(n['name'], type(r).__name__)
# 別忘了最后一個(gè)節(jié)點(diǎn)
path_text += nodes[-1]['name'] + '\n'
print(path_text)
運(yùn)行這段代碼得的結(jié)果如下所示,上面一行是直接打印路徑的結(jié)果,下面一行是自己組織文本得到的結(jié)果。
(趙趙)-[:鄰居 {}]->(張張)-[:同事 {}]->(李李)-[:同事 {}]->(王王)
趙趙 - 鄰居 - 張張 - 同事 - 李李 - 同事 - 王王
使用Py2neo查詢Neo4j中的節(jié)點(diǎn)、關(guān)系和路徑時(shí),條件簡(jiǎn)單的查詢可以通NodeMatcher和RelationshipMatcher來實(shí)現(xiàn)。而較為復(fù)雜的查詢,可以寫成Cypher語句來查詢,查詢結(jié)果可以轉(zhuǎn)化為pandas的DataFrame或者Series數(shù)據(jù)類型,與其他數(shù)據(jù)分析工具結(jié)合
以上就是python使用py2neo查詢Neo4j的節(jié)點(diǎn)、關(guān)系及路徑的詳細(xì)內(nèi)容,更多關(guān)于python py2neo的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
您可能感興趣的文章:- Python使用Py2neo創(chuàng)建Neo4j的節(jié)點(diǎn)與關(guān)系
- Python使用py2neo操作圖數(shù)據(jù)庫neo4j的方法詳解
- python利用文件讀寫編寫一個(gè)博客
- 手把手帶你用python爬取小姐姐私房照
- Python time.time()方法
- Python接口自動(dòng)化之接口依賴
- python中bottle使用實(shí)例代碼