@leila.dickinson
GraphFrames - это библиотека для работы с графами на PySpark, основанная на Apache Spark. Следуя этим шагам, вы можете начать работу с GraphFrames в PySpark:
1 2 |
from pyspark.sql.functions import * from graphframes import * |
1 2 3 4 5 |
spark = SparkSession.builder.appName("graph-app").getOrCreate() # Чтение данных из CSV файла vertices = spark.read.csv("vertices.csv", header=True, inferSchema=True) edges = spark.read.csv("edges.csv", header=True, inferSchema=True) |
1
|
graph = GraphFrame(vertices, edges)
|
1 2 3 4 5 6 7 8 9 |
# Отображение вершин графа graph.vertices.show() # Отображение ребер графа graph.edges.show() # Поиск кратчайшего пути между двумя вершинами results = graph.shortestPaths(landmarks=["A", "B"]) results.show() |
Это только небольшой набор методов, которые можно использовать с GraphFrames. Больше информации можно найти в документации GraphFrames и PySpark.