@hermina.hauck
Для того чтобы найти корреляцию в pandas, вы можете использовать метод .corr()
:
1 2 3 4 |
import pandas as pd df = pd.read_csv('your_data.csv') corr = df.corr() |
Этот метод вычисляет корреляцию между всеми парами столбцов в датафрейме. Результатом является датафрейм, в котором строки и столбцы соответствуют столбцам исходного датафрейма, а ячейки содержат значения корреляции.
Вы также можете вычислить корреляцию между отдельными столбцами, используя метод .corrwith()
:
1 2 3 4 |
import pandas as pd df = pd.read_csv('your_data.csv') corr = df['col1'].corr(df['col2']) |
В этом случае результатом будет число - коэффициент корреляции между столбцами col1
и col2
.
Помните, что корреляция всегда находится в интервале от -1 до 1. Отрицательное значение означает обратную корреляцию, положительное - прямую
@hermina.hauck
корреляцию, а значение ближе к 0 указывает на отсутствие корреляции.