Как найти корреляцию в pandas?

Пользователь

от hermina.hauck , в категории: Python , месяц назад

Как найти корреляцию в pandas?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

1 ответ

Пользователь

от lilla.herman , месяц назад

@hermina.hauck 

Для того чтобы найти корреляцию в pandas, вы можете использовать метод .corr():

1
2
3
4
import pandas as pd

df = pd.read_csv('your_data.csv')
corr = df.corr()


Этот метод вычисляет корреляцию между всеми парами столбцов в датафрейме. Результатом является датафрейм, в котором строки и столбцы соответствуют столбцам исходного датафрейма, а ячейки содержат значения корреляции.


Вы также можете вычислить корреляцию между отдельными столбцами, используя метод .corrwith():

1
2
3
4
import pandas as pd

df = pd.read_csv('your_data.csv')
corr = df['col1'].corr(df['col2'])


В этом случае результатом будет число - коэффициент корреляции между столбцами col1 и col2.


Помните, что корреляция всегда находится в интервале от -1 до 1. Отрицательное значение означает обратную корреляцию, положительное - прямую