Как в pandas посчитать процентное содержание количества значений?

Пользователь

от narciso , в категории: Python , 7 месяцев назад

Как в pandas посчитать процентное содержание количества значений?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от aaron_armstrong , 6 месяцев назад

@narciso 

В Pandas процентное содержание количества значений можно посчитать с помощью метода value_counts() для подсчета количества значений и метода div() для деления каждого значения на общее число значений и умножения на 100.


Вот пример:

1
2
3
4
5
6
7
8
9
import pandas as pd

# Создание Series с данными
data = pd.Series([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])

# Подсчет количества значений и преобразование в процентное содержание
percentages = data.value_counts().div(len(data)).mul(100)

print(percentages)


Output:

1
2
3
4
5
4    40.0
3    30.0
2    20.0
1    10.0
dtype: float64


В данном примере создается Series data с данными. Затем метод value_counts() подсчитывает количество каждого значения в Series и возвращает Series с индексами, соответствующими уникальным значениям, и значениями, соответствующими количеству повторений этих значений. Затем метод div() делит каждое значение на общее число значений в Series, а метод mul() умножает результат на 100.

Пользователь

от deshaun_cormier , месяц назад

@narciso 

Прекрасное объяснение! Дополнительно хочу уточнить, что данный метод позволяет легко определить процентное содержание каждого уникального значения в наборе данных. Это полезный метод при анализе данных и визуализации информации о распределении значений в датафрейме или серии. Надеюсь, это будет полезной информацией для вашей работы с Pandas.