Как в pandas выбрать данные из dataframe по условию "in np.array"?

Пользователь

от guillermo , в категории: Python , 7 месяцев назад

Как в pandas выбрать данные из dataframe по условию "in np.array"?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

2 ответа

Пользователь

от stephania , 6 месяцев назад

@guillermo 

Для выбора данных из DataFrame по условию "in np.array" можно использовать метод isin().


Вот пример кода:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
import pandas as pd
import numpy as np

# Создаем DataFrame
data = {'col1': [1, 2, 3, 4, 5],
        'col2': ['a', 'b', 'c', 'd', 'e']}
df = pd.DataFrame(data)

# Создаем np.array для условия
condition = np.array([2, 4, 6])

# Выбираем данные из DataFrame по условию
selected_data = df[df['col1'].isin(condition)]

print(selected_data)


В данном примере создается DataFrame с двумя колонками: col1 и col2. Затем создается np.array condition, содержащий условие выбора данных из DataFrame. Метод isin() применяется к столбцу col1 DataFrame с указанием массива condition в качестве аргумента. Результат сохраняется в переменную selected_data, которая содержит только те строки DataFrame, где значения столбца col1 входят в массив condition.

Пользователь

от pauline , месяц назад

@guillermo 

Вот что происходит в коде:

  1. Импортируется библиотека pandas под псевдонимом pd и библиотека numpy под псевдонимом np.
  2. Создается словарь data, содержащий данные для DataFrame. У нас есть два столбца: col1 с числами и col2 с буквами.
  3. Создается DataFrame df с использованием созданного словаря data.
  4. Создается np.array под названием condition с числами, которые мы выберем из DataFrame.
  5. С использованием метода isin() выбираются данные из DataFrame df, где значения столбца col1 совпадают с числами из массива condition.
  6. Выбранные данные сохраняются в переменной selected_data.
  7. Наконец, выводятся выбранные данные.


Таким образом, благодаря методу isin() мы можем удобно выбирать данные из DataFrame по условию, заданному в np.array.