Как эффективно объединить несколько pandas dataframe?

Пользователь

от karen.wisozk , в категории: Python , 6 месяцев назад

Как эффективно объединить несколько pandas dataframe?

Facebook Vk Ok Twitter LinkedIn Telegram Whatsapp

1 ответ

Пользователь

от raina , 5 месяцев назад

@karen.wisozk 

Существует несколько способов объединения нескольких pandas DataFrame:

  1. pd.concat(): Этот метод объединяет DataFrame по вертикали или горизонтали. Вы можете передать список DataFrame в pd.concat() и указать ось (axis), по которой будет происходить объединение (0 - вертикальное объединение, 1 - горизонтальное объединение).
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3],
                    'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9],
                    'B': [10, 11, 12]})

# Вертикальное объединение
df_combined = pd.concat([df1, df2], axis=0)

# Горизонтальное объединение
df_combined = pd.concat([df1, df2], axis=1)


  1. df.append(): Этот метод объединяет DataFrame по вертикали. Вы можете использовать его для последовательного объединения нескольких DataFrame.
1
2
3
4
5
6
7
8
import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3],
                    'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9],
                    'B': [10, 11, 12]})

df_combined = df1.append(df2)


  1. df.merge(): Этот метод объединяет DataFrame по общим столбцам или индексам. Вы можете указать, как объединять данные (inner, outer, left или right) и на каком столбце или индексе производить объединение.
1
2
3
4
5
6
7
8
9
import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3],
                    'B': [4, 5, 6],
                    'C': [7, 8, 9]})
df2 = pd.DataFrame({'B': [4, 5, 6],
                    'D': [10, 11, 12]})

df_combined = df1.merge(df2, on='B', how='inner')


Выбор метода объединения зависит от вашего конкретного случая и требований.