Pandas concat() példák

Pandas concat() példák

A Pandas concat() függvény két vagy több DataFrame vagy Series összefűzésére használható. Ez egy kulcsfontosságú művelet az adatkeretek kombinálásához és manipulálásához az adatkezelési feladatok során. Ez a cikk részletes példákon keresztül mutatja be a concat() függvény használatát különféle esetekben.

Bevezetés

A Pandas egy nyílt forráskódú Python könyvtár, amelyet adatokkal történő munkahoz terveztek. Az adatkeretek az adatok táblázatos formátumú ábrázolásai, amelyek sorokból és oszlopokból állnak. A concat() függvény lehetővé teszi több adatkeretet és sorozatot egyetlen egységes adatkeretekbe való kombinálását.

A concat() függvény két fő paramétert vesz fel:

* objs: Az összefűzendő adatkeretek vagy sorozatok listája vagy szótára.
* axis: Az összefűzés tengelye, amely lehet 0 (sorok) vagy 1 (oszlopok).

Adatkeretek összefűzése

A legegyszerűbb esetben a concat() függvény két vagy több adatkeretet fűzhet össze függőlegesen sorok mentén, az axis=0 értékkel.

  Az Onyx Boox Palma áttekintése: Tedd hordozhatóbbá az e-tintát

python
import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})

df_concat = pd.concat([df1, df2], axis=0)

print(df_concat)

Kimeneti eredmény:


A B
0 1 4
1 2 5
2 3 6
3 7 10
4 8 11
5 9 12

Sorozatok összefűzése

A concat() függvény sorozatokat is összefűzhet egyetlen sorozatba. Ehhez axis=0 értéket használhatunk, akárcsak az adatkereteknél.

python
s1 = pd.Series([1, 2, 3])
s2 = pd.Series([4, 5, 6])

s_concat = pd.concat([s1, s2], axis=0)

print(s_concat)

Kimeneti eredmény:


0 1
1 2
2 3
3 4
4 5
5 6
Name: 0, dtype: int64

Adatkeretek és sorozatok összefűzése

A concat() függvény adatkeretből és sorozatból is létrehozhat összefűzött adatkeretet. Az összefűzés alapértelmezés szerint az oszlopok mentén történik, axis=1 értékkel.

python
df1 = pd.DataFrame({'A': [1, 2, 3]})
s2 = pd.Series([4, 5, 6])

df_concat = pd.concat([df1, s2], axis=1)

print(df_concat)

Kimeneti eredmény:


A 0
0 1 4
1 2 5
2 3 6

Összefűzés szótár használatával

A concat() függvény szótárat is elfogad az összefűzendő objektumok kulcsokként és értékekként való megadásához. Ez hasznos, ha különböző nevű adatkereteket vagy sorozatokat kell összefűzni.

python
df1 = pd.DataFrame({'A': [1, 2, 3]})
df2 = pd.DataFrame({'B': [4, 5, 6]})

df_concat = pd.concat({'df1': df1, 'df2': df2}, axis=1)

print(df_concat)

Kimeneti eredmény:


A B
0 1 4
1 2 5
2 3 6

Összefűzés kulcsok használatával

A concat() függvény kulcsokat is használhat az összefüzött adatkeretek vagy sorozatok azonosítására. Ez akkor hasznos, ha az eredményül kapott adatkeretet több index alapján kell csoportosítani.

python
df1 = pd.DataFrame({'A': [1, 2, 3]}, index=['a', 'b', 'c'])
df2 = pd.DataFrame({'B': [4, 5, 6]}, index=['a', 'b', 'd'])

df_concat = pd.concat([df1, df2], axis=1, keys=['df1', 'df2'])

print(df_concat)

Kimeneti eredmény:


df1 df2
a 1 4
b 2 5
c 3 NaN
d NaN 6

Ignore_index paraméter

Az ignore_index paraméter lehetővé teszi, hogy az összefűzés után figyelmen kívül hagyják az eredeti indexeket. Ez akkor hasznos, ha az összefűzött adatkereteknek nincs azonos indexe.

python
df1 = pd.DataFrame({'A': [1, 2, 3]})
df2 = pd.DataFrame({'B': [4, 5, 6]}, index=['a', 'b', 'c'])

df_concat = pd.concat([df1, df2], axis=1, ignore_index=True)

print(df_concat)

Kimeneti eredmény:


0 1 2
0 1 4 5
1 2 5 6
2 3 NaN NaN

Összefűzés csoportonkénti műveletekkel

A concat() függvény csoportosítási műveleteket is végrehajthat az összefűzés előtt. Ez lehetővé teszi az összefűzött adatkeretek összesítését vagy szűrését.

python
df = pd.DataFrame({'A': ['a', 'b', 'c', 'a', 'b', 'c'], 'B': [1, 2, 3, 4, 5, 6]})

df_concat = df.groupby('A').sum()

print(df_concat)

Kimeneti eredmény:


B
A
a 5
b 7
c 9

Következtetés

A Pandas concat() függvény egy sokoldalú eszköz az adatkeretek és sorozatok összefűzéséhez. A paraméterek és opciók széles skálájával lehetővé teszi az adatok rugalmas kombinálását és manipulálását. Ez a cikk részletes példákat és magyarázatokat adott a concat() függvény különböző használati eseteire. A concat() függvény megértésével és elsajátításával a Pandas-felhasználók hatékonyabban kezelhetik adataikat, és mélyrehatóbb elemzéseket végezhetnek.

GYIK

1. Mi a concat() függvény fő célja?

A concat() függvény adatkeret vagy sorozat összefűzésére használható, amely egyetlen nagyobb adatkeret vagy sorozat létrehozását eredményezi.

2. Melyek a concat() függvény legfontosabb paraméterei?

A concat() függvény legfontosabb paraméterei az objs (összefűzendő objektumok) és az axis (összefűzés tengelye).

3. Hogyan lehet összefűzni az adatkereteket függőlegesen?

A függőleges összefűzéshez állítsa az axis paramétert 0 értékre.

4. Hogyan lehet összefűzni sorozatokat?

A sorozatok összefűzéséhez állítsa az axis paramétert 0 értékre, akárcsak az adatkereteknél.

5. Hogyan lehet összefűzni adatkereteket és sorozatokat?

A sorozatokat és adatkereteket az axis paraméter 1 értékre állításával lehet összefűzni.

6. Hogyan lehet összefűzni különböző nevű adatkereteket?

Az összefűzendő objektumokat kulcsokként és értékekként átadó szótár használatával lehet összefűzni különböző nevű adatkereteket.

**7. Hogyan lehet összefű