Tartalomjegyzék
Pandas concat() példák
A Pandas concat()
függvény két vagy több DataFrame vagy Series összefűzésére használható. Ez egy kulcsfontosságú művelet az adatkeretek kombinálásához és manipulálásához az adatkezelési feladatok során. Ez a cikk részletes példákon keresztül mutatja be a concat()
függvény használatát különféle esetekben.
Bevezetés
A Pandas egy nyílt forráskódú Python könyvtár, amelyet adatokkal történő munkahoz terveztek. Az adatkeretek az adatok táblázatos formátumú ábrázolásai, amelyek sorokból és oszlopokból állnak. A concat()
függvény lehetővé teszi több adatkeretet és sorozatot egyetlen egységes adatkeretekbe való kombinálását.
A concat()
függvény két fő paramétert vesz fel:
* objs
: Az összefűzendő adatkeretek vagy sorozatok listája vagy szótára.
* axis
: Az összefűzés tengelye, amely lehet 0 (sorok) vagy 1 (oszlopok).
Adatkeretek összefűzése
A legegyszerűbb esetben a concat()
függvény két vagy több adatkeretet fűzhet össze függőlegesen sorok mentén, az axis=0
értékkel.
python
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})
df_concat = pd.concat([df1, df2], axis=0)
print(df_concat)
Kimeneti eredmény:
A B
0 1 4
1 2 5
2 3 6
3 7 10
4 8 11
5 9 12
Sorozatok összefűzése
A concat()
függvény sorozatokat is összefűzhet egyetlen sorozatba. Ehhez axis=0
értéket használhatunk, akárcsak az adatkereteknél.
python
s1 = pd.Series([1, 2, 3])
s2 = pd.Series([4, 5, 6])
s_concat = pd.concat([s1, s2], axis=0)
print(s_concat)
Kimeneti eredmény:
0 1
1 2
2 3
3 4
4 5
5 6
Name: 0, dtype: int64
Adatkeretek és sorozatok összefűzése
A concat()
függvény adatkeretből és sorozatból is létrehozhat összefűzött adatkeretet. Az összefűzés alapértelmezés szerint az oszlopok mentén történik, axis=1
értékkel.
python
df1 = pd.DataFrame({'A': [1, 2, 3]})
s2 = pd.Series([4, 5, 6])
df_concat = pd.concat([df1, s2], axis=1)
print(df_concat)
Kimeneti eredmény:
A 0
0 1 4
1 2 5
2 3 6
Összefűzés szótár használatával
A concat()
függvény szótárat is elfogad az összefűzendő objektumok kulcsokként és értékekként való megadásához. Ez hasznos, ha különböző nevű adatkereteket vagy sorozatokat kell összefűzni.
python
df1 = pd.DataFrame({'A': [1, 2, 3]})
df2 = pd.DataFrame({'B': [4, 5, 6]})
df_concat = pd.concat({'df1': df1, 'df2': df2}, axis=1)
print(df_concat)
Kimeneti eredmény:
A B
0 1 4
1 2 5
2 3 6
Összefűzés kulcsok használatával
A concat()
függvény kulcsokat is használhat az összefüzött adatkeretek vagy sorozatok azonosítására. Ez akkor hasznos, ha az eredményül kapott adatkeretet több index alapján kell csoportosítani.
python
df1 = pd.DataFrame({'A': [1, 2, 3]}, index=['a', 'b', 'c'])
df2 = pd.DataFrame({'B': [4, 5, 6]}, index=['a', 'b', 'd'])
df_concat = pd.concat([df1, df2], axis=1, keys=['df1', 'df2'])
print(df_concat)
Kimeneti eredmény:
df1 df2
a 1 4
b 2 5
c 3 NaN
d NaN 6
Ignore_index paraméter
Az ignore_index
paraméter lehetővé teszi, hogy az összefűzés után figyelmen kívül hagyják az eredeti indexeket. Ez akkor hasznos, ha az összefűzött adatkereteknek nincs azonos indexe.
python
df1 = pd.DataFrame({'A': [1, 2, 3]})
df2 = pd.DataFrame({'B': [4, 5, 6]}, index=['a', 'b', 'c'])
df_concat = pd.concat([df1, df2], axis=1, ignore_index=True)
print(df_concat)
Kimeneti eredmény:
0 1 2
0 1 4 5
1 2 5 6
2 3 NaN NaN
Összefűzés csoportonkénti műveletekkel
A concat()
függvény csoportosítási műveleteket is végrehajthat az összefűzés előtt. Ez lehetővé teszi az összefűzött adatkeretek összesítését vagy szűrését.
python
df = pd.DataFrame({'A': ['a', 'b', 'c', 'a', 'b', 'c'], 'B': [1, 2, 3, 4, 5, 6]})
df_concat = df.groupby('A').sum()
print(df_concat)
Kimeneti eredmény:
B
A
a 5
b 7
c 9
Következtetés
A Pandas concat()
függvény egy sokoldalú eszköz az adatkeretek és sorozatok összefűzéséhez. A paraméterek és opciók széles skálájával lehetővé teszi az adatok rugalmas kombinálását és manipulálását. Ez a cikk részletes példákat és magyarázatokat adott a concat()
függvény különböző használati eseteire. A concat()
függvény megértésével és elsajátításával a Pandas-felhasználók hatékonyabban kezelhetik adataikat, és mélyrehatóbb elemzéseket végezhetnek.
GYIK
1. Mi a concat()
függvény fő célja?
A concat()
függvény adatkeret vagy sorozat összefűzésére használható, amely egyetlen nagyobb adatkeret vagy sorozat létrehozását eredményezi.
2. Melyek a concat()
függvény legfontosabb paraméterei?
A concat()
függvény legfontosabb paraméterei az objs
(összefűzendő objektumok) és az axis
(összefűzés tengelye).
3. Hogyan lehet összefűzni az adatkereteket függőlegesen?
A függőleges összefűzéshez állítsa az axis
paramétert 0 értékre.
4. Hogyan lehet összefűzni sorozatokat?
A sorozatok összefűzéséhez állítsa az axis
paramétert 0 értékre, akárcsak az adatkereteknél.
5. Hogyan lehet összefűzni adatkereteket és sorozatokat?
A sorozatokat és adatkereteket az axis
paraméter 1 értékre állításával lehet összefűzni.
6. Hogyan lehet összefűzni különböző nevű adatkereteket?
Az összefűzendő objektumokat kulcsokként és értékekként átadó szótár használatával lehet összefűzni különböző nevű adatkereteket.
**7. Hogyan lehet összefű