logo

Pandasammansättning

Pandas kan kombinera Series-, DataFrame- och Panel-objekt genom olika typer av setlogik för indexen och den relationella algebra-funktionaliteten.

förbeställ genomgång

De concat() funktion är ansvarig för att utföra sammanlänkningsoperation längs en axel i DataFrame.

Syntax:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Parametrar:

    objs:Det är en sekvens eller mappning av serier eller DataFrame-objekt.
    Om vi ​​skickar ett dict i DataFrame kommer de sorterade nycklarna att användas som keys argument, och värdena kommer att väljas i så fall. Om några icke-objekt är närvarande, kommer det att tas bort om de inte alla är inga, och i det här fallet, en ValueError kommer att höjas.axel:Det är en axel att sammanfoga längs.Ansluta sig:Ansvarig för hantering av index på annan axel.join_axes:En lista över indexobjekt. Istället för att utföra den inre eller yttre uppsättningslogiken, används specifika index för den andra (n-1) axeln.ignore_index:bool, standardvärde False
    Den använder inte indexvärdena på sammanlänkningsaxeln, om sant. Den resulterande axeln kommer att betecknas som 0, ..., n - 1.

Returnerar

En serie returneras när vi sammanfogar alla serier längs axeln (axel=0). I fall om objs innehåller minst en DataFrame, returnerar den en DataFrame.

Exempel 1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Produktion

 0 p 1 q 0 r 1 s dtype: object 

Exempel 2: I exemplet ovan kan vi återställa det befintliga indexet genom att använda ignore_index parameter. Koden nedan visar hur ignore_index .

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Produktion

 0 p 1 q 2 r 3 s dtype: object 

Exempel 3: Vi kan lägga till ett hierarkiskt index på den yttersta nivån av data genom att använda nycklar parameter.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Produktion

 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Exempel 4: Vi kan märka indexnycklarna genom att använda namn parameter. Nedanstående kod visar hur parametern namn fungerar.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Produktion

 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Sammanfogning med append

Append-metoden definieras som en användbar genväg för att sammanfoga Series och DataFrame.

Exempel:

 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Produktion

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88