logo

Få unika värden från en kolumn i Pandas DataFrame

Funktionen unique() tar bort alla dubbletter av värden i en kolumn och returnerar ett enda värde för flera samma värden. I den här artikeln kommer vi att diskutera hur vi kan få unika värden från en kolumn in Pandas DataFrame .

Skapa en Pandas dataram med dubbletter av element

Skapa ett exempel på Pandas dataram med en ordlista med listor, säg kolumnnamn A, B, C, D och E med dubbletter av element.



Python3




Linux gratis ipconfig





# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)>

>

>

Få unika värden från en kolumn i Pandas DataFrame

Nedan finns några exempel på vilka vi kan få de unika värdena för en kolumn i denna dataram.

  • Få de unika värdena för 'B'-kolumnen
  • Få de unika värdena för 'E' Column
  • Få antalet unika värden i en kolumn
  • Använda set() för att eliminera dubbletter av värden från en kolumn
  • Använda metoderna pandas.concat() och Unique().
  • Använder Series.drop_duplicates()

Få de unika värdena för 'B'-kolumnen

I det här exemplet hämtar och skriver vi ut de unika värdena från kolumnen 'B' med hjälp av unique()> metod. De resulterande unika värdena är['B1', 'B2', 'B3', 'B4']>.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()>

>

>

Produktion

array(['B1', 'B2', 'B3', 'B4'], dtype=object)>

Få de unika värdena hos pandor i 'E' kolumn

I det här exemplet skapar vi en pandas DataFrame från en ordbok och hämtar sedan de unika värdena från kolumnen 'E' med hjälp avunique()>metod. De resulterande unika värdena är['E1']>.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()>

>

>

Produktion

array(['E1'], dtype=object)>

Få antalet unika värden i en kolumn

I det här exemplet skapar vi en pandas DataFrame från en ordbok och beräknar och skriver sedan ut antalet unika värden i kolumnen 'C', exklusive NaN-värden. Resultatet är 3, vilket indikerar att det finns tre unika värden i kolumn 'C'.

Python3

rad vs kolumn




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)>

>

>

Produktion

3>

Eliminera dubbletter av värden från en kolumn med set()

I det här exemplet skapar vi en pandas DataFrame från en ordbok och använder sedan set()>fungera för att extrahera unika värden från kolumn 'C', vilket eliminerar dubbletter. Den resulterande uppsättningen,{'C1', 'C2', 'C3'}>, representerar de unika värdena i kolumn 'C'.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)>

>

>

Produktion

{'C1', 'C2', 'C3'}>

Använda metoderna pandas.concat() och Unique().

I det här exemplet skapar vi en pandas DataFrame från en ordbok och sammanfogar sedan unika värden från alla kolumner med pd.concat()> . Den resulterande NumPy-matrisen, när den skrivs ut, visar alla unika värden från kolumnerna 'A' till 'E'.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)>

>

>

Produktion

['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>

Använder Series.drop_duplicates()

I det här exemplet skapar vi en pandas DataFrame från en ordbok och tar bort dubbletter från kolumnerna 'A' och 'D' med hjälp av drop_duplicates()>metod . Den resulterande DataFrame, när den skrivs ut, visar de unika värdena i kolumnerna 'A' och 'D', med NaN-värden där dubbletter togs bort från 'D'.

försök fånga java

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)>

>

>

Produktion

   A B C D E   0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>