logo

Python Pandas-serien

Pandas-serien kan definieras som en endimensionell array som kan lagra olika datatyper. Vi kan enkelt konvertera listan, tupeln och ordboken till serier med ' serier ' metod. Radetiketterna för serier kallas index. En serie kan inte innehålla flera kolumner. Den har följande parameter:

    data:Det kan vara valfri lista, ordbok eller skalärt värde.index:Värdet på indexet ska vara unikt och hashbart. Den måste vara av samma längd som data. Om vi ​​inte passerar något index, standard np.arrange(n) kommer att användas.dtype:Det hänvisar till datatypen för serier.kopiera:Den används för att kopiera data.

Skapa en serie:

Vi kan skapa en serie på två sätt:

  1. Skapa en tom serie
  2. Skapa en serie med ingångar.

Skapa en tom serie:

Vi kan enkelt skapa en tom serie i Pandas vilket innebär att den inte kommer att ha något värde.

Syntaxen som används för att skapa en tom serie:

registrera minne
 = pandas.Series() 

Exemplet nedan skapar ett objekt av typen Empty Series som inte har några värden och som har standarddatatyp, dvs. flyta64 .

Exempel

 import pandas as pd x = pd.Series() print (x) 

Produktion

 Series([], dtype: float64) 

Skapa en serie med ingångar:

Vi kan skapa serier genom att använda olika ingångar:

  • Array
  • Dict
  • Skalärt värde

Skapa serier från Array:

Innan vi skapar en serie måste vi först importera numpy modul och använd sedan array()-funktionen i programmet. Om data är ndarray måste det skickade indexet vara av samma längd.

Om vi ​​inte passerar ett index, då som standard index för intervall(n) skickas där n definierar längden på en array, dvs [0,1,2,.... range(len(array))-1 ].

Exempel

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Produktion

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Skapa en serie från dict

Vi kan också skapa en serie från dict. Om ordboksobjektet skickas som indata och indexet inte är specificerat, tas ordboksnycklarna i en sorterad ordning för att konstruera indexet .

sida ner tangentbordet

Om index godkänns, kommer värden som motsvarar en viss etikett i indexet att extraheras från lexikon .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Produktion

 x 0.0 y 1.0 z 2.0 dtype: float64 

Skapa en serie med Scalar:

spetsig vinkel

Om vi ​​tar de skalära värdena måste indexet tillhandahållas. Det skalära värdet kommer att upprepas för att matcha längden på indexet.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Produktion

 0 4 1 4 2 4 3 4 dtype: int64 

Få åtkomst till data från serier med position:

När du väl har skapat serieobjektet kan du komma åt dess index, data och till och med enskilda element.

Data i serien kan nås på liknande sätt som i ndarrayen.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Produktion

 1 

Serieobjektattribut

Attributet Series definieras som all information relaterad till Series-objektet, såsom storlek, datatyp. etc. Nedan är några av de attribut som du kan använda för att få information om Series-objektet:

Attribut Beskrivning
Series.index Definierar indexet för serien.
Serie.form Det returnerar en tupel av formen av data.
Series.dtype Den returnerar datatypen för datan.
Serie.storlek Det returnerar storleken på datan.
Serie.tom Det returnerar True om serieobjektet är tomt, annars returnerar det falskt.
Serie.hasnans Den returnerar True om det finns några NaN-värden, annars returnerar den falskt.
Series.nbytes Det returnerar antalet byte i datan.
Serien är jag Det returnerar antalet dimensioner i data.
Serie.varustorlek Det returnerar storleken på objektets datatyp.

Hämtar Index array och data array för ett serieobjekt

Vi kan hämta indexmatrisen och datamatrisen för ett befintligt serieobjekt genom att använda attributen index och värden.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Produktion

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Hämtar typer (dtype) och storlek på typ (artikelstorlek)

Du kan använda attributet dtype med serieobjekt som dtype för att hämta datatypen för ett enskilt element i ett serieobjekt, du kan använda detaljstorlek attribut för att visa antalet byte som tilldelats varje datapost.

ddl vs dml
 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Produktion

 int64 8 float64 8 

Hämtar Shape

Formen på Series-objektet definierar det totala antalet element inklusive saknade eller tomma värden (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Produktion

 (4,) (3,) 

Hämtar dimension, storlek och antal byte:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Produktion

 1 1 4 3 32 24 

Kontrollera tomhet och närvaro av NaN

För att kontrollera att serieobjektet är tomt kan du använda tomt attribut . På samma sätt, för att kontrollera om ett serieobjekt innehåller några NaN-värden eller inte, kan du använda hassan attribut.

Exempel

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Produktion

 False False True True False False 4 3 3 3 

Seriefunktioner

Det finns några funktioner som används i serier som är följande:

Funktioner Beskrivning
Pandas Series.map() Kartlägg värdena från två serier som har en gemensam kolumn.
Pandas Series.std() Beräkna standardavvikelsen för den givna uppsättningen siffror, DataFrame, kolumn och rader.
Pandas Series.to_frame() Konvertera serieobjektet till dataramen.
Pandas Series.value_counts() Returnerar en serie som innehåller antal unika värden.