Pandas-serien kan definieras som en endimensionell array som kan lagra olika datatyper. Vi kan enkelt konvertera listan, tupeln och ordboken till serier med ' serier ' metod. Radetiketterna för serier kallas index. En serie kan inte innehålla flera kolumner. Den har följande parameter:
Skapa en serie:
Vi kan skapa en serie på två sätt:
- Skapa en tom serie
- Skapa en serie med ingångar.
Skapa en tom serie:
Vi kan enkelt skapa en tom serie i Pandas vilket innebär att den inte kommer att ha något värde.
Syntaxen som används för att skapa en tom serie:
registrera minne
= pandas.Series()
Exemplet nedan skapar ett objekt av typen Empty Series som inte har några värden och som har standarddatatyp, dvs. flyta64 .
Exempel
import pandas as pd x = pd.Series() print (x)
Produktion
Series([], dtype: float64)
Skapa en serie med ingångar:
Vi kan skapa serier genom att använda olika ingångar:
- Array
- Dict
- Skalärt värde
Skapa serier från Array:
Innan vi skapar en serie måste vi först importera numpy modul och använd sedan array()-funktionen i programmet. Om data är ndarray måste det skickade indexet vara av samma längd.
Om vi inte passerar ett index, då som standard index för intervall(n) skickas där n definierar längden på en array, dvs [0,1,2,.... range(len(array))-1 ].
Exempel
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Produktion
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Skapa en serie från dict
Vi kan också skapa en serie från dict. Om ordboksobjektet skickas som indata och indexet inte är specificerat, tas ordboksnycklarna i en sorterad ordning för att konstruera indexet .
sida ner tangentbordet
Om index godkänns, kommer värden som motsvarar en viss etikett i indexet att extraheras från lexikon .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Produktion
x 0.0 y 1.0 z 2.0 dtype: float64
Skapa en serie med Scalar:
spetsig vinkel
Om vi tar de skalära värdena måste indexet tillhandahållas. Det skalära värdet kommer att upprepas för att matcha längden på indexet.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Produktion
0 4 1 4 2 4 3 4 dtype: int64
Få åtkomst till data från serier med position:
När du väl har skapat serieobjektet kan du komma åt dess index, data och till och med enskilda element.
Data i serien kan nås på liknande sätt som i ndarrayen.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Produktion
1
Serieobjektattribut
Attributet Series definieras som all information relaterad till Series-objektet, såsom storlek, datatyp. etc. Nedan är några av de attribut som du kan använda för att få information om Series-objektet:
Attribut | Beskrivning |
---|---|
Series.index | Definierar indexet för serien. |
Serie.form | Det returnerar en tupel av formen av data. |
Series.dtype | Den returnerar datatypen för datan. |
Serie.storlek | Det returnerar storleken på datan. |
Serie.tom | Det returnerar True om serieobjektet är tomt, annars returnerar det falskt. |
Serie.hasnans | Den returnerar True om det finns några NaN-värden, annars returnerar den falskt. |
Series.nbytes | Det returnerar antalet byte i datan. |
Serien är jag | Det returnerar antalet dimensioner i data. |
Serie.varustorlek | Det returnerar storleken på objektets datatyp. |
Hämtar Index array och data array för ett serieobjekt
Vi kan hämta indexmatrisen och datamatrisen för ett befintligt serieobjekt genom att använda attributen index och värden.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Produktion
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Hämtar typer (dtype) och storlek på typ (artikelstorlek)
Du kan använda attributet dtype med serieobjekt som dtype för att hämta datatypen för ett enskilt element i ett serieobjekt, du kan använda detaljstorlek attribut för att visa antalet byte som tilldelats varje datapost.
ddl vs dml
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Produktion
int64 8 float64 8
Hämtar Shape
Formen på Series-objektet definierar det totala antalet element inklusive saknade eller tomma värden (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Produktion
(4,) (3,)
Hämtar dimension, storlek och antal byte:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Produktion
1 1 4 3 32 24
Kontrollera tomhet och närvaro av NaN
För att kontrollera att serieobjektet är tomt kan du använda tomt attribut . På samma sätt, för att kontrollera om ett serieobjekt innehåller några NaN-värden eller inte, kan du använda hassan attribut.
Exempel
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Produktion
False False True True False False 4 3 3 3
Seriefunktioner
Det finns några funktioner som används i serier som är följande:
Funktioner | Beskrivning |
---|---|
Pandas Series.map() | Kartlägg värdena från två serier som har en gemensam kolumn. |
Pandas Series.std() | Beräkna standardavvikelsen för den givna uppsättningen siffror, DataFrame, kolumn och rader. |
Pandas Series.to_frame() | Konvertera serieobjektet till dataramen. |
Pandas Series.value_counts() | Returnerar en serie som innehåller antal unika värden. |