logo

Pandas DataFrame.describe()

Metoden describe() används för att beräkna vissa statistiska data som percentil, medelvärde och std av de numeriska värdena för Series eller DataFrame. Den analyserar både numeriska och objektserier och även DataFrame-kolumnuppsättningarna med blandade datatyper.

Syntax

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

Parametrar

    percentil:Det är en valfri parameter som är en lista-liknande datatyp av tal som ska falla mellan 0 och 1. Dess standardvärde är [.25, .5, .75], vilket returnerar den 25:e, 50:e och 75:e percentilen.omfatta:Det är också en valfri parameter som inkluderar listan över datatyperna samtidigt som den beskriver DataFrame. Dess standardvärde är None.utesluta:Det är också en valfri parameter som exkluderar listan över datatyper samtidigt som den beskriver DataFrame. Dess standardvärde är None.

Returnerar

Den returnerar den statistiska sammanfattningen av serien och dataramen.

Exempel1

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

Produktion

aritmetisk logisk enhet
 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

Exempel 2

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

Produktion

 count 4 unique 3 top q freq 2 dtype: object 

Exempel 3

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

Produktion

 categorical count 3 unique 3 top u freq 1 

Exempel4

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

Produktion

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0