Metoden describe() används för att beräkna vissa statistiska data som percentil, medelvärde och std av de numeriska värdena för Series eller DataFrame. Den analyserar både numeriska och objektserier och även DataFrame-kolumnuppsättningarna med blandade datatyper.
Syntax
DataFrame.describe(percentiles=None, include=None, exclude=None)
Parametrar
Returnerar
Den returnerar den statistiska sammanfattningen av serien och dataramen.
Exempel1
import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe()
Produktion
aritmetisk logisk enhet
count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64
Exempel 2
import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe()
Produktion
count 4 unique 3 top q freq 2 dtype: object
Exempel 3
import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category'])
Produktion
categorical count 3 unique 3 top u freq 1
Exempel4
import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object])
Produktion
categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0