logo

Nominella vs Ordinaldata

Datavetenskap kretsar kring bearbetning och analys av data med hjälp av en rad verktyg och tekniker. I dagens datadrivna värld stöter vi på typer av data som var och en kräver hantering och tolkning. Det är viktigt att förstå olika typer av data för korrekt dataanalys och statistisk tolkning. Typen av data avgör vilka statistiska metoder och operationer som bör användas. Olika datatyper behöver olika analys- och tolkningsmetoder för att dra betydande slutsatser. I den här artikeln kommer vi att utforska begreppet data, och dess betydelse ger exempel från verkliga världen och vägleder dig genom sätt att arbeta med det.

Mätnivåer

Innan man analyserar en datauppsättning är det avgörande att identifiera vilken typ av data den innehåller. Lyckligtvis kan all data grupperas i en av fyra kategorier: nominell data, ordningsdata, intervalldata eller kvotdata. Även om dessa ofta kallas datatyper, är de faktiskt olika nivåer av mätning. Mätnivån återspeglar noggrannheten med vilken en variabel har kvantifierats, och den bestämmer vilka metoder som kan användas för att extrahera insikter från data.



De fyra kategorierna av data är inte alltid enkla att särskilja och tillhör istället en hierarki, där varje nivå bygger på den föregående.

1

Det finns fyra typer av data: kategorisk, som ytterligare kan delas in i nominell och ordningsföljd, och numerisk, som ytterligare kan delas in i intervall och förhållande. De nominella och ordinala skalorna är relativt oprecisa, vilket gör dem lättare att analysera, men de ger mindre exakta insikter. Å andra sidan är intervall- och kvotskalorna mer komplexa och svåra att analysera, men de har potential att ge mycket rikare insikter.



  • Nominella data – Nominell data är en grundläggande datatyp som kategoriserar data genom att märka eller namnge värden som kön, hårfärg eller djurtyper. Den har ingen hierarki.
  • Ordinaldata – Ordinaldata innebär att klassificera data baserat på rang, såsom social status i kategorier som 'rika', 'medelinkomst' eller 'fattiga'. Det finns dock inga fasta intervall mellan dessa kategorier.
  • Intervalldata – Intervalldata är ett sätt att organisera och jämföra data som inkluderar uppmätta intervall. Temperaturskalor, som Celsius eller Fahrenheit, är bra exempel på intervalldata. Intervalldata har dock inte en sann noll, vilket innebär att ett mått på noll fortfarande kan representera ett kvantifierbart mått (som noll grader Celsius, vilket bara är ytterligare en punkt på skalan och faktiskt inte betyder att det inte finns någon temperatur närvarande) .
  • Förhållandedata – Den mest komplicerade nivån av mätning är kvotdata. På samma sätt som intervalldata, kategoriserar och ordnar den data med hjälp av uppmätta intervall. Men till skillnad från intervalldata inkluderar förhållandedata en äkta noll. När en variabel är noll, finns det ingen närvaro av den variabeln. En utmärkt illustration av förhållandedata är höjdmätning, som inte kan vara negativ.

Vad är nominell data?

Kategorisk data, även känd som nominell data, är en avgörande typ av information som används inom olika områden som forskning, statistik och dataanalys. Den består av kategorier eller etiketter som hjälper till att klassificera och ordna data. Det väsentliga med kategoriska data är att de inte har någon inneboende ordning eller rangordning bland sina kategorier. Istället är dessa kategorier separata, distinkta och ömsesidigt uteslutande.

2

Till exempel används nominella data för att klassificera information i distinkta etiketter eller kategorier utan någon naturlig ordning eller rangordning. Dessa etiketter eller kategorier representeras med namn eller termer, och det finns ingen naturlig ordning eller rangordning bland dem. Nominell data är användbar för kvalitativ klassificering och organisation av information, vilket gör det möjligt för forskare och analytiker att gruppera datapunkter baserat på specifika attribut eller egenskaper utan att antyda några numeriska samband.



  • Ögonfärgskategorier som blå eller grön representerar nominella data. Varje kategori är distinkt, utan ordning eller rangordning.
  • Smartphone-märken som iPhone eller Samsung är nominella data. Det finns ingen hierarki mellan varumärken.
  • Transportsätt som bil eller cykel är nominella data. De är diskreta kategorier utan inneboende ordning.

Egenskaper för nominella data

  • Data som klassificeras som nominella består av kategorier som är helt separata och skilda från varandra.
  • Data som faller under den nominella kategorin särskiljs av beskrivande etiketter snarare än något numeriskt eller kvantitativt värde
  • Nominella data kan inte rangordnas eller ordnas hierarkiskt, eftersom ingen kategori är överlägsen eller underlägsen en annan.

Exempel

Här är några exempel på hur nominell data används för att klassificera och kategorisera information i distinkta och icke-ordnade kategorier:

1. Bilens färger: Bilfärger är nominella data, med tydliga kategorier men ingen inneboende ordning eller rangordning. Varje bil faller under en färgkategori, utan något logiskt eller numeriskt samband mellan färger.

2. Typer av frukt: Fruktkategorier i en korg är nominella. Varje frukt tillhör en specifik kategori utan hierarki eller ordning. Alla kategorier är distinkta och diskreta.

3. Filmgenrer: Filmgenrer är nominella data eftersom det inte finns någon rangordning bland kategorier som action eller komedi. Varje genre är unik, men vi kan inte säga om en är bättre än en annan baserat enbart på dessa data.

Vad är Ordinal Data?

Ordinaldata är en form av kvalitativ data som klassificerar variabler i beskrivande kategorier. Den kännetecknas av det faktum att kategorierna den använder rangordnas på någon sorts hierarkisk skala, som från högt till lågt. Ordinaldata är den näst mest komplicerade typen av mätning, efter nominella data. Även om det är mer invecklat än nominella data, som saknar någon inneboende ordning, är det fortfarande relativt förenklat.

3

Ordinaldata är till exempel en typ av data som används för att kategorisera objekt med en meningsfull hierarki eller ordning. Dessa kategorier hjälper oss att jämföra och rangordna olika prestationer, positioner eller prestationer för elever, även om intervallen mellan dem inte är lika. Ordinaldata är användbar för att förstå ordnade val eller preferenser och för att bedöma relativa skillnader.

  • Skolbetyg: Betyg som A, B, C är ordningsdata, rangordnade efter prestation, men intervallen mellan dem varierar.
  • Utbildningsnivå: Nivåer som gymnasiet, kandidatexamen och master är ordinarie data, sorterade efter utbildning, men skillnaderna mellan nivåerna skiljer sig åt.
  • Anciennitetsnivå: Jobbnivåer som entry, mid, senior är ordinarie data, som indikerar hierarki, men skillnaden varierar beroende på jobb och bransch.

Karakteristika för Ordinal Data

  • Ordinaldata faller under kategorin icke-numeriska och kategoriska data, men de kan fortfarande använda numeriska värden som etiketter.
  • Ordinaldata rangordnas alltid i en hierarki (därav namnet 'ordinal').
  • Ordinaldata kan rangordnas, men deras värden är inte jämnt fördelade.
  • Med ordningsdata kan du beräkna frekvensfördelning, läge, median och variabelområde.

Exempel

Här är några exempel på hur ordningsdata används i fält och domäner:

1. Utbildningsnivåer: Ordinaldata används vanligtvis för att representera utbildningsnivåer, såsom skola, kandidatexamen, magisterexamen och Ph.D. Dessa nivåer har en ordning.

2. Betyg om kundnöjdhet: En annan användning av data är i kundnöjdhetsundersökningar. Dessa undersökningar ber ofta respondenterna betygsätta sin upplevelse på en skala, från dålig till utmärkt.

3. Ekonomiklasser: klasser inklusive klass medelklass och överklass kan klassificeras som ordinarie data baserat på deras rangordning.

Dessa exempel visar hur ordningsdata används över fält och domäner.

Nominell vs ordinarie data

Egenskaper

Nominella data

Ordinaldata

Typ av kategorier

Distinkt och diskret

Diskret och distinkt

Ordning/Rankning

Ingen inneboende ordning

Har en tydlig ordning eller rangordning

Numeriska värden

Inga meningsfulla numeriska värden

Inga meningsfulla numeriska värden

Analystekniker

Frekvensräkningar, procentsatser, stapeldiagram

Rangordning, median, icke-parametriska tester, ordnade stapeldiagram, ordinal regression

Exempel

Färger, kön, typer av djur

postorder genomgång av binärt träd

Skolbetyg, utbildningsnivå, senioritetsnivå

Tolkning

Används för klassificering och gruppering baserat på kategori

Används för att bedöma ordnade preferenser, hierarki eller rankningar