Processen för konvertering av data från en form till en annan form kallas kodning. Det används för att transformera data så att data kan stödjas och användas av olika system. Kodning fungerar på samma sätt som att konvertera temperatur från Celsius till Fahrenheit, eftersom den bara omvandlas till en annan form, men det ursprungliga värdet förblir alltid detsamma. Kodning används i huvudsak i två områden:
Obs: Kodning skiljer sig från kryptering eftersom dess huvudsakliga syfte inte är att dölja data utan att konvertera den till ett format så att den kan konsumeras korrekt.
I det här ämnet kommer vi att diskutera de olika typerna av kodningstekniker som används vid datoranvändning.
Typ av kodningsteknik
Teckenkodning
Teckenkodning kodar tecken till byte . Den informerar datorerna om hur de ska tolka nollorna och ettorna till riktiga tecken, siffror och symboler. Datorn förstår endast binära data; därför är det nödvändigt att konvertera dessa tecken till numeriska koder. För att uppnå detta konverteras varje tecken till binär kod, och för detta sparas textdokument med kodningstyper. Det kan göras genom att para ihop siffror med tecken. Om vi inte använder teckenkodning kommer inte vår webbplats att visa tecknen och texten i rätt format. Därför kommer det att minska läsbarheten och maskinen skulle inte kunna bearbeta data korrekt. Vidare säkerställer teckenkodning att varje tecken har en korrekt representation i dator- eller binärt format.
Det finns olika typer av teckenkodningstekniker, som ges nedan:
HTML-kodning
HTML-kodning används för att visa en HTML-sida i ett korrekt format. Med kodning får en webbläsare veta vilken teckenuppsättning som ska användas.
I HTML finns det olika tecken som används i HTML Markup som . För att koda dessa tecken som innehåll måste vi använda en kodning.
URL-kodning
URL (Uniform Resource Locator) Kodning används för att konvertera tecken i ett sådant format att de kan överföras över internet . Det är också känt som procentkodning. URL-kodningen utförs för att skicka URL:en till internet med hjälp av ASCII-teckenuppsättningen. Icke-ASCII-tecken ersätts med en %, följt av hexadecimala siffror.
UNICODE-kodning
Unicode är en kodningsstandard för en universell teckenuppsättning. Den tillåter kodning, representation och hantering av texten som representeras på de flesta språk eller skrivsystem som är tillgängliga över hela världen. Den tillhandahåller en kodpunkt eller ett nummer för varje tecken på alla språk som stöds. Det kan representera ungefär alla möjliga tecken på alla språk. En speciell sekvens av bitar är känd som en kodningsenhet.
En UNICODE-standard kan använda 8, 16 eller 32 bitar för att representera tecknen.
Unicode-standarden definierar Unicode Transformation Format (UTF) för att koda kodpunkterna.
UNICODE-kodningsstandarden har följande UTF-scheman:
UTF8 definieras av UNICODE-standarden, vilket är teckenkodning med variabel bredd som används i elektronisk kommunikation. UTF-8 kan koda alla 1 112 064 giltiga teckenkodpunkter i Unicode med en till fyra enbyte (8-bitars) kodenheter.
UTF16-kodning representerar ett teckens kodpunkter med ett av två 16-bitars heltal.
UTF32-kodning representerar varje kodpunkt som 32-bitars heltal.
Base64-kodning
Base64 Encoding används för att koda binär data till motsvarande ASCII-tecken. Base64-kodningen används i Mail-systemet eftersom e-postsystem som SMTP inte kan fungera med binär data eftersom de endast accepterar ASCII-textdata. Det används också i enkel HTTP-autentisering för att koda inloggningsuppgifterna. Dessutom används den också för att överföra binära data till cookies och andra parametrar för att göra data oläsbar för att förhindra manipulering. Om en bild eller annan fil överförs utan Base64-kodning kommer den att skadas eftersom e-postsystemet inte kan hantera binär data.
Base64 representerar data i block om 3 byte, där varje byte innehåller 8 bitar; därför representerar den 24 bitar. Dessa 24 bitar är indelade i fyra grupper om 6 bitar. Var och en av dessa grupper eller bitar omvandlas till motsvarande Base64-värde.
ASCII-kodning
Amerikansk standardkod för informationsutbyte (ASCII) är en typ av teckenkodning. Det var den första teckenkodningsstandarden som släpptes 1963.
ASCII-koden används för att representera engelska tecken som siffror, där varje bokstav tilldelas ett nummer från 0 till 127. De flesta moderna teckenkodningsscheman är baserade på ASCII, även om de stöder många ytterligare tecken. Det är en enda byte-kodning som endast använder de nedersta 7 bitarna. I en ASCII-fil representeras varje alfabetiskt, numeriskt eller specialtecken med ett 7-bitars binärt tal. Varje tecken på tangentbordet har ett motsvarande ASCII-värde.
Bild- och ljud- och videokodning
Bild- och ljud- och videokodning utförs för att spara lagringsutrymme. En mediefil som bild, ljud och video kodas för att spara dem i ett mer effektivt och komprimerat format.
Dessa kodade filer innehåller samma innehåll med vanligtvis liknande kvalitet, men i komprimerad storlek, så att de kan sparas på mindre utrymme, enkelt kan överföras via e-post eller kan laddas ner på systemet.
Vi kan förstå det som en . WAV-ljudfilen konverteras till .MP3-fil för att minska storleken med 1/10thtill sin ursprungliga storlek.