ComputersInformatietechnologie

Codering van tekstinformatie in de computer

Computer - een geavanceerd apparaat waarmee u kunt maken, converteren en opslaan van informatie. Echter, de computer niet erg begrijpelijke manier voor ons werken - grafisch, tekst en numerieke gegevens worden opgeslagen als binaire arrays getallen. In dit artikel zullen we kijken naar hoe de codering van de tekstinformatie.

Wat voor ons is de tekst van een computer - een reeks tekens. Elk symbool staat voor een bepaalde reeks van nullen en enen. Onder de symbolen betekende niet alleen hoofdletters en kleine letters van het Latijnse alfabet, maar ook leestekens, rekenkundige tekens, speciale tekens, speciale symbolen en zelfs de ruimte.

Binaire codering van tekstuele informatie

Door het indrukken van een bepaalde toets van het inwendige controller zendt een elektrisch signaal dat wordt omgezet in een binaire code. Code is gekoppeld aan een bepaald symbool, die op het scherm wordt weergegeven. Voor indiening bij het Latijnse alfabet in een digitaal formaat ASCII codering internationale systeem is gemaakt. Het vereist 1 byte voor het opnemen van één symbool bestaat dus uit acht symboolreeks van nullen en enen. Het opname-interval - van 00000000 tot 11111111, dat wil zeggen codering van tekst informatie met behulp van dit systeem stelt ons in staat om 256 tekens vertegenwoordigen. In de meeste gevallen is dit voldoende.

ASCII is verdeeld in twee delen. De eerste 127 tekens (00.000.000-01.111.111) zijn internationale en zijn specifieke symbolen en letters van het Engels alfabet. Het tweede deel - de uitbreiding (10.000.000-11.111.111) - is bedoeld om de nationale alfabet, het schrijven van die verschillend is van het Latijnse vertegenwoordigen.

Encoding tekstinformatie in ASCII is gebaseerd op het principe van toenemende volgorde, dat wil zeggen, hoe groter het volgnummer van letters, hoe groter de waarde van de ASCII-code. Figuren en Russische deel van de tabel zijn gebaseerd op hetzelfde principe.

Echter, in de wereld zijn er verschillende soorten codering voor Cyrillische letters. De meest voorkomende - is KOI-8 (acht-bit codering die voor gebruikt is in de jaren '70 in de eerste ruifitsirovannyh Unix-besturingssysteem), ISO 8859-5 (ontwikkeld door de International Standardization Bureau), de CP 1251 (codering tekstuele informatie gebruikt in de modern OS Windows), evenals 2-byte codering van Unicode, die kan worden gebruikt om 65.536 personages te introduceren. Zoveel verschillende coderingen vanwege het feit dat deze zijn gevormd op verschillende tijdstippen voor verschillende besturingssystemen en andere overwegingen. Vanwege dit, hebben het vaak moeilijk bij het overbrengen van de tekst van het ene medium naar het andere - van een mismatch die coderen voor de gebruiker zal een reeks van verwarrende iconen te zien. Hoe kan ik deze situatie op te lossen? In Word, bijvoorbeeld wanneer een document wordt geopend, wordt een bericht over problemen met tekst display en biedt verschillende opties voor het transcoderen.

Zo, codering en verwerking van tekstuele informatie in de darmen van de computer - het proces is moeilijk en tijdrovend georganiseerd. Alle symbolen van elke alfabet slechts een bepaalde reeks cijfers binaire systeem één cel - dit is één byte aan informatie.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 birmiss.com. Theme powered by WordPress.