Znakové asci kódy. Kódování ASCII (americký standardní kód pro výměnu informací) - základní kódování textu pro latinku
Každý počítač má svou vlastní znakovou sadu, kterou implementuje. Taková sada obsahuje 26 velkých a malých písmen, číslic a speciálních znaků (tečka, mezera atd.). Symboly při převodu na celá čísla se nazývají kódy. Standardy byly vyvinuty tak, aby počítače měly stejné sady kódů.
standard ASCII
ASCII (American Standard Code for Inmormation Interchange) je americký standardní kód pro výměnu informací. Každý znak ASCII má 7 bitů, takže maximální počet znaků je 128 (tabulka 1). Kódy 0 až 1F jsou řídicí znaky, které se netisknou. K přenosu dat je potřeba mnoho netisknutelných znaků ASCII. Zpráva se může například skládat z počátečního znaku záhlaví SOH, samotného záhlaví a počátečního znaku textu STX, samotného textu a koncového znaku textu ETX a koncového znaku přenosu EOT. Data se však po síti přenášejí v paketech, které samy odpovídají za začátek a konec přenosu. Takže netisknutelné znaky se téměř nepoužívají.
Tabulka 1 - Tabulka kódů ASCII
Číslo | tým | Význam | Číslo | tým | Význam |
---|---|---|---|---|---|
0 | NUL | nulový ukazatel | 10 | DLE | Opuštění přenosové soustavy |
1 | SOH | začátek záhlaví | 11 | DC1 | Správa zařízení |
2 | STX | Začátek textu | 12 | DC2 | Správa zařízení |
3 | ETX | Konec textu | 13 | DC3 | Správa zařízení |
4 | EOT | Konec přenosu | 14 | DC4 | Správa zařízení |
5 | ACK | Žádost | 15 | NAK | Nepotvrzení přijetí |
6 | BEL | Potvrzení přijetí | 16 | SYN | Jednoduchý |
7 | BS | Symbol zvonu | 17 | ETB | Konec bloku přenosu |
8 | HT | Odsadit zpět | 18 | UMĚT | označit |
9 | LF | Vodorovná karta | 19 | EM | Konec médií |
A | VT | Překlad řádků | 1A | SUB | dolní index |
B | FF | Vertikální záložka | 1B | ESC | Výstup |
C | ČR | Překlad stránky | 1C | FS | Oddělovač souborů |
D | TAK | Návrat vozíku | 1D | GS | Oddělovač skupin |
E | SI | Přechod na další registr | 1E | RS | Oddělovač záznamů |
SI | Přechod na standardní případ | 1F | NÁS | Oddělovač modulů |
Číslo | Symbol | Číslo | Symbol | Číslo | Symbol | Číslo | Symbol | Číslo | Symbol | Číslo | Symbol |
---|---|---|---|---|---|---|---|---|---|---|---|
20 | prostor | 30 | 0 | 40 | @ | 50 | P | 60 | . | 70 | p |
21 | ! | 31 | 1 | 41 | A | 51 | Q | 61 | A | 71 | q |
22 | ‘ | 32 | 2 | 42 | B | 52 | R | 62 | b | 72 | r |
23 | # | 33 | 3 | 43 | C | 53 | S | 63 | C | 73 | s |
24 | φ | 34 | 4 | 44 | D | 54 | T | 64 | d | 74 | t |
25 | % | 35 | 5 | 45 | E | 55 | A | 65 | E | 75 | A |
26 | & | 36 | 6 | 46 | F | 56 | PROTI | 66 | F | 76 | proti |
27 | ‘ | 37 | 7 | 47 | G | 57 | W | 67 | G | 77 | w |
28 | ( | 38 | 8 | 48 | H | 58 | X | 68 | h | 78 | X |
29 | ) | 39 | 9 | 49 | já | 59 | Y | 69 | i | 70 | y |
2A | ‘ | 3A | ; | 4A | J | 5A | Z | 6A | j | 7A | z |
2B | + | 3B | ; | 4B | K | 5B | [ | 6B | k | 7B | { |
2C | ‘ | 3C | < | 4C | L | 5C | \ | 6C | l | 7C | | |
2D | — | 3D | = | 4D | M | 5 D | ] | 6D | m | 7D | } |
2E | 3E | > | 4E | N | 5E | — | 6E | n | 7E | ~ | |
2F | / | 3F | G | 4F | Ó | 5F | _ | 6F | Ó | 7F | DEL |
Standard Unicode
Předchozí kódování je skvělé pro angličtinu, ale není vhodné pro jiné jazyky. Například němčina má přehlásky, zatímco francouzština má akcenty. Některé jazyky mají úplně jiné abecedy. Prvním pokusem o rozšíření ASCII byl IS646, který rozšířil předchozí kódování o dalších 128 znaků. Latinská písmena byla přidána s tahy a diakritikou a byla nazvána - Latin 1. Dalším pokusem byl IS 8859 - který obsahoval kódovou stránku. Stále existovaly pokusy o rozšíření, ale nebylo to univerzální. Bylo vytvořeno kódování UNICODE (je 10646). Myšlenkou kódování je přiřadit každému znaku jednu konstantní 16bitovou hodnotu, která se nazývá - ukazatel kódu. Celkem je získáno 65536 ukazatelů. Abychom ušetřili místo, použili jsme Latin-1 pro kódy 0-255, snadno jsme změnili ASII na UNICODE. Tento standard vyřešil mnoho problémů, ale ne všechny. V souvislosti s příchodem nových slov, např. pro japonštinu, je potřeba navýšit počet výrazů o cca 20 tis.. Dále je potřeba povolit Braillovo písmo.
[8bitové kódování: ASCII, KOI-8R a CP1251] První kódovací tabulky vytvořené v USA nepoužívaly osmý bit v bajtu. Text byl prezentován jako sekvence bajtů, ale s osmým bitem se nepočítalo (byl použit pro oficiální účely).
Stůl se stal uznávaným standardem. ASCII(Americký standardní kód pro výměnu informací). Prvních 32 znaků ASCII tabulky (00 až 1F) bylo použito pro netisknutelné znaky. Byly určeny k ovládání tiskového zařízení a podobně. Zbytek - od 20 do 7F - jsou běžné (tisknutelné) znaky.
Tabulka 1 - Kódování ASCII
|
|
Jak můžete snadno vidět, v tomto kódování jsou zastoupena pouze latinská písmena a ta, která se používají v angličtině. Jsou zde také aritmetické a další servisní symboly. Ale neexistují žádná ruská písmena nebo dokonce speciální latinská písmena pro němčinu nebo francouzštinu. To se dá snadno vysvětlit – kódování bylo vyvinuto jako americký standard. Když se po celém světě začaly používat počítače, bylo potřeba zakódovat další znaky.
K tomu bylo rozhodnuto použít osmý bit v každém bajtu. Bylo tedy k dispozici 128 dalších hodnot (od 80 do FF), které bylo možné použít ke kódování znaků. První z osmibitových tabulek je „extended ASCII“ ( rozšířené ASCII) - zahrnoval různé varianty latinských znaků používaných v některých jazycích západní Evropy. Měl také další další znaky, včetně pseudografiky.
Pseudografické znaky umožňují zobrazením pouze textových znaků poskytnout určitou podobu grafiky. Pomocí pseudografiky funguje například program pro správu souborů FAR Manager.
V rozšířené ASCII tabulce nebyla žádná ruská písmena. V Rusku (dříve SSSR) a v dalších státech byla vytvořena vlastní kódování, která umožnila reprezentovat specifické „národní“ znaky v 8bitových textových souborech - latinská písmena polského a českého jazyka, azbuka (včetně ruských písmen) a další abecedy.
Ve všech kódováních, která se rozšířila, je prvních 127 znaků (tj. bajtové hodnoty s osmým bitem rovným 0) stejných jako ASCII. Soubor ASCII tedy funguje v kterémkoli z těchto kódování; písmena anglického jazyka jsou zastoupena stejným způsobem.
Organizace ISO(International Standardization Organization - International Organization for Standards) přijala skupinu norem ISO 8859. Definuje 8bitové kódování pro různé skupiny jazyků. ISO 8859-1 je tedy rozšířená ASCII tabulka pro USA a západní Evropu. A ISO 8859-5 je tabulka pro azbuku (včetně ruštiny).
Z historických důvodů se však kódování ISO 8859-5 neujalo. Ve skutečnosti se pro ruský jazyk používají následující kódování:
Kódová stránka 866 ( CP866), je také „DOS“, je také „alternativní kódování GOST“. Široce používané až do poloviny 90. let; nyní v omezeném používání. Pro distribuci textů na internetu se prakticky nepoužívá.
- KOI-8. Vyvinuto v 70. a 80. letech. Je to obecně uznávaný standard pro odesílání poštovních zpráv na ruském internetu. Je také široce používán v operačních systémech rodiny Unix, včetně Linuxu. Verze KOI-8, určená pro ruštinu, se nazývá KOI-8R; existují verze pro jiné cyrilické jazyky (například KOI8-U je varianta pro ukrajinský jazyk).
- Kódová stránka 1251, CP1251, Windows-1251. Vyvinutý společností Microsoft pro podporu ruského jazyka v systému Windows.
Hlavní výhodou CP866 bylo zachování pseudografických znaků na stejných místech jako v Extended ASCII; cizí textové programy, například slavný Norton Commander, tedy mohly fungovat beze změn. CP866 se v současnosti používá pro programy Windows běžící v textových oknech nebo v textovém režimu na celou obrazovku, včetně FAR Manageru.
Texty v CP866 jsou v posledních letech poměrně vzácné (ale používá se ke kódování ruských názvů souborů ve Windows). Proto se zastavíme u dalších dvou kódování - KOI-8R a CP1251.
Jak vidíte, v kódovací tabulce CP1251 jsou ruská písmena uspořádána v abecedním pořadí (s výjimkou písmene YO). Toto uspořádání velmi usnadňuje abecední řazení počítačových programů.
Ale v KOI-8R se pořadí ruských písmen zdá náhodné. Ale ve skutečnosti tomu tak není.
V mnoha starších programech se při zpracování nebo přenosu textu ztrácel 8. bit. (Nyní jsou takové programy prakticky „vymřelé“, ale koncem 80. a začátkem 90. let byly rozšířeny). Chcete-li získat 7bitovou hodnotu od 8bitové hodnoty, stačí odečíst 8 od číslice vyššího řádu; například E1 se změní na 61.
Nyní porovnejte KOI-8R s ASCII tabulkou (tabulka 1). Zjistíte, že ruská písmena jsou v přísném souladu s latinskými. Pokud osmý bit zmizí, změní se malá ruská písmena na velká písmena latinky a velká ruská písmena na malá latinka. Takže E1 v KOI-8 je ruské „A“, zatímco 61 v ASCII je latinské „a“.
KOI-8 vám tedy umožňuje zachovat čitelnost ruského textu se ztrátou 8. bitu. „Ahoj všichni“ se změní na „pRIWET WSEM“.
V poslední době ztratilo rozhodující význam jak abecední pořadí znaků v kódovací tabulce, tak čitelnost se ztrátou 8. bitu. Osmý bit se v moderních počítačích neztrácí ani při přenosu, ani při zpracování. A abecední řazení se provádí s přihlédnutím ke kódování a ne k jednoduchému porovnání kódů. (Mimochodem, kódy CP1251 nejsou úplně abecedně seřazeny - písmeno Y není na svém místě).
Vzhledem k tomu, že existovala dvě běžná kódování, při práci s internetem (pošta, procházení webových stránek) se někdy místo ruského textu zobrazí nesmyslná sada písmen. Například „Jsem SBYFEMHEL“. Jsou to jen slova "s úctou"; ale byly zakódovány v kódování CP1251 a počítač dekódoval text podle tabulky KOI-8. Pokud by stejná slova byla naopak zakódována v KOI-8 a počítač dekódoval text podle tabulky CP1251, výsledek by byl „U HCHBTSEOEN“.
Někdy se stane, že počítač dešifruje ruská písmena a dokonce i podle tabulky, která není určena pro ruský jazyk. Pak se místo ruských písmen objeví nesmyslná sada znaků (například latinská písmena východoevropských jazyků); často se jim říká „krokos“.
Ve většině případů si moderní programy zvládnou určit kódování internetových dokumentů (e-mailů a webových stránek) samy. Někdy však „selhají“ a pak můžete vidět podivné sekvence ruských písmen nebo „krokodýla“. Pro zobrazení skutečného textu v takové situaci zpravidla stačí kódování vybrat ručně v nabídce programu.
Pro článek byly použity informace ze stránky http://open-office.edusite.ru/TextProcessor/p5aa1.html.
Materiál převzatý z webu:
Excel pro Office 365 Word pro Office 365 Outlook pro Office 365 PowerPoint pro Office 365 Publisher pro Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 7 Access One 7 Publisher 2007 Visio 20 Outlook 2007 Visio 20 PowerPoint 20 Office 2007 2010 Visio Standard 2007 Visio Standard 2010 Méně
V tomto článku
Vložení znaku ASCII nebo Unicode do dokumentu
Pokud potřebujete zadat pouze několik speciálních znaků nebo symbolů, můžete použít klávesové zkratky nebo . Seznam znaků ASCII naleznete v následujících tabulkách nebo v článku Vkládání národních abeced pomocí klávesových zkratek .
Poznámky:
Vkládání znaků ASCII
Chcete-li vložit znak ASCII, stiskněte a podržte klávesu ALT při zadávání kódu znaku. Chcete-li například vložit symbol stupně (º), stiskněte a podržte klávesu ALT a poté na numerické klávesnici zadejte 0176.
K zadávání čísel použijte numerickou klávesnici, nikoli čísla na hlavní klávesnici. Pokud potřebujete zadávat čísla na numerické klávesnici, ujistěte se, že svítí indikátor NUM LOCK.
Vkládání znaků Unicode
Chcete-li vložit znak Unicode, zadejte kód znaku a poté postupně stiskněte ALT + X. Chcete-li například vložit znak dolaru ($), zadejte 0024 a postupně stiskněte ALT + X. Všechny kódy znaků Unicode viz .
Důležité: Některé programy sady Microsoft Office, například PowerPoint a InfoPath, nepodporují převod kódů Unicode na znaky. Pokud potřebujete vložit znak Unicode do jednoho z těchto programů, použijte .
Poznámky:
Pokud se po stisknutí ALT+X zobrazí nesprávný znak Unicode, vyberte správný kód a znovu stiskněte ALT+X.
Kromě toho musíte před kód zadat „U+“. Například zadáním „1U+B5“ a stisknutím ALT+X se zobrazí text „1µ“, zatímco zadáním „1B5“ a stisknutím ALT+X se zobrazí znak „Ƶ“.
Použití tabulky symbolů
Tabulka znaků je program zabudovaný do systému Microsoft Windows, který umožňuje zobrazit znaky dostupné pro vybrané písmo.
Pomocí tabulky symbolů můžete zkopírovat jednotlivé znaky nebo skupinu znaků do schránky a vložit je do libovolného programu, který podporuje zobrazení těchto znaků. Otevření tabulky symbolů
V systému Windows 10 Do vyhledávacího pole na hlavním panelu zadejte slovo „symbol“ a z výsledků vyhledávání vyberte tabulku symbolů.
V systému Windows 8 Na domovské obrazovce zadejte slovo „symbol“ a z výsledků vyhledávání vyberte tabulku symbolů.
V systému Windows 7 zmáčknout tlačítko Start, vyberte postupně Všechny programy, Standard, Servis a klikněte tabulka symbolů.
Znaky jsou seskupeny podle písma. Klepnutím na seznam písem vyberte příslušnou znakovou sadu. Chcete-li vybrat symbol, klikněte na něj a poté klikněte na tlačítko Vybrat. Chcete-li vložit symbol, klepněte pravým tlačítkem na požadované místo v dokumentu a vyberte Vložit.
Často používané kódy znaků
Úplný seznam znaků naleznete na počítači v tabulce kódů znaků ASCII nebo v tabulkách znaků Unicode seřazených podle sad .
Glyph |
Glyph |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Peněžní jednotky |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
zákonné symboly |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Matematické symboly |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Zlomky |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Interpunkční a dialektové symboly |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Symboly tvarů |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Kódy pro běžně používanou diakritikuÚplný seznam glyfů a odpovídajících kódů viz .
|
prosinec | hex | Symbol | prosinec | hex | Symbol | |
000 | 00 | specialista. NOP | 128 | 80 | Ђ | |
001 | 01 | specialista. SOH | 129 | 81 | Ѓ | |
002 | 02 | specialista. STX | 130 | 82 | ‚ | |
003 | 03 | specialista. ETX | 131 | 83 | ѓ | |
004 | 04 | specialista. EOT | 132 | 84 | „ | |
005 | 05 | specialista. ENQ | 133 | 85 | … | |
006 | 06 | specialista. ACK | 134 | 86 | † | |
007 | 07 | specialista. BEL | 135 | 87 | ‡ | |
008 | 08 | specialista. BS | 136 | 88 | € | |
009 | 09 | specialista. TAB | 137 | 89 | ‰ | |
010 | 0A | specialista. LF | 138 | 8A | Љ | |
011 | 0B | specialista. VT | 139 | 8B | ‹ ‹ | |
012 | 0C | specialista. FF | 140 | 8C | Њ | |
013 | 0D | specialista. ČR | 141 | 8D | Ќ | |
014 | 0E | specialista. TAK | 142 | 8E | Ћ | |
015 | 0F | specialista. SI | 143 | 8F | Џ | |
016 | 10 | specialista. DLE | 144 | 90 | ђ | |
017 | 11 | specialista. DC1 | 145 | 91 | ‘ | |
018 | 12 | specialista. DC2 | 146 | 92 | ’ | |
019 | 13 | specialista. DC3 | 147 | 93 | “ | |
020 | 14 | specialista. DC4 | 148 | 94 | ” | |
021 | 15 | specialista. NAK | 149 | 95 | ||
022 | 16 | specialista. SYN | 150 | 96 | – | |
023 | 17 | specialista. ETB | 151 | 97 | — | |
024 | 18 | specialista. UMĚT | 152 | 98 | ||
025 | 19 | specialista. EM | 153 | 99 | ™ | |
026 | 1A | specialista. SUB | 154 | 9A | љ | |
027 | 1B | specialista. ESC | 155 | 9B | › | |
028 | 1C | specialista. FS | 156 | 9C | њ | |
029 | 1D | specialista. GS | 157 | 9D | ќ | |
030 | 1E | specialista. RS | 158 | 9E | ћ | |
031 | 1F | specialista. NÁS | 159 | 9F | џ | |
032 | 20 | spojka SP (vesmír) | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | " | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | " | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Jo | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | AA | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | AC | ¬ | |
045 | 2D | - | 173 | INZERÁT | | |
046 | 2E | . | 174 | AE | ® | |
047 | 2F | / | 175 | AF | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | jo | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3A | : | 186 | BA | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | před naším letopočtem | ј | |
061 | 3D | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | BÝT | ѕ | |
063 | 3F | ? | 191 | bf | ї | |
064 | 40 | @ | 192 | C0 | A | |
065 | 41 | A | 193 | C1 | B | |
066 | 42 | B | 194 | C2 | V | |
067 | 43 | C | 195 | C3 | G | |
068 | 44 | D | 196 | C4 | D | |
069 | 45 | E | 197 | C5 | E | |
070 | 46 | F | 198 | C6 | A | |
071 | 47 | G | 199 | C7 | W | |
072 | 48 | H | 200 | C8 | A | |
073 | 49 | já | 201 | C9 | Y | |
074 | 4A | J | 202 | CA | NA | |
075 | 4B | K | 203 | CB | L | |
076 | 4C | L | 204 | CC | M | |
077 | 4D | M | 205 | CD | H | |
078 | 4E | N | 206 | CE | O | |
079 | 4F | Ó | 207 | CF | P | |
080 | 50 | P | 208 | D0 | R | |
081 | 51 | Q | 209 | D1 | S | |
082 | 52 | R | 210 | D2 | T | |
083 | 53 | S | 211 | D3 | Na | |
084 | 54 | T | 212 | D4 | F | |
085 | 55 | U | 213 | D5 | X | |
086 | 56 | PROTI | 214 | D6 | C | |
087 | 57 | W | 215 | D7 | H | |
088 | 58 | X | 216 | D8 | W | |
089 | 59 | Y | 217 | D9 | SCH | |
090 | 5A | Z | 218 | DA | Kommersant | |
091 | 5B | [ | 219 | D.B. | S | |
092 | 5C | \ | 220 | DC | b | |
093 | 5 D | ] | 221 | DD | E | |
094 | 5E | ^ | 222 | DE | YU | |
095 | 5F | _ | 223 | D.F. | já | |
096 | 60 | ` | 224 | E0 | A | |
097 | 61 | A | 225 | E1 | b | |
098 | 62 | b | 226 | E2 | PROTI | |
099 | 63 | C | 227 | E3 | G | |
100 | 64 | d | 228 | E4 | d | |
101 | 65 | E | 229 | E5 | E | |
102 | 66 | F | 230 | E6 | a | |
103 | 67 | G | 231 | E7 | h | |
104 | 68 | h | 232 | E8 | A | |
105 | 69 | i | 233 | E9 | čt | |
106 | 6A | j | 234 | EA | Na | |
107 | 6B | k | 235 | EB | l | |
108 | 6C | l | 236 | EU | m | |
109 | 6D | m | 237 | ED | n | |
110 | 6E | n | 238 | EE | Ó | |
111 | 6F | Ó | 239 | EF | P | |
112 | 70 | p | 240 | F0 | R | |
113 | 71 | q | 241 | F1 | S | |
114 | 72 | r | 242 | F2 | T | |
115 | 73 | s | 243 | F3 | na | |
116 | 74 | t | 244 | F4 | F | |
117 | 75 | u | 245 | F5 | X | |
118 | 76 | proti | 246 | F6 | C | |
119 | 77 | w | 247 | F7 | h | |
120 | 78 | X | 248 | F8 | w | |
121 | 79 | y | 249 | F9 | sch | |
122 | 7A | z | 250 | FA | b | |
123 | 7B | { | 251 | s | ||
124 | 7C | | | 252 | FC | b | |
125 | 7D | } | 253 | FD | uh | |
126 | 7E | ~ | 254 | F.E. | Yu | |
127 | 7F | Specialista. DEL | 255 | FF | já |
ASCII tabulka kódů znaků Windows.
Popis speciálních (řídících) znaků
Je třeba poznamenat, že zpočátku byly řídicí znaky ASCII tabulky používány k výměně dat pomocí dálnopisu, vstupu dat z děrné pásky a k nejjednoduššímu ovládání externích zařízení. V současné době již většina řídicích znaků ASCII tabulky tuto zátěž nenese a lze je použít pro jiné účely.
Kód | Popis |
---|---|
NUL, 00 | Nulové, prázdné |
SO-01 | Začátek Okruhu |
STX 02 | Začátek TeXtu, začátek textu. |
ETX 03 | Konec TeXtu |
EOT, 04 | Konec přenosu |
ENQ, 05 | Zeptejte se. Prosím potvrďte |
ACK, 06 | Potvrzení. Potvrzuji |
B.E.L. 07 | Bell, zavolej |
B.S. 08 | Backspace, návrat o jeden znak zpět |
TAB, 09 | Karta, vodorovná karta |
LF, 0A | Line Feed, line feed. Nyní se ve většině programovacích jazyků označuje jako \n |
VT, 0B | Vertical Tab, vertikální tabulka. |
FF, 0C | Zdroj formuláře, zdroj stránky, nová stránka |
ČR, 0D | Návrat vozíku Nyní se ve většině programovacích jazyků označuje jako \r |
TAK, 0E | Shift Out, změňte barvu barvicí pásky v tiskárně |
SI, 0F | Shift In, vrátí barvu barvicí pásky v tiskovém zařízení zpět |
DLE, 10 | Data Link Escape, přepnutí kanálu na přenos dat |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Ovládání zařízení, symboly ovládání zařízení |
N.A.K. 15 | Negativní potvrzení, nepotvrzuji. |
SYN, 16 | synchronizace. Symbol synchronizace |
ETB, 17 | Konec textového bloku, konec textového bloku |
CAN, 18 | Storno, zrušení dříve prošlé |
EM, 19 | Konec média |
SUB, 1A | Náhradník, náhradník. Umístěno na místo znaku, jehož hodnota byla ztracena nebo poškozena během přenosu |
ESC, 1B | Escape escape sekvence |
FS, 1C | Oddělovač souborů, oddělovač souborů |
GS, 1D | Oddělovač skupin, oddělovač skupin |
RS, 1E | Oddělovač záznamů |
USA, 1F | Unit Separator, unit separator |
DEL, 7F | Smazat, smazat poslední znak. |
Sada symbolů používaných k psaní textu se nazývá abecedně.
Počet znaků v abecedě je Napájení.
Vzorec pro určení množství informací: N = 2b,
kde N je mohutnost abecedy (počet symbolů),
b je počet bitů (informační váha symbolu).
Téměř všechny potřebné znaky lze umístit do abecedy s kapacitou 256 znaků. Tato abeceda se nazývá dostatečný.
Protože 256 = 2 8 , pak váha 1 znaku je 8 bitů.
8bitová měrná jednotka dostala název 1 bajt:
1 bajt = 8 bitů.
Binární kód každého znaku v počítačovém textu zabírá 1 bajt paměti.
Jak jsou textové informace reprezentovány v paměti počítače?
Pohodlí bajtového kódování znaků je zřejmé, protože bajt je nejmenší adresovatelná část paměti, a proto může procesor při zpracování textu přistupovat ke každému znaku zvlášť. Na druhou stranu je 256 znaků dostačující pro reprezentaci široké škály informací o znacích.
Nyní vyvstává otázka, který osmibitový binární kód vložit do korespondence s každým znakem.
Je jasné, že jde o podmíněnou záležitost, můžete přijít na mnoho způsobů kódování.
Všechny znaky počítačové abecedy jsou číslovány od 0 do 255. Každému číslu odpovídá osmibitový binární kód od 00000000 do 11111111. Tento kód je jednoduše pořadové číslo znaku v binární číselné soustavě.
Tabulka, ve které jsou všem znakům počítačové abecedy přiřazena pořadová čísla, se nazývá kódovací tabulka.
Pro různé typy počítačů se používají různé kódovací tabulky.
Stůl se stal mezinárodním standardem pro PC. ASCII(vyslovuje se asci) (Americký standardní kód pro výměnu informací).
Tabulka ASCII kódů je rozdělena na dvě části.
Mezinárodním standardem je pouze první polovina tabulky, tzn. znaky s čísly od 0 (00000000), až 127 (01111111).
Struktura kódovací tabulky ASCII
Sériové číslo |
Kód |
Symbol |
0 - 31 |
00000000 - 00011111 |
Znaky s čísly od 0 do 31 se nazývají řídicí znaky. |
32 - 127 |
00100000 - 01111111 |
Standardní část tabulky (anglicky). To zahrnuje malá a velká písmena latinské abecedy, desetinné číslice, interpunkční znaménka, všechny druhy hranatých závorek, obchodní a další symboly. |
128 - 255 |
10000000 - 11111111 |
Alternativní část tabulky (ruština). |
První polovina tabulky kódů ASCII
Upozorňuji na skutečnost, že v tabulce kódování jsou písmena (velká a malá) uspořádána v abecedním pořadí a čísla jsou seřazeny vzestupně podle hodnot. Toto dodržování lexikografického řádu v uspořádání znaků se nazývá princip sekvenčního kódování abecedy.
U písmen ruské abecedy je také dodržován princip sekvenčního kódování.
Druhá polovina tabulky kódů ASCII
Bohužel v současné době existuje pět různých kódování azbuky (KOI8-R, Windows, MS-DOS, Macintosh a ISO). Z tohoto důvodu často vznikají problémy s přenosem ruského textu z jednoho počítače do druhého, z jednoho softwarového systému do druhého.
Chronologicky byl jedním z prvních standardů pro kódování ruských písmen na počítačích KOI8 ("Information Exchange Code, 8-bit"). Toto kódování se používalo již v 70. letech na počítačích řady počítačů EC a od poloviny 80. let se začalo používat v prvních rusifikovaných verzích operačního systému UNIX.
Od počátku 90. let, doby dominance operačního systému MS DOS, zůstává kódování CP866 ("CP" znamená "Code Page", "code page").
Počítače Apple s operačním systémem Mac OS používají vlastní kódování Mac.
Kromě toho Mezinárodní organizace pro normalizaci (International Standards Organization, ISO) schválila další kódování nazvané ISO 8859-5 jako standard pro ruský jazyk.
Nejběžnějším aktuálně používaným kódováním je Microsoft Windows, zkráceně CP1251.
Od konce 90. let byl problém standardizace kódování znaků řešen zavedením nového mezinárodního standardu, tzv. Unicode. Jedná se o 16bitové kódování, tzn. má 2 bajty paměti na znak. V tomto případě se samozřejmě množství obsazené paměti zvýší dvakrát. Ale taková kódová tabulka umožňuje zahrnutí až 65536 znaků. Kompletní specifikace standardu Unicode zahrnuje všechny existující, zaniklé a uměle vytvořené abecedy světa a také mnoho matematických, hudebních, chemických a dalších symbolů.
Zkusme si pomocí ASCII tabulky představit, jak budou slova vypadat v paměti počítače.
Vnitřní reprezentace slov v paměti počítače
Někdy se stává, že text, který se skládá z písmen ruské abecedy, přijatý z jiného počítače, nelze přečíst - na obrazovce monitoru je vidět nějaký druh "abracadabra". To je způsobeno skutečností, že počítače používají různá kódování znaků ruského jazyka.