Karakter asci kodları. ASCII kodlaması (bilgi alışverişi için Amerikan standart kodu) - Latince için temel metin kodlaması
Her bilgisayarın uyguladığı kendi karakter seti vardır. Böyle bir set 26 adet büyük ve küçük harf, rakam ve özel karakter (nokta, boşluk vb.) içerir. Tam sayılara çevrilen sembollere kod adı verilir. Bilgisayarların aynı kod setine sahip olması için standartlar geliştirildi.
ASCII standardıASCII (Amerikan Bilgi Değişimi Standart Kodu), bilgi alışverişi için Amerikan standart kodudur. Her ASCII karakterinin 7 biti vardır, dolayısıyla maksimum karakter sayısı 128'dir (Tablo 1). 0 ile 1F arasındaki kodlar yazdırılmayan kontrol karakterleridir. Veri aktarımı için çok sayıda yazdırılamayan ASCII karaktere ihtiyaç vardır. Örneğin, bir mesaj başlık başlangıç karakteri SOH, başlığın kendisi ve metin başlangıç karakteri STX, metnin kendisi ve metin bitiş karakteri ETX ve iletim bitiş karakteri EOT'den oluşabilir. Ancak veriler ağ üzerinden aktarımın başlangıcından ve bitişinden kendileri sorumlu olan paketler halinde iletilir. Yani yazdırılamayan karakterler neredeyse hiç kullanılmaz.
Tablo 1 - ASCII kod tablosu
0 | BOŞ | boş işaretçisi | 10 | DLE | İletim sisteminden çıkma |
1 | SOH | başlık başlangıcı | 11 | DC1 | Cihaz yönetimi |
2 | STX | Metnin başlangıcı | 12 | DC2 | Cihaz yönetimi |
3 | ETX | Metnin sonu | 13 | DC3 | Cihaz yönetimi |
4 | EOT | İletimin sonu | 14 | DC4 | Cihaz yönetimi |
5 | ACK | Rica etmek | 15 | NAK | Resepsiyonun onaylanmaması |
6 | BEL | Kabul onayı | 16 | SEN | Basit |
7 | BS | Çan sembolü | 17 | ETB | İletim bloğunun sonu |
8 | HT | Geri girinti | 18 | OLABİLMEK | işaret |
9 | LF | Yatay sekme | 19 | EM | Medya Sonu |
A | VT | Satır çevirisi | 1 A | ALT | alt simge |
B | FF | Dikey sekme | 1B | ESC | çıkış |
C | CR | Sayfa çevirisi | 1C | FS | Dosya ayırıcı |
D | BU YÜZDEN | Satırbaşı | 1 boyutlu | GS | Grup ayırıcı |
e | Sİ | Ek bir kayda geçiş | 1E | RS | Kayıt ayırıcı |
Sİ | Standart kasaya geçiş | 1F | BİZ | Modül ayırıcı |
20 | uzay | 30 | 0 | 40 | @ | 50 | P | 60 | . | 70 | P |
21 | ! | 31 | 1 | 41 | A | 51 | Q | 61 | A | 71 | Q |
22 | ‘ | 32 | 2 | 42 | B | 52 | R | 62 | B | 72 | R |
23 | # | 33 | 3 | 43 | C | 53 | S | 63 | C | 73 | S |
24 | φ | 34 | 4 | 44 | D | 54 | T | 64 | D | 74 | T |
25 | % | 35 | 5 | 45 | e | 55 | VE | 65 | e | 75 | Ve |
26 | & | 36 | 6 | 46 | F | 56 | V | 66 | F | 76 | v |
27 | ‘ | 37 | 7 | 47 | G | 57 | K | 67 | G | 77 | w |
28 | ( | 38 | 8 | 48 | H | 58 | X | 68 | H | 78 | X |
29 | ) | 39 | 9 | 49 | BEN | 59 | e | 69 | Ben | 70 | sen |
2A | ‘ | 3 A | ; | 4A | J | 5A | Z | 6A | J | 7A | z |
2B | + | 3B | ; | 4B | k | 5B | [ | 6B | k | 7B | { |
2C | ‘ | 3C | < | 4C | L | 5C | \ | 6C | ben | 7C | | |
2 boyutlu | — | 3 boyutlu | = | 4 boyutlu | M | 5 boyutlu | ] | 6 boyutlu | M | 7 boyutlu | } |
2E | 3E | > | 4E | N | 5E | — | 6E | N | 7E | ~ | |
2F | / | 3F | G | 4F | Ö | 5F | _ | 6F | Ö | 7F | DEL |
Önceki kodlama İngilizce için harikadır ancak diğer diller için uygun değildir. Örneğin, Almanca'da çift nokta işaretleri varken, Fransızca'da aksan vardır. Bazı dillerin tamamen farklı alfabeleri vardır. ASCII'yi genişletmeye yönelik ilk girişim, önceki kodlamayı 128 karakter daha genişleten IS646 idi. Latin harfleri vuruşlar ve aksanlarla eklendi ve Latince 1 olarak adlandırıldı. Bir sonraki girişim, bir kod sayfası içeren IS 8859'du. Hala genişleme girişimleri vardı, ancak bu evrensel değildi. UNICODE kodlaması (10646'dır) oluşturuldu. Kodlamanın amacı, her karaktere kod işaretçisi adı verilen tek bir sabit 16 bitlik değer atamaktır. Toplamda 65536 işaretçi elde ediliyor. Yerden tasarruf etmek için 0-255 kodları için Latin-1'i kullandık, ASII'yi kolayca UNICODE olarak değiştirdik. Bu standart birçok sorunu çözdü, ancak hepsini değil. Örneğin Japonca için yeni kelimelerin gelmesiyle bağlantılı olarak terim sayısını yaklaşık 20 bin artırmak gerekiyor, ayrıca Braille alfabesini de etkinleştirmeniz gerekiyor.
[8 bit kodlamalar: ASCII, KOI-8R ve CP1251] ABD'de oluşturulan ilk kodlama tabloları bayttaki sekizinci biti kullanmıyordu. Metin bir bayt dizisi olarak sunuldu, ancak sekizinci bit dikkate alınmadı (resmi amaçlarla kullanıldı).
ASCII tablosu (Bilgi Değişimi için Amerikan Standart Kodu) genel olarak tanınan bir standart haline geldi. ASCII tablosunun ilk 32 karakteri (00 - 1F) yazdırılmayan karakterler için kullanıldı. Bir baskı cihazını ve benzerlerini kontrol etmek için tasarlandılar. Geri kalanlar (20'den 7F'ye kadar) normal (yazdırılabilir) karakterlerdir.
Tablo 1 - ASCII kodlaması
|
|
Kolayca görebileceğiniz gibi, bu kodlamada yalnızca Latin harfleri ve İngilizce'de kullanılanlar temsil edilmektedir. Aritmetik ve diğer hizmet sembolleri de vardır. Ancak Rusça harfler, hatta Almanca ve Fransızca için özel Latin harfleri bile yoktur. Bunu açıklamak kolaydır; kodlama bir Amerikan standardı olarak geliştirilmiştir. Dünya çapında bilgisayarlar kullanılmaya başlandıkça diğer karakterlerin de kodlanması gerekti.
Bunu yapmak için her baytta sekizinci bitin kullanılmasına karar verildi. Böylece karakterleri kodlamak için kullanılabilecek 128 değer daha mevcuttu (80'den FF'ye kadar). Sekiz bitlik tablolardan ilki - "genişletilmiş ASCII" (Genişletilmiş ASCII) - bazı Batı Avrupa dillerinde kullanılan Latin karakterlerinin çeşitli varyantlarını içeriyordu. Ayrıca sözde grafikler de dahil olmak üzere başka ek karakterler de vardı.
Sözde grafik karakterler, yalnızca metin karakterlerini görüntüleyerek bazı grafik benzerlikleri sağlamaya olanak tanır. Örneğin, sözde grafiklerin kullanılmasıyla FAR Manager dosya yönetimi programı çalışır.
Genişletilmiş ASCII tablosunda Rusça harfler yoktu. Rusya'da (eski adıyla SSCB) ve diğer eyaletlerde, 8 bitlik metin dosyalarında belirli "ulusal" karakterleri temsil etmeyi mümkün kılan kendi kodlamaları oluşturuldu - Lehçe ve Çek dillerinin Latin harfleri, Kiril (Rusça harfler dahil) ve diğer alfabeler.
Yaygınlaşan tüm kodlamalarda ilk 127 karakter (yani sekizinci biti 0'a eşit olan bayt değerleri) ASCII ile aynıdır. Yani bir ASCII dosyası bu kodlamaların herhangi birinde çalışır; İngilizce dilinin harfleri de aynı şekilde temsil edilir.
Organizasyon ISO (Uluslararası Standardizasyon Organizasyonu - Uluslararası Standartlar Organizasyonu), ISO 8859 standartlarını benimsemiştir. Farklı dil grupları için 8 bitlik kodlamaları tanımlar. Dolayısıyla ISO 8859-1, ABD ve Batı Avrupa için bir tablo olan Genişletilmiş ASCII'dir. ISO 8859-5 ise Kiril (Rusça dahil) için bir tablodur.
Ancak tarihsel nedenlerden dolayı ISO 8859-5 kodlaması tutunamadı. Gerçekte, Rus dili için aşağıdaki kodlamalar kullanılmaktadır:
Kod Sayfası 866 (CP866), diğer adıyla "DOS", diğer adıyla "alternatif GOST kodlaması". 1990'ların ortalarına kadar yaygın olarak kullanıldı; artık sınırlı kullanımda. İnternette metin dağıtımı için pratik olarak kullanılmaz.
- KOI-8. 70'li ve 80'li yıllarda geliştirildi. Rus İnternet'te posta mesajları göndermek için genel kabul görmüş bir standarttır. Ayrıca Linux dahil Unix ailesinin işletim sistemlerinde de yaygın olarak kullanılmaktadır. KOI-8'in Rusça versiyonuna KOI-8R adı verilir; diğer Kiril dilleri için versiyonlar vardır (örneğin, KOI8-U Ukrayna dilinin bir çeşididir).
- Kod Sayfası 1251, CP1251, Windows-1251. Windows sisteminde Rusça dilini desteklemek için Microsoft tarafından geliştirilmiştir.
CP866'nın temel avantajı, sözde karakterlerin Genişletilmiş ASCII'dekiyle aynı yerlerde korunmasıydı; bu nedenle, ünlü Norton Commander gibi yabancı metin programları değişiklik yapmadan çalışabilir. CP866 şu anda FAR Manager da dahil olmak üzere metin pencerelerinde veya tam ekran metin modunda çalışan Windows programları için kullanılmaktadır.
CP866'daki metinler son yıllarda oldukça nadirdir (ancak Windows'ta Rusça dosya adlarını kodlamak için kullanılır). Bu nedenle diğer iki kodlama üzerinde duracağız - KOI-8R ve CP1251.
Gördüğünüz gibi CP1251 kodlama tablosunda Rusça harfler alfabetik sıraya göre düzenlenmiştir (ancak YO harfi hariç). Bu düzenleme bilgisayar programlarının alfabetik olarak sıralanmasını çok kolaylaştırır.
Ancak KOI-8R'de Rusça harflerin sırası rastgele görünüyor. Ama aslında öyle değil.
Birçok eski programda, metin işlenirken veya aktarılırken 8. bit kayboluyordu. (Artık bu tür programların neredeyse "soyu tükendi", ancak 80'lerin sonlarında ve 90'ların başında yaygındılar). 8 bitlik bir değerden 7 bitlik bir değer elde etmek için yüksek basamaklı rakamdan 8 çıkarmak yeterlidir; örneğin E1 61 olur.
Şimdi KOI-8R'yi ASCII tablosuyla karşılaştırın (Tablo 1). Rus harflerinin Latin harfleriyle tam bir uyum içinde olduğunu göreceksiniz. Sekizinci bit kaybolursa, küçük Rus harfleri büyük Latin harflerine, büyük Rus harfleri de küçük Latin harflerine dönüşür. Yani KOI-8'deki E1, Rusça "A", ASCII'deki 61 ise Latince "a"dır.
Böylece KOI-8, 8. bit kaybıyla Rusça metnin okunabilirliğini korumanıza olanak tanır. “Herkese merhaba”, “pRIWET WSEM” olur.
Son zamanlarda hem kodlama tablosundaki karakterlerin alfabetik sırası hem de 8. bitin kaybıyla okunabilirlik belirleyici önemini yitirmiştir. Modern bilgisayarlardaki sekizinci bit, iletim veya işlem sırasında kaybolmaz. Ve alfabetik sıralama, kodların basit bir karşılaştırması değil, kodlama dikkate alınarak yapılır. (Bu arada, CP1251 kodları tamamen alfabetik değil - Y harfi yerinde değil).
İki ortak kodlamanın olması nedeniyle, İnternet ile çalışırken (posta, Web sitelerine göz atarken), bazen Rusça metin yerine anlamsız bir dizi harf görebilirsiniz. Örneğin, "Ben SBYFEMHEL'im". Sadece "saygılarımla" kelimeleri; ancak bunlar CP1251 kodlamasıyla kodlandı ve bilgisayar, metni KOI-8 tablosuna göre çözdü. Tam tersine aynı kelimeler KOI-8'de kodlanmış olsaydı ve bilgisayar metni CP1251 tablosuna göre çözseydi sonuç “U HCHBTSEOYEN” olurdu.
Bazen bir bilgisayarın Rusça harflerin şifresini çözmesi ve hatta Rus dili için tasarlanmamış bir tabloya göre olması mümkündür. Daha sonra Rus harfleri yerine anlamsız bir karakter kümesi belirir (örneğin, Doğu Avrupa dillerinin Latin harfleri); genellikle "timsahlar" olarak anılırlar.
Çoğu durumda, modern programlar İnternet belgelerinin (e-postalar ve Web sayfaları) kodlamalarını kendi başlarına belirlemeyi başarır. Ancak bazen “yanlış ateşlenirler” ve sonra garip Rus harfleri veya “timsah” dizilerini görebilirsiniz. Kural olarak böyle bir durumda gerçek metni görüntülemek için program menüsünde kodlamayı manuel olarak seçmek yeterlidir.
Makale için http://open-office.edusite.ru/TextProcessor/p5aa1.html sayfasındaki bilgiler kullanıldı.
Siteden alınan materyal:
Office 365 için Excel Office 365 için Word Office 365 için Outlook Office 365 için PowerPoint Office 365 için Publisher Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2 013 Yayıncı 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 200 7 PowerPoint 2007 Publisher 2007 Erişim 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standardı 2007 Visio Standardı 2010 Daha Az
Bu makalede Belgeye ASCII veya Unicode karakter eklemeYalnızca birkaç özel karakter veya simge girmeniz gerekiyorsa klavye kısayollarını kullanabilirsiniz. ASCII karakterlerinin listesi için aşağıdaki tablolara veya Klavye kısayollarını kullanarak ulusal alfabe ekleme makalesine bakın.
Notlar:
ASCII karakterleri eklemeASCII karakteri eklemek için karakter kodunu girerken ALT tuşunu basılı tutun. Örneğin, derece sembolü (°) eklemek için ALT tuşunu basılı tutun, ardından sayısal tuş takımında 0176 girin.
Sayıları girmek için ana klavyedeki sayıları değil sayısal tuş takımını kullanın. Sayısal tuş takımında sayı girmeniz gerekiyorsa NUM LOCK göstergesinin açık olduğundan emin olun.
Unicode karakterler eklemeUnicode karakter eklemek için karakter kodunu yazın ve sırayla ALT + X tuşlarına basın. Örneğin, dolar ($) karakteri eklemek için 0024 yazın ve sırayla ALT + X tuşlarına basın. Tüm Unicode karakter kodları için bkz.
Önemli: PowerPoint ve InfoPath gibi bazı Microsoft Office programları Unicode kodlarının karakterlere dönüştürülmesini desteklemez. Bu programlardan birine Unicode karakter eklemeniz gerekiyorsa kullanın.
Notlar:
ALT+X tuşlarına bastıktan sonra yanlış bir Unicode karakteri görüntülenirse doğru kodu seçin ve ardından ALT+X tuşlarına tekrar basın.
Ayrıca kodun önüne "U+" yazmalısınız. Örneğin, "1U+B5" yazıp ALT+X tuşlarına basmak "1μ" metnini görüntülerken, "1B5" yazıp ALT+X tuşlarına basmak "Ƶ" karakterini görüntüler.
Karakter tablosu, seçilen bir yazı tipi için mevcut karakterleri görüntülemenizi sağlayan, Microsoft Windows'ta yerleşik bir programdır.
Sembol tablosunu kullanarak, tek tek karakterleri veya bir grup karakteri panoya kopyalayabilir ve bunları, bu karakterlerin görüntülenmesini destekleyen herhangi bir programa yapıştırabilirsiniz. Sembol tablosunun açılması
Windows 10'da Görev çubuğundaki arama kutusuna "sembol" yazın ve arama sonuçlarından sembol tablosunu seçin.
Windows 8'de Başlangıç ekranına "sembol" kelimesini yazın ve arama sonuçlarından sembol tablosunu seçin.
Windows 7'de Başlat düğmesine tıklayın, Tüm Programlar, Donatılar, Sistem Araçları'nı seçin ve Karakter Eşlem'e tıklayın.
Karakterler yazı tipine göre gruplandırılmıştır. Uygun karakter setini seçmek için yazı tipi listesine tıklayın. Bir sembolü seçmek için onu tıklayın, ardından Seç düğmesini tıklayın. Sembol eklemek için belgede istediğiniz konuma sağ tıklayın ve Yapıştır'ı seçin.
Sık kullanılan karakter kodlarıKarakterlerin tam listesi için bilgisayarda ASCII karakter kodu tablosuna veya kümelere göre sıralanmış Unicode karakter tablolarına bakın.
Para birimleri |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
yasal semboller |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Matematiksel semboller |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Kesirler |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Noktalama işaretleri ve lehçe simgeleri |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Şekil Sembolleri |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Yaygın olarak kullanılan aksan işaretleri için kodlar Gliflerin ve karşılık gelen kodların tam listesi için bkz.
|
Aralık | altıgen | Sembol | Aralık | altıgen | Sembol | |
000 | 00 | uzman. hayır | 128 | 80 | Ђ | |
001 | 01 | uzman. SOH | 129 | 81 | Ѓ | |
002 | 02 | uzman. STX | 130 | 82 | ‚ | |
003 | 03 | uzman. ETX | 131 | 83 | ѓ | |
004 | 04 | uzman. EOT | 132 | 84 | „ | |
005 | 05 | uzman. TRQ | 133 | 85 | … | |
006 | 06 | uzman. ACK | 134 | 86 | † | |
007 | 07 | uzman. BEL | 135 | 87 | ‡ | |
008 | 08 | uzman. BS | 136 | 88 | € | |
009 | 09 | uzman. SEKME | 137 | 89 | ‰ | |
010 | 0A | uzman. LF | 138 | 8A | Љ | |
011 | 0B | uzman. VT | 139 | 8B | ‹ ‹ | |
012 | 0C | uzman. FF | 140 | 8C | Њ | |
013 | 0 gün | uzman. CR | 141 | 8 boyutlu | Ќ | |
014 | 0E | uzman. BU YÜZDEN | 142 | 8E | Ћ | |
015 | 0F | uzman. Sİ | 143 | 8F | Џ | |
016 | 10 | uzman. DLE | 144 | 90 | ђ | |
017 | 11 | uzman. DC1 | 145 | 91 | ‘ | |
018 | 12 | uzman. DC2 | 146 | 92 | ’ | |
019 | 13 | uzman. DC3 | 147 | 93 | “ | |
020 | 14 | uzman. DC4 | 148 | 94 | ” | |
021 | 15 | uzman. NAK | 149 | 95 | ||
022 | 16 | uzman. SEN | 150 | 96 | – | |
023 | 17 | uzman. ETB | 151 | 97 | — | |
024 | 18 | uzman. OLABİLMEK | 152 | 98 | ||
025 | 19 | uzman. EM | 153 | 99 | ™ | |
026 | 1 A | uzman. ALT | 154 | 9A | љ | |
027 | 1B | uzman. ESC | 155 | 9B | › | |
028 | 1C | uzman. FS | 156 | 9C | њ | |
029 | 1 boyutlu | uzman. GS | 157 | 9D | ќ | |
030 | 1E | uzman. RS | 158 | 9E | ћ | |
031 | 1F | uzman. BİZ | 159 | 9F | џ | |
032 | 20 | debriyaj SP (Uzay) | 160 | A0 | ||
033 | 21 | ! | 161 | A1 | Ў | |
034 | 22 | " | 162 | A2 | ў | |
035 | 23 | # | 163 | A3 | Ћ | |
036 | 24 | $ | 164 | A4 | ¤ | |
037 | 25 | % | 165 | A5 | Ґ | |
038 | 26 | & | 166 | A6 | ¦ | |
039 | 27 | " | 167 | A7 | § | |
040 | 28 | ( | 168 | A8 | Hey | |
041 | 29 | ) | 169 | A9 | © | |
042 | 2A | * | 170 | AA | Є | |
043 | 2B | + | 171 | AB | « | |
044 | 2C | , | 172 | AC | ¬ | |
045 | 2 boyutlu | - | 173 | Reklam | | |
046 | 2E | . | 174 | AE | ® | |
047 | 2F | / | 175 | AF | Ї | |
048 | 30 | 0 | 176 | B0 | ° | |
049 | 31 | 1 | 177 | B1 | ± | |
050 | 32 | 2 | 178 | B2 | І | |
051 | 33 | 3 | 179 | B3 | і | |
052 | 34 | 4 | 180 | B4 | ґ | |
053 | 35 | 5 | 181 | B5 | µ | |
054 | 36 | 6 | 182 | B6 | ¶ | |
055 | 37 | 7 | 183 | B7 | · | |
056 | 38 | 8 | 184 | B8 | sen | |
057 | 39 | 9 | 185 | B9 | № | |
058 | 3 A | : | 186 | Lisans | є | |
059 | 3B | ; | 187 | BB | » | |
060 | 3C | < | 188 | M.Ö | ј | |
061 | 3 boyutlu | = | 189 | BD | Ѕ | |
062 | 3E | > | 190 | OLMAK | ѕ | |
063 | 3F | ? | 191 | erkek arkadaş | ї | |
064 | 40 | @ | 192 | C0 | A | |
065 | 41 | A | 193 | C1 | B | |
066 | 42 | B | 194 | C2 | İÇİNDE | |
067 | 43 | C | 195 | C3 | G | |
068 | 44 | D | 196 | C4 | D | |
069 | 45 | e | 197 | C5 | e | |
070 | 46 | F | 198 | C6 | VE | |
071 | 47 | G | 199 | C7 | K | |
072 | 48 | H | 200 | C8 | VE | |
073 | 49 | BEN | 201 | C9 | e | |
074 | 4A | J | 202 | CA | İLE | |
075 | 4B | k | 203 | CB | L | |
076 | 4C | L | 204 | CC | M | |
077 | 4 boyutlu | M | 205 | CD | H | |
078 | 4E | N | 206 | CE | HAKKINDA | |
079 | 4F | Ö | 207 | CF | P | |
080 | 50 | P | 208 | D0 | R | |
081 | 51 | Q | 209 | D1 | İLE | |
082 | 52 | R | 210 | D2 | T | |
083 | 53 | S | 211 | D3 | Şu tarihte: | |
084 | 54 | T | 212 | D4 | F | |
085 | 55 | sen | 213 | D5 | X | |
086 | 56 | V | 214 | D6 | C | |
087 | 57 | K | 215 | D7 | H | |
088 | 58 | X | 216 | D8 | K | |
089 | 59 | e | 217 | D9 | SCH | |
090 | 5A | Z | 218 | Savcı | Kommersant | |
091 | 5B | [ | 219 | D.B. | S | |
092 | 5C | \ | 220 | DC | B | |
093 | 5 boyutlu | ] | 221 | GG | e | |
094 | 5E | ^ | 222 | Almanya | YU | |
095 | 5F | _ | 223 | D.F. | BEN | |
096 | 60 | ` | 224 | E0 | A | |
097 | 61 | A | 225 | E1 | B | |
098 | 62 | B | 226 | E2 | V | |
099 | 63 | C | 227 | E3 | G | |
100 | 64 | D | 228 | E 4 | D | |
101 | 65 | e | 229 | E5 | e | |
102 | 66 | F | 230 | E6 | Ve | |
103 | 67 | G | 231 | E7 | H | |
104 | 68 | H | 232 | E8 | Ve | |
105 | 69 | Ben | 233 | E9 | o | |
106 | 6A | J | 234 | EA | İle | |
107 | 6B | k | 235 | EB | ben | |
108 | 6C | ben | 236 | AB | M | |
109 | 6 boyutlu | M | 237 | ED | N | |
110 | 6E | N | 238 | enerji verimliliği | Ö | |
111 | 6F | Ö | 239 | EF | P | |
112 | 70 | P | 240 | F0 | R | |
113 | 71 | Q | 241 | F1 | İle | |
114 | 72 | R | 242 | F2 | T | |
115 | 73 | S | 243 | F3 | en | |
116 | 74 | T | 244 | F4 | F | |
117 | 75 | sen | 245 | F5 | X | |
118 | 76 | v | 246 | F6 | C | |
119 | 77 | w | 247 | F7 | H | |
120 | 78 | X | 248 | F8 | ş | |
121 | 79 | sen | 249 | F9 | şaka | |
122 | 7A | z | 250 | FA | B | |
123 | 7B | { | 251 | S | ||
124 | 7C | | | 252 | FC | B | |
125 | 7 boyutlu | } | 253 | FD | ah | |
126 | 7E | ~ | 254 | F.E. | Yu | |
127 | 7F | Uzman. DEL | 255 | FF | BEN |
Özel (kontrol) karakterlerin açıklaması Başlangıçta ASCII tablosunun kontrol karakterlerinin teletip yoluyla veri alışverişi, delikli banttan veri girişi sağlamak ve harici cihazların en basit kontrolü için kullanıldığına dikkat edilmelidir.
Şu anda tablodaki ASCII kontrol karakterlerinin çoğu artık bu yükü taşımamaktadır ve başka amaçlar için kullanılabilir.
NUL, 00 | Boş, boş |
SO-01 | Başlığın Başlangıcı |
STX 02 | TeXt'in başlangıcı, metnin başlangıcı. |
ETX 03 | TeXt'in sonu |
EOT, 04 | İletimin Sonu |
ENQ, 05 | Sormak. Lütfen onaylayın |
ACK, 06 | Teşekkürler. onaylıyorum |
B.E.L.07 | Bell, ara |
Lisans 08 | Geri tuşu, bir karakter geri gitme |
SEKME, 09 | Sekme, yatay sekme |
LF, 0A | Satır Beslemesi, satır beslemesi. Artık çoğu programlama dilinde \n olarak gösterilir |
VT, 0B | Dikey Sekme, dikey tablolama. |
FF, 0C | Form beslemesi, sayfa beslemesi, yeni sayfa |
CR, 0D | Satırbaşı Artık çoğu programlama dilinde \r olarak gösterilir |
Yani, 0E | Dışarı Kaydır, yazıcıdaki mürekkep şeridinin rengini değiştirin |
SI, 0F | Shift In, yazdırma aygıtındaki mürekkep şeridinin rengini geri döndürür |
DLE, 10 | Data Link Escape, veri aktarımına kanal geçişi |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Cihaz Kontrolü, cihaz kontrol sembolleri |
NAK 15 | Olumsuz Onay, onaylamıyorum. |
SEN, 16 | senkronizasyon. Senkronizasyon sembolü |
ETB, 17 | Metin Bloğunun Sonu, metin bloğunun sonu |
CAN, 18 | İptal, daha önce geçirilen bir işlemin iptal edilmesi |
EM, 19 | Ortamın Sonu |
ALT, 1A | Yedek, ikame. İletim sırasında değeri kaybolan veya bozulan karakterin yerine konur |
ESC, 1B | Kaçış kaçış dizisi |
FS, 1C | Dosya Ayırıcı, dosya ayırıcı |
GS, 1D | Grup Ayırıcı, grup ayırıcı |
RS, 1E | Kayıt Ayırıcı |
ABD, 1F | Birim Ayırıcı, birim ayırıcı |
DEL, 7F | Sil, son karakteri sil. |
Metin yazmak için kullanılan semboller kümesine ne ad verilir? alfabetik olarak.
Alfabedeki karakter sayısı güç.
Bilgi miktarını belirleme formülü: N = 2b,
burada N, alfabenin önem derecesidir (sembollerin sayısı),
b, bit sayısıdır (sembolün bilgi ağırlığı).
256 karakter kapasiteli bir alfabeye neredeyse gerekli tüm karakterler yerleştirilebilir. Bu alfabenin adı yeterli.
Çünkü 256 = 2 8 ise 1 karakterin ağırlığı 8 bittir.
8 bitlik ölçü birimine bir isim verildi 1 bayt:
1 bayt = 8 bit.
Bilgisayar metnindeki her karakterin ikili kodu 1 byte hafıza kaplar.
Metinsel bilgiler bilgisayar belleğinde nasıl temsil edilir?Bayt, belleğin adreslenebilir en küçük kısmı olduğundan ve bu nedenle işlemci, metin işlemeyi gerçekleştirirken her karaktere ayrı ayrı erişebildiğinden, karakterleri bayt bayt kodlamanın rahatlığı açıktır. Öte yandan 256 karakter, çok çeşitli karakter bilgilerini temsil etmek için oldukça yeterlidir.
Şimdi her karaktere hangi sekiz bitlik ikili kodun yerleştirileceği sorusu ortaya çıkıyor.Bunun şartlı bir mesele olduğu açıktır, kodlamanın birçok yolunu bulabilirsiniz.
Bilgisayar alfabesindeki tüm karakterler 0'dan 255'e kadar numaralandırılır. Her sayı, 00000000'dan 11111111'e kadar sekiz bitlik bir ikili koda karşılık gelir. Bu kod, ikili sayı sistemindeki karakterin yalnızca sıra numarasıdır.
Bilgisayar alfabesindeki tüm karakterlere seri numaralarının atandığı tabloya kodlama tablosu denir.Farklı bilgisayar türleri için farklı kodlama tabloları kullanılır.
Tablo, PC'ler için uluslararası standart haline geldi. ASCII(asci olarak telaffuz edilir) (Bilgi Değişimi için Amerikan Standart Kodu).
ASCII kod tablosu iki bölüme ayrılmıştır.
Tablonun yalnızca ilk yarısı uluslararası bir standarttır; sayıları içeren karakterler 0 (00000000), kadar 127 (01111111).
ASCII kodlama tablosunun yapısıSeri numarası | Kod | Sembol |
0 - 31 | 00000000 - 00011111 | 0'dan 31'e kadar sayıların bulunduğu karakterlere kontrol karakterleri denir. |
32 - 127 | 00100000 - 01111111 | Tablonun standart kısmı (İngilizce). Buna Latin alfabesinin küçük ve büyük harfleri, ondalık rakamlar, noktalama işaretleri, her türlü parantez, ticari ve diğer semboller dahildir. |
128 - 255 | 10000000 - 11111111 | Tablonun alternatif kısmı (Rusça). |
![]() |
Kodlama tablosunda harflerin (büyük ve küçük harf) alfabetik sıraya göre, sayıların ise artan değerlere göre sıralandığına dikkatinizi çekerim. Karakterlerin düzenlenmesinde sözlükbilimsel sıraya bu şekilde uyulması, alfabenin sıralı kodlanması ilkesi olarak adlandırılır.
Rus alfabesinin harfleri için sıralı kodlama ilkesi de gözetilmektedir.
ASCII kod tablosunun ikinci yarısı![](https://i0.wp.com/school497.ru/download/u/02/img/asc1.gif)
Ne yazık ki şu anda beş farklı Kiril kodlaması mevcut (KOI8-R, Windows. MS-DOS, Macintosh ve ISO). Bu nedenle, Rusça metnin bir bilgisayardan diğerine, bir yazılım sisteminden diğerine aktarılmasında sıklıkla sorunlar ortaya çıkar.
Kronolojik olarak, Rusça harfleri bilgisayarlarda kodlamanın ilk standartlarından biri KOI8'di ("Bilgi Değişim Kodu, 8 bit"). Bu kodlama 70'li yıllarda EC serisi bilgisayarların bilgisayarlarında kullanılmış ve 80'li yılların ortalarından itibaren UNIX işletim sisteminin ilk Ruslaştırılmış sürümlerinde kullanılmaya başlanmıştır.
MS DOS işletim sisteminin hakim olduğu 90'lı yılların başından itibaren, CP866 kodlaması kalır ("CP", "Kod Sayfası", "kod sayfası" anlamına gelir).
Mac OS işletim sistemini çalıştıran Apple bilgisayarlar kendi Mac kodlamalarını kullanır.
Ayrıca Uluslararası Standardizasyon Örgütü (Uluslararası Standartlar Örgütü, ISO), Rus dili için standart olarak ISO 8859-5 adı verilen başka bir kodlamayı onayladı.
Şu anda kullanılan en yaygın kodlama, CP1251 olarak kısaltılan Microsoft Windows'tur.
90'lı yılların sonundan bu yana, karakter kodlamasının standardizasyon sorunu, yeni bir uluslararası standardın getirilmesiyle çözüldü. Unicode. Bu 16 bitlik bir kodlamadır, yani. karakter başına 2 bayt hafızaya sahiptir. Elbette bu durumda kaplanan hafıza miktarı 2 kat artar. Ancak böyle bir kod tablosu 65536 karaktere kadar eklenmesine izin verir. Unicode standardının tam özellikleri, dünyadaki mevcut, tükenmiş ve yapay olarak oluşturulmuş tüm alfabelerin yanı sıra birçok matematiksel, müzikal, kimyasal ve diğer sembolleri içerir.
Kelimelerin bilgisayarın hafızasında nasıl görüneceğini hayal etmek için bir ASCII tablosu kullanmayı deneyelim. Kelimelerin bilgisayar belleğindeki dahili temsiliBazen başka bir bilgisayardan alınan Rus alfabesinin harflerinden oluşan metin okunamıyor - monitör ekranında bir tür "abrakadabra" görünüyor. Bunun nedeni bilgisayarların Rus dilinin farklı karakter kodlamalarını kullanmasıdır.