• Karakter asci kodları. ASCII kodlaması (bilgi alışverişi için Amerikan standart kodu) - Latince için temel metin kodlaması

    Her bilgisayarın uyguladığı kendi karakter seti vardır. Böyle bir set 26 adet büyük ve küçük harf, rakam ve özel karakter (nokta, boşluk vb.) içerir. Tam sayılara çevrilen sembollere kod adı verilir. Bilgisayarların aynı kod setine sahip olması için standartlar geliştirildi.

    ASCII standardı

    ASCII (Amerikan Bilgi Değişimi Standart Kodu), bilgi alışverişi için Amerikan standart kodudur. Her ASCII karakterinin 7 biti vardır, dolayısıyla maksimum karakter sayısı 128'dir (Tablo 1). 0 ile 1F arasındaki kodlar yazdırılmayan kontrol karakterleridir. Veri aktarımı için çok sayıda yazdırılamayan ASCII karaktere ihtiyaç vardır. Örneğin, bir mesaj başlık başlangıç ​​karakteri SOH, başlığın kendisi ve metin başlangıç ​​karakteri STX, metnin kendisi ve metin bitiş karakteri ETX ve iletim bitiş karakteri EOT'den oluşabilir. Ancak veriler ağ üzerinden aktarımın başlangıcından ve bitişinden kendileri sorumlu olan paketler halinde iletilir. Yani yazdırılamayan karakterler neredeyse hiç kullanılmaz.

    Tablo 1 - ASCII kod tablosu

    Sayı Komut Değeri Sayı Komut Değeri
    0 BOŞ boş işaretçisi 10 DLE İletim sisteminden çıkma
    1 SOH başlık başlangıcı 11 DC1 Cihaz yönetimi
    2 STX Metnin başlangıcı 12 DC2 Cihaz yönetimi
    3 ETX Metnin sonu 13 DC3 Cihaz yönetimi
    4 EOT İletimin sonu 14 DC4 Cihaz yönetimi
    5 ACK Rica etmek 15 NAK Resepsiyonun onaylanmaması
    6 BEL Kabul onayı 16 SEN Basit
    7 BS Çan sembolü 17 ETB İletim bloğunun sonu
    8 HT Geri girinti 18 OLABİLMEK işaret
    9 LF Yatay sekme 19 EM Medya Sonu
    A VT Satır çevirisi 1 A ALT alt simge
    B FF Dikey sekme 1B ESC çıkış
    C CR Sayfa çevirisi 1C FS Dosya ayırıcı
    D BU YÜZDEN Satırbaşı 1 boyutlu GS Grup ayırıcı
    e Ek bir kayda geçiş 1E RS Kayıt ayırıcı
    Standart kasaya geçiş 1F BİZ Modül ayırıcı
    Sayı Sembol Sayı Sembol Sayı Sembol Sayı Sembol Sayı Sembol Sayı Sembol
    20 uzay 30 0 40 @ 50 P 60 . 70 P
    21 ! 31 1 41 A 51 Q 61 A 71 Q
    22 32 2 42 B 52 R 62 B 72 R
    23 # 33 3 43 C 53 S 63 C 73 S
    24 φ 34 4 44 D 54 T 64 D 74 T
    25 % 35 5 45 e 55 VE 65 e 75 Ve
    26 & 36 6 46 F 56 V 66 F 76 v
    27 37 7 47 G 57 K 67 G 77 w
    28 ( 38 8 48 H 58 X 68 H 78 X
    29 ) 39 9 49 BEN 59 e 69 Ben 70 sen
    2A 3 A ; 4A J 5A Z 6A J 7A z
    2B + 3B ; 4B k 5B [ 6B k 7B {
    2C 3C < 4C L 5C \ 6C ben 7C |
    2 boyutlu 3 boyutlu = 4 boyutlu M 5 boyutlu ] 6 boyutlu M 7 boyutlu }
    2E 3E > 4E N 5E 6E N 7E ~
    2F / 3F G 4F Ö 5F _ 6F Ö 7F DEL
    Unicode standardı

    Önceki kodlama İngilizce için harikadır ancak diğer diller için uygun değildir. Örneğin, Almanca'da çift nokta işaretleri varken, Fransızca'da aksan vardır. Bazı dillerin tamamen farklı alfabeleri vardır. ASCII'yi genişletmeye yönelik ilk girişim, önceki kodlamayı 128 karakter daha genişleten IS646 idi. Latin harfleri vuruşlar ve aksanlarla eklendi ve Latince 1 olarak adlandırıldı. Bir sonraki girişim, bir kod sayfası içeren IS 8859'du. Hala genişleme girişimleri vardı, ancak bu evrensel değildi. UNICODE kodlaması (10646'dır) oluşturuldu. Kodlamanın amacı, her karaktere kod işaretçisi adı verilen tek bir sabit 16 bitlik değer atamaktır. Toplamda 65536 işaretçi elde ediliyor. Yerden tasarruf etmek için 0-255 kodları için Latin-1'i kullandık, ASII'yi kolayca UNICODE olarak değiştirdik. Bu standart birçok sorunu çözdü, ancak hepsini değil. Örneğin Japonca için yeni kelimelerin gelmesiyle bağlantılı olarak terim sayısını yaklaşık 20 bin artırmak gerekiyor, ayrıca Braille alfabesini de etkinleştirmeniz gerekiyor.

    [8 bit kodlamalar: ASCII, KOI-8R ve CP1251] ABD'de oluşturulan ilk kodlama tabloları bayttaki sekizinci biti kullanmıyordu. Metin bir bayt dizisi olarak sunuldu, ancak sekizinci bit dikkate alınmadı (resmi amaçlarla kullanıldı).

    ASCII tablosu (Bilgi Değişimi için Amerikan Standart Kodu) genel olarak tanınan bir standart haline geldi. ASCII tablosunun ilk 32 karakteri (00 - 1F) yazdırılmayan karakterler için kullanıldı. Bir baskı cihazını ve benzerlerini kontrol etmek için tasarlandılar. Geri kalanlar (20'den 7F'ye kadar) normal (yazdırılabilir) karakterlerdir.

    Tablo 1 - ASCII kodlaması

    Aralık Onaltılı Ekim Karakter Açıklama
    0 0 000 hükümsüz
    1 1 001 başlığın başlangıcı
    2 2 002 metnin başlangıcı
    3 3 003 metnin sonu
    4 4 004 iletim sonu
    5 5 005 sorgu
    6 6 006 kabullenmek
    7 7 007 zil
    8 8 010 geri tuşu
    9 9 011 yatay sekme
    10 A 012 Yeni hat
    11 B 013 dikey sekme
    12 C 014 yeni sayfa
    13 D 015 satırbaşı
    14 e 016 dışarı çıkmak
    15 F 017 vardiya
    16 10 020 veri bağlantısı kaçışı
    17 11 021 cihaz kontrolü 1
    18 12 022 cihaz kontrolü 2
    19 13 023 cihaz kontrolü 3
    20 14 024 cihaz kontrolü 4
    21 15 025 olumsuz kabul
    22 16 026 senkron rölanti
    23 17 027 Trans'ın sonu. engellemek
    24 18 030 iptal etmek
    25 19 031 ortamın sonu
    26 1 A 032 yerine geçmek
    27 1B 033 kaçmak
    28 1C 034 dosya ayırıcı
    29 1 boyutlu 035 grup ayırıcı
    30 1E 036 kayıt ayırıcı
    31 1F 037 birim ayırıcı
    32 20 040 uzay
    33 21 041 !
    34 22 042 "
    35 23 043 #
    36 24 044 $
    37 25 045 %
    38 26 046 &
    39 27 047 "
    40 28 050 (
    41 29 051 )
    42 2A 052 *
    43 2B 053 +
    44 2C 054 ,
    45 2 boyutlu 055 -
    46 2E 056 .
    47 2F 057 /
    48 30 060 0
    49 31 061 1
    50 32 062 2
    51 33 063 3
    52 34 064 4
    53 35 065 5
    54 36 066 6
    55 37 067 7
    56 38 070 8
    57 39 071 9
    58 3 A 072 :
    59 3B 073 ;
    60 3C 074 <
    61 3 boyutlu 075 =
    62 3E 076 >
    63 3F 077 ?
    Aralık Onaltılık Ekim Karakter
    64 40 100 @
    65 41 101 A
    66 42 102 B
    67 43 103 C
    68 44 104 D
    69 45 105 e
    70 46 106 F
    71 47 107 G
    72 48 110 H
    73 49 111 BEN
    74 4A 112 J
    75 4B 113 k
    76 4C 114 L
    77 4 boyutlu 115 M
    78 4E 116 N
    79 4F 117 Ö
    80 50 120 P
    81 51 121 Q
    82 52 122 R
    83 53 123 S
    84 54 124 T
    85 55 125 sen
    86 56 126 V
    87 57 127 K
    88 58 130 X
    89 59 131 e
    90 5A 132 Z
    91 5B 133 [
    92 5C 134 \
    93 5 boyutlu 135 ]
    94 5E 136 ^
    95 5F 137 _
    96 60 140 `
    97 61 141 A
    98 62 142 B
    99 63 143 C
    100 64 144 D
    101 65 145 e
    102 66 146 F
    103 67 147 G
    104 68 150 H
    105 69 151 Ben
    106 6A 152 J
    107 6B 153 k
    108 6C 154 ben
    109 6 boyutlu 155 M
    110 6E 156 N
    111 6F 157 Ö
    112 70 160 P
    113 71 161 Q
    114 72 162 R
    115 73 163 S
    116 74 164 T
    117 75 165 sen
    118 76 166 v
    119 77 167 w
    120 78 170 X
    121 79 171 sen
    122 7A 172 z
    123 7B 173 {
    124 7C 174 |
    125 7 boyutlu 175 }
    126 7E 176 ~
    127 7F 177 DEL

    Kolayca görebileceğiniz gibi, bu kodlamada yalnızca Latin harfleri ve İngilizce'de kullanılanlar temsil edilmektedir. Aritmetik ve diğer hizmet sembolleri de vardır. Ancak Rusça harfler, hatta Almanca ve Fransızca için özel Latin harfleri bile yoktur. Bunu açıklamak kolaydır; kodlama bir Amerikan standardı olarak geliştirilmiştir. Dünya çapında bilgisayarlar kullanılmaya başlandıkça diğer karakterlerin de kodlanması gerekti.

    Bunu yapmak için her baytta sekizinci bitin kullanılmasına karar verildi. Böylece karakterleri kodlamak için kullanılabilecek 128 değer daha mevcuttu (80'den FF'ye kadar). Sekiz bitlik tablolardan ilki - "genişletilmiş ASCII" (Genişletilmiş ASCII) - bazı Batı Avrupa dillerinde kullanılan Latin karakterlerinin çeşitli varyantlarını içeriyordu. Ayrıca sözde grafikler de dahil olmak üzere başka ek karakterler de vardı.

    Sözde grafik karakterler, yalnızca metin karakterlerini görüntüleyerek bazı grafik benzerlikleri sağlamaya olanak tanır. Örneğin, sözde grafiklerin kullanılmasıyla FAR Manager dosya yönetimi programı çalışır.

    Genişletilmiş ASCII tablosunda Rusça harfler yoktu. Rusya'da (eski adıyla SSCB) ve diğer eyaletlerde, 8 bitlik metin dosyalarında belirli "ulusal" karakterleri temsil etmeyi mümkün kılan kendi kodlamaları oluşturuldu - Lehçe ve Çek dillerinin Latin harfleri, Kiril (Rusça harfler dahil) ve diğer alfabeler.

    Yaygınlaşan tüm kodlamalarda ilk 127 karakter (yani sekizinci biti 0'a eşit olan bayt değerleri) ASCII ile aynıdır. Yani bir ASCII dosyası bu kodlamaların herhangi birinde çalışır; İngilizce dilinin harfleri de aynı şekilde temsil edilir.

    Organizasyon ISO (Uluslararası Standardizasyon Organizasyonu - Uluslararası Standartlar Organizasyonu), ISO 8859 standartlarını benimsemiştir. Farklı dil grupları için 8 bitlik kodlamaları tanımlar. Dolayısıyla ISO 8859-1, ABD ve Batı Avrupa için bir tablo olan Genişletilmiş ASCII'dir. ISO 8859-5 ise Kiril (Rusça dahil) için bir tablodur.

    Ancak tarihsel nedenlerden dolayı ISO 8859-5 kodlaması tutunamadı. Gerçekte, Rus dili için aşağıdaki kodlamalar kullanılmaktadır:

    Kod Sayfası 866 (CP866), diğer adıyla "DOS", diğer adıyla "alternatif GOST kodlaması". 1990'ların ortalarına kadar yaygın olarak kullanıldı; artık sınırlı kullanımda. İnternette metin dağıtımı için pratik olarak kullanılmaz.
    - KOI-8. 70'li ve 80'li yıllarda geliştirildi. Rus İnternet'te posta mesajları göndermek için genel kabul görmüş bir standarttır. Ayrıca Linux dahil Unix ailesinin işletim sistemlerinde de yaygın olarak kullanılmaktadır. KOI-8'in Rusça versiyonuna KOI-8R adı verilir; diğer Kiril dilleri için versiyonlar vardır (örneğin, KOI8-U Ukrayna dilinin bir çeşididir).
    - Kod Sayfası 1251, CP1251, Windows-1251. Windows sisteminde Rusça dilini desteklemek için Microsoft tarafından geliştirilmiştir.

    CP866'nın temel avantajı, sözde karakterlerin Genişletilmiş ASCII'dekiyle aynı yerlerde korunmasıydı; bu nedenle, ünlü Norton Commander gibi yabancı metin programları değişiklik yapmadan çalışabilir. CP866 şu anda FAR Manager da dahil olmak üzere metin pencerelerinde veya tam ekran metin modunda çalışan Windows programları için kullanılmaktadır.

    CP866'daki metinler son yıllarda oldukça nadirdir (ancak Windows'ta Rusça dosya adlarını kodlamak için kullanılır). Bu nedenle diğer iki kodlama üzerinde duracağız - KOI-8R ve CP1251.



    Gördüğünüz gibi CP1251 kodlama tablosunda Rusça harfler alfabetik sıraya göre düzenlenmiştir (ancak YO harfi hariç). Bu düzenleme bilgisayar programlarının alfabetik olarak sıralanmasını çok kolaylaştırır.

    Ancak KOI-8R'de Rusça harflerin sırası rastgele görünüyor. Ama aslında öyle değil.

    Birçok eski programda, metin işlenirken veya aktarılırken 8. bit kayboluyordu. (Artık bu tür programların neredeyse "soyu tükendi", ancak 80'lerin sonlarında ve 90'ların başında yaygındılar). 8 bitlik bir değerden 7 bitlik bir değer elde etmek için yüksek basamaklı rakamdan 8 çıkarmak yeterlidir; örneğin E1 61 olur.

    Şimdi KOI-8R'yi ASCII tablosuyla karşılaştırın (Tablo 1). Rus harflerinin Latin harfleriyle tam bir uyum içinde olduğunu göreceksiniz. Sekizinci bit kaybolursa, küçük Rus harfleri büyük Latin harflerine, büyük Rus harfleri de küçük Latin harflerine dönüşür. Yani KOI-8'deki E1, Rusça "A", ASCII'deki 61 ise Latince "a"dır.

    Böylece KOI-8, 8. bit kaybıyla Rusça metnin okunabilirliğini korumanıza olanak tanır. “Herkese merhaba”, “pRIWET WSEM” olur.

    Son zamanlarda hem kodlama tablosundaki karakterlerin alfabetik sırası hem de 8. bitin kaybıyla okunabilirlik belirleyici önemini yitirmiştir. Modern bilgisayarlardaki sekizinci bit, iletim veya işlem sırasında kaybolmaz. Ve alfabetik sıralama, kodların basit bir karşılaştırması değil, kodlama dikkate alınarak yapılır. (Bu arada, CP1251 kodları tamamen alfabetik değil - Y harfi yerinde değil).

    İki ortak kodlamanın olması nedeniyle, İnternet ile çalışırken (posta, Web sitelerine göz atarken), bazen Rusça metin yerine anlamsız bir dizi harf görebilirsiniz. Örneğin, "Ben SBYFEMHEL'im". Sadece "saygılarımla" kelimeleri; ancak bunlar CP1251 kodlamasıyla kodlandı ve bilgisayar, metni KOI-8 tablosuna göre çözdü. Tam tersine aynı kelimeler KOI-8'de kodlanmış olsaydı ve bilgisayar metni CP1251 tablosuna göre çözseydi sonuç “U HCHBTSEOYEN” olurdu.

    Bazen bir bilgisayarın Rusça harflerin şifresini çözmesi ve hatta Rus dili için tasarlanmamış bir tabloya göre olması mümkündür. Daha sonra Rus harfleri yerine anlamsız bir karakter kümesi belirir (örneğin, Doğu Avrupa dillerinin Latin harfleri); genellikle "timsahlar" olarak anılırlar.

    Çoğu durumda, modern programlar İnternet belgelerinin (e-postalar ve Web sayfaları) kodlamalarını kendi başlarına belirlemeyi başarır. Ancak bazen “yanlış ateşlenirler” ve sonra garip Rus harfleri veya “timsah” dizilerini görebilirsiniz. Kural olarak böyle bir durumda gerçek metni görüntülemek için program menüsünde kodlamayı manuel olarak seçmek yeterlidir.

    Makale için http://open-office.edusite.ru/TextProcessor/p5aa1.html sayfasındaki bilgiler kullanıldı.

    Siteden alınan materyal:

    Office 365 için Excel Office 365 için Word Office 365 için Outlook Office 365 için PowerPoint Office 365 için Publisher Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2 013 Yayıncı 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 200 7 PowerPoint 2007 Publisher 2007 Erişim 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standardı 2007 Visio Standardı 2010 Daha Az

    Bu makalede Belgeye ASCII veya Unicode karakter ekleme

    Yalnızca birkaç özel karakter veya simge girmeniz gerekiyorsa klavye kısayollarını kullanabilirsiniz. ASCII karakterlerinin listesi için aşağıdaki tablolara veya Klavye kısayollarını kullanarak ulusal alfabe ekleme makalesine bakın.

    Notlar:

    ASCII karakterleri ekleme

    ASCII karakteri eklemek için karakter kodunu girerken ALT tuşunu basılı tutun. Örneğin, derece sembolü (°) eklemek için ALT tuşunu basılı tutun, ardından sayısal tuş takımında 0176 girin.

    Sayıları girmek için ana klavyedeki sayıları değil sayısal tuş takımını kullanın. Sayısal tuş takımında sayı girmeniz gerekiyorsa NUM LOCK göstergesinin açık olduğundan emin olun.

    Unicode karakterler ekleme

    Unicode karakter eklemek için karakter kodunu yazın ve sırayla ALT + X tuşlarına basın. Örneğin, dolar ($) karakteri eklemek için 0024 yazın ve sırayla ALT + X tuşlarına basın. Tüm Unicode karakter kodları için bkz.

    Önemli: PowerPoint ve InfoPath gibi bazı Microsoft Office programları Unicode kodlarının karakterlere dönüştürülmesini desteklemez. Bu programlardan birine Unicode karakter eklemeniz gerekiyorsa kullanın.

    Notlar:

      ALT+X tuşlarına bastıktan sonra yanlış bir Unicode karakteri görüntülenirse doğru kodu seçin ve ardından ALT+X tuşlarına tekrar basın.

      Ayrıca kodun önüne "U+" yazmalısınız. Örneğin, "1U+B5" yazıp ALT+X tuşlarına basmak "1μ" metnini görüntülerken, "1B5" yazıp ALT+X tuşlarına basmak "Ƶ" karakterini görüntüler.

    Sembol tablosunu kullanma

    Karakter tablosu, seçilen bir yazı tipi için mevcut karakterleri görüntülemenizi sağlayan, Microsoft Windows'ta yerleşik bir programdır.

    Sembol tablosunu kullanarak, tek tek karakterleri veya bir grup karakteri panoya kopyalayabilir ve bunları, bu karakterlerin görüntülenmesini destekleyen herhangi bir programa yapıştırabilirsiniz. Sembol tablosunun açılması

      Windows 10'da Görev çubuğundaki arama kutusuna "sembol" yazın ve arama sonuçlarından sembol tablosunu seçin.

      Windows 8'de Başlangıç ​​ekranına "sembol" kelimesini yazın ve arama sonuçlarından sembol tablosunu seçin.

      Windows 7'de Başlat düğmesine tıklayın, Tüm Programlar, Donatılar, Sistem Araçları'nı seçin ve Karakter Eşlem'e tıklayın.

    Karakterler yazı tipine göre gruplandırılmıştır. Uygun karakter setini seçmek için yazı tipi listesine tıklayın. Bir sembolü seçmek için onu tıklayın, ardından Seç düğmesini tıklayın. Sembol eklemek için belgede istediğiniz konuma sağ tıklayın ve Yapıştır'ı seçin.

    Sık kullanılan karakter kodları

    Karakterlerin tam listesi için bilgisayarda ASCII karakter kodu tablosuna veya kümelere göre sıralanmış Unicode karakter tablolarına bakın.

    Glif

    Glif

    Para birimleri

    yasal semboller

    Matematiksel semboller

    Kesirler

    Noktalama işaretleri ve lehçe simgeleri

    Şekil Sembolleri

    Yaygın olarak kullanılan aksan işaretleri için kodlar

    Gliflerin ve karşılık gelen kodların tam listesi için bkz.

    Glif

    Glif

    Yazdırılmayan ASCII kontrol karakterleri

    Yazıcılar gibi bazı çevre birimlerini kontrol etmek için kullanılan karakterler ASCII tablosunda 0-31 arasında numaralandırılmıştır. Örneğin sayfa besleme/yeni sayfa karakteri 12 sayısına karşılık gelir. Bu karakter yazıcıya bir sonraki sayfanın başına gitmesini söyler.

    ASCII yazdırılamayan kontrol karakter tablosu

    Ondalık sayı

    İmza

    Ondalık sayı

    İmza

    Veri kanalı sürümü

    Başlık başlangıcı

    İlk cihaz kontrol kodu

    Metnin başlangıcı

    İkinci cihaz kontrol kodu

    Metnin sonu

    Üçüncü cihaz kontrol kodu

    İletimin sonu

    Dördüncü cihaz kontrol kodu

    beş köşeli

    Olumsuz onay

    Onayla

    Senkron aktarım modu

    Ses sinyali

    Veri bloğunun sonu

    Yatay sekme

    Medya Sonu

    Satır besleme/yeni satır

    Yedek karakter

    Dikey sekme

    aşmak

    Sayfa Çevirisi/Yeni Sayfa

    on iki

    Dosya ayırıcı

    Satırbaşı

    Grup ayırıcı

    Rakamları kaydetmeden geçiş yapın

    Kayıt ayırıcı

    Bit koruyucu kaydırma

    on beş

    Veri ayırıcı

    AralıkaltıgenSembol AralıkaltıgenSembol
    000 00 uzman. hayır 128 80 Ђ
    001 01 uzman. SOH 129 81 Ѓ
    002 02 uzman. STX 130 82
    003 03 uzman. ETX 131 83 ѓ
    004 04 uzman. EOT 132 84
    005 05 uzman. TRQ 133 85
    006 06 uzman. ACK 134 86
    007 07 uzman. BEL 135 87
    008 08 uzman. BS 136 88
    009 09 uzman. SEKME 137 89
    010 0Auzman. LF 138 8AЉ
    011 0Buzman. VT 139 8B‹ ‹
    012 0Cuzman. FF 140 8CЊ
    013 0 günuzman. CR 141 8 boyutluЌ
    014 0Euzman. BU YÜZDEN 142 8EЋ
    015 0Fuzman. Sİ 143 8FЏ
    016 10 uzman. DLE 144 90 ђ
    017 11 uzman. DC1 145 91
    018 12 uzman. DC2 146 92
    019 13 uzman. DC3 147 93
    020 14 uzman. DC4 148 94
    021 15 uzman. NAK 149 95
    022 16 uzman. SEN 150 96
    023 17 uzman. ETB 151 97
    024 18 uzman. OLABİLMEK 152 98
    025 19 uzman. EM 153 99
    026 1 Auzman. ALT 154 9Aљ
    027 1Buzman. ESC 155 9B
    028 1Cuzman. FS 156 9Cњ
    029 1 boyutluuzman. GS 157 9Dќ
    030 1Euzman. RS 158 9Eћ
    031 1Fuzman. BİZ 159 9Fџ
    032 20 debriyaj SP (Uzay) 160 A0
    033 21 ! 161 A1 Ў
    034 22 " 162 A2ў
    035 23 # 163 A3Ћ
    036 24 $ 164 A4¤
    037 25 % 165 A5Ґ
    038 26 & 166 A6¦
    039 27 " 167 A7§
    040 28 ( 168 A8Hey
    041 29 ) 169 A9©
    042 2A* 170 AAЄ
    043 2B+ 171 AB«
    044 2C, 172 AC¬
    045 2 boyutlu- 173 Reklam­
    046 2E. 174 AE®
    047 2F/ 175 AFЇ
    048 30 0 176 B0°
    049 31 1 177 B1±
    050 32 2 178 B2І
    051 33 3 179 B3і
    052 34 4 180 B4ґ
    053 35 5 181 B5µ
    054 36 6 182 B6
    055 37 7 183 B7·
    056 38 8 184 B8sen
    057 39 9 185 B9
    058 3 A: 186 Lisansє
    059 3B; 187 BB»
    060 3C< 188 M.Öј
    061 3 boyutlu= 189 BDЅ
    062 3E> 190 OLMAKѕ
    063 3F? 191 erkek arkadaşї
    064 40 @ 192 C0 A
    065 41 A 193 C1 B
    066 42 B 194 C2 İÇİNDE
    067 43 C 195 C3 G
    068 44 D 196 C4 D
    069 45 e 197 C5 e
    070 46 F 198 C6 VE
    071 47 G 199 C7 K
    072 48 H 200 C8 VE
    073 49 BEN 201 C9 e
    074 4AJ 202 CA İLE
    075 4Bk 203 CB L
    076 4CL 204 CC M
    077 4 boyutluM 205 CD H
    078 4EN 206 CE HAKKINDA
    079 4FÖ 207 CF P
    080 50 P 208 D0 R
    081 51 Q 209 D1 İLE
    082 52 R 210 D2 T
    083 53 S 211 D3 Şu tarihte:
    084 54 T 212 D4 F
    085 55 sen 213 D5 X
    086 56 V 214 D6 C
    087 57 K 215 D7 H
    088 58 X 216 D8 K
    089 59 e 217 D9 SCH
    090 5AZ 218 Savcı Kommersant
    091 5B[ 219 D.B. S
    092 5C\ 220 DC B
    093 5 boyutlu] 221 GG e
    094 5E^ 222 Almanya YU
    095 5F_ 223 D.F. BEN
    096 60 ` 224 E0 A
    097 61 A 225 E1 B
    098 62 B 226 E2 V
    099 63 C 227 E3 G
    100 64 D 228 E 4 D
    101 65 e 229 E5 e
    102 66 F 230 E6 Ve
    103 67 G 231 E7 H
    104 68 H 232 E8 Ve
    105 69 Ben 233 E9 o
    106 6AJ 234 EA İle
    107 6Bk 235 EB ben
    108 6Cben 236 AB M
    109 6 boyutluM 237 ED N
    110 6EN 238 enerji verimliliği Ö
    111 6FÖ 239 EF P
    112 70 P 240 F0 R
    113 71 Q 241 F1 İle
    114 72 R 242 F2 T
    115 73 S 243 F3 en
    116 74 T 244 F4 F
    117 75 sen 245 F5 X
    118 76 v 246 F6 C
    119 77 w 247 F7 H
    120 78 X 248 F8 ş
    121 79 sen 249 F9 şaka
    122 7Az 250 FA B
    123 7B{ 251 Facebook S
    124 7C| 252 FC B
    125 7 boyutlu} 253 FD ah
    126 7E~ 254 F.E. Yu
    127 7FUzman. DEL 255 FF BEN
    Windows karakter kodlarının ASCII tablosu.
    Özel (kontrol) karakterlerin açıklaması Başlangıçta ASCII tablosunun kontrol karakterlerinin teletip yoluyla veri alışverişi, delikli banttan veri girişi sağlamak ve harici cihazların en basit kontrolü için kullanıldığına dikkat edilmelidir.
    Şu anda tablodaki ASCII kontrol karakterlerinin çoğu artık bu yükü taşımamaktadır ve başka amaçlar için kullanılabilir. Kod Açıklama
    NUL, 00Boş, boş
    SO-01Başlığın Başlangıcı
    STX 02TeXt'in başlangıcı, metnin başlangıcı.
    ETX 03TeXt'in sonu
    EOT, 04İletimin Sonu
    ENQ, 05Sormak. Lütfen onaylayın
    ACK, 06Teşekkürler. onaylıyorum
    B.E.L.07Bell, ara
    Lisans 08Geri tuşu, bir karakter geri gitme
    SEKME, 09Sekme, yatay sekme
    LF, 0ASatır Beslemesi, satır beslemesi.
    Artık çoğu programlama dilinde \n olarak gösterilir
    VT, 0BDikey Sekme, dikey tablolama.
    FF, 0CForm beslemesi, sayfa beslemesi, yeni sayfa
    CR, 0DSatırbaşı
    Artık çoğu programlama dilinde \r olarak gösterilir
    Yani, 0EDışarı Kaydır, yazıcıdaki mürekkep şeridinin rengini değiştirin
    SI, 0FShift In, yazdırma aygıtındaki mürekkep şeridinin rengini geri döndürür
    DLE, 10Data Link Escape, veri aktarımına kanal geçişi
    DC1, 11
    DC2, 12
    DC3, 13
    DC4, 14
    Cihaz Kontrolü, cihaz kontrol sembolleri
    NAK 15Olumsuz Onay, onaylamıyorum.
    SEN, 16senkronizasyon. Senkronizasyon sembolü
    ETB, 17Metin Bloğunun Sonu, metin bloğunun sonu
    CAN, 18İptal, daha önce geçirilen bir işlemin iptal edilmesi
    EM, 19Ortamın Sonu
    ALT, 1AYedek, ikame. İletim sırasında değeri kaybolan veya bozulan karakterin yerine konur
    ESC, 1BKaçış kaçış dizisi
    FS, 1CDosya Ayırıcı, dosya ayırıcı
    GS, 1DGrup Ayırıcı, grup ayırıcı
    RS, 1EKayıt Ayırıcı
    ABD, 1FBirim Ayırıcı, birim ayırıcı
    DEL, 7FSil, son karakteri sil.

    Metin yazmak için kullanılan semboller kümesine ne ad verilir? alfabetik olarak.

    Alfabedeki karakter sayısı güç.

    Bilgi miktarını belirleme formülü: N = 2b,

    burada N, alfabenin önem derecesidir (sembollerin sayısı),

    b, bit sayısıdır (sembolün bilgi ağırlığı).

    256 karakter kapasiteli bir alfabeye neredeyse gerekli tüm karakterler yerleştirilebilir. Bu alfabenin adı yeterli.

    Çünkü 256 = 2 8 ise 1 karakterin ağırlığı 8 bittir.

    8 bitlik ölçü birimine bir isim verildi 1 bayt:

    1 bayt = 8 bit.

    Bilgisayar metnindeki her karakterin ikili kodu 1 byte hafıza kaplar.

    Metinsel bilgiler bilgisayar belleğinde nasıl temsil edilir?

    Bayt, belleğin adreslenebilir en küçük kısmı olduğundan ve bu nedenle işlemci, metin işlemeyi gerçekleştirirken her karaktere ayrı ayrı erişebildiğinden, karakterleri bayt bayt kodlamanın rahatlığı açıktır. Öte yandan 256 karakter, çok çeşitli karakter bilgilerini temsil etmek için oldukça yeterlidir.

    Şimdi her karaktere hangi sekiz bitlik ikili kodun yerleştirileceği sorusu ortaya çıkıyor.

    Bunun şartlı bir mesele olduğu açıktır, kodlamanın birçok yolunu bulabilirsiniz.

    Bilgisayar alfabesindeki tüm karakterler 0'dan 255'e kadar numaralandırılır. Her sayı, 00000000'dan 11111111'e kadar sekiz bitlik bir ikili koda karşılık gelir. Bu kod, ikili sayı sistemindeki karakterin yalnızca sıra numarasıdır.

    Bilgisayar alfabesindeki tüm karakterlere seri numaralarının atandığı tabloya kodlama tablosu denir.

    Farklı bilgisayar türleri için farklı kodlama tabloları kullanılır.

    Tablo, PC'ler için uluslararası standart haline geldi. ASCII(asci olarak telaffuz edilir) (Bilgi Değişimi için Amerikan Standart Kodu).

    ASCII kod tablosu iki bölüme ayrılmıştır.

    Tablonun yalnızca ilk yarısı uluslararası bir standarttır; sayıları içeren karakterler 0 (00000000), kadar 127 (01111111).

    ASCII kodlama tablosunun yapısı
    Seri numarası Kod Sembol
    0 - 31 00000000 - 00011111

    0'dan 31'e kadar sayıların bulunduğu karakterlere kontrol karakterleri denir.
    İşlevleri, metnin ekranda görüntülenmesi veya yazdırılması, ses sinyali verilmesi, metnin işaretlenmesi vb. işlemlerini kontrol etmektir.

    32 - 127 00100000 - 01111111

    Tablonun standart kısmı (İngilizce). Buna Latin alfabesinin küçük ve büyük harfleri, ondalık rakamlar, noktalama işaretleri, her türlü parantez, ticari ve diğer semboller dahildir.
    Karakter 32 bir boşluktur, yani. metinde boş konum.
    Geri kalan her şey belirli işaretlerle yansıtılır.

    128 - 255 10000000 - 11111111

    Tablonun alternatif kısmı (Rusça).
    ASCII kod tablosunun kod sayfası olarak adlandırılan ikinci yarısı (10000000 ile başlayan ve 11111111 ile biten 128 kod) farklı seçeneklere sahip olabilir, her seçeneğin kendi numarası vardır.
    Kod sayfası öncelikle Latince dışındaki ulusal alfabelere uyum sağlamak için kullanılır. Rus ulusal kodlamalarında, Rus alfabesinin karakterleri tablonun bu kısmına yerleştirilmiştir.

    ASCII kod tablosunun ilk yarısı

    Kodlama tablosunda harflerin (büyük ve küçük harf) alfabetik sıraya göre, sayıların ise artan değerlere göre sıralandığına dikkatinizi çekerim. Karakterlerin düzenlenmesinde sözlükbilimsel sıraya bu şekilde uyulması, alfabenin sıralı kodlanması ilkesi olarak adlandırılır.

    Rus alfabesinin harfleri için sıralı kodlama ilkesi de gözetilmektedir.

    ASCII kod tablosunun ikinci yarısı

    Ne yazık ki şu anda beş farklı Kiril kodlaması mevcut (KOI8-R, Windows. MS-DOS, Macintosh ve ISO). Bu nedenle, Rusça metnin bir bilgisayardan diğerine, bir yazılım sisteminden diğerine aktarılmasında sıklıkla sorunlar ortaya çıkar.

    Kronolojik olarak, Rusça harfleri bilgisayarlarda kodlamanın ilk standartlarından biri KOI8'di ("Bilgi Değişim Kodu, 8 bit"). Bu kodlama 70'li yıllarda EC serisi bilgisayarların bilgisayarlarında kullanılmış ve 80'li yılların ortalarından itibaren UNIX işletim sisteminin ilk Ruslaştırılmış sürümlerinde kullanılmaya başlanmıştır.

    MS DOS işletim sisteminin hakim olduğu 90'lı yılların başından itibaren, CP866 kodlaması kalır ("CP", "Kod Sayfası", "kod sayfası" anlamına gelir).

    Mac OS işletim sistemini çalıştıran Apple bilgisayarlar kendi Mac kodlamalarını kullanır.

    Ayrıca Uluslararası Standardizasyon Örgütü (Uluslararası Standartlar Örgütü, ISO), Rus dili için standart olarak ISO 8859-5 adı verilen başka bir kodlamayı onayladı.

    Şu anda kullanılan en yaygın kodlama, CP1251 olarak kısaltılan Microsoft Windows'tur.

    90'lı yılların sonundan bu yana, karakter kodlamasının standardizasyon sorunu, yeni bir uluslararası standardın getirilmesiyle çözüldü. Unicode. Bu 16 bitlik bir kodlamadır, yani. karakter başına 2 bayt hafızaya sahiptir. Elbette bu durumda kaplanan hafıza miktarı 2 kat artar. Ancak böyle bir kod tablosu 65536 karaktere kadar eklenmesine izin verir. Unicode standardının tam özellikleri, dünyadaki mevcut, tükenmiş ve yapay olarak oluşturulmuş tüm alfabelerin yanı sıra birçok matematiksel, müzikal, kimyasal ve diğer sembolleri içerir.

    Kelimelerin bilgisayarın hafızasında nasıl görüneceğini hayal etmek için bir ASCII tablosu kullanmayı deneyelim. Kelimelerin bilgisayar belleğindeki dahili temsili

    Bazen başka bir bilgisayardan alınan Rus alfabesinin harflerinden oluşan metin okunamıyor - monitör ekranında bir tür "abrakadabra" görünüyor. Bunun nedeni bilgisayarların Rus dilinin farklı karakter kodlamalarını kullanmasıdır.