Karakter asci kodları. ASCII kodlaması (bilgi alışverişi için Amerikan standart kodu) - Latince için temel metin kodlaması

Her bilgisayarın uyguladığı kendi karakter seti vardır. Böyle bir set 26 adet büyük ve küçük harf, rakam ve özel karakter (nokta, boşluk vb.) içerir. Tam sayılara çevrilen sembollere kod adı verilir. Bilgisayarların aynı kod setine sahip olması için standartlar geliştirildi.

ASCII standardı

ASCII (Amerikan Bilgi Değişimi Standart Kodu), bilgi alışverişi için Amerikan standart kodudur. Her ASCII karakterinin 7 biti vardır, dolayısıyla maksimum karakter sayısı 128'dir (Tablo 1). 0 ile 1F arasındaki kodlar yazdırılmayan kontrol karakterleridir. Veri aktarımı için çok sayıda yazdırılamayan ASCII karaktere ihtiyaç vardır. Örneğin, bir mesaj başlık başlangıç karakteri SOH, başlığın kendisi ve metin başlangıç karakteri STX, metnin kendisi ve metin bitiş karakteri ETX ve iletim bitiş karakteri EOT'den oluşabilir. Ancak veriler ağ üzerinden aktarımın başlangıcından ve bitişinden kendileri sorumlu olan paketler halinde iletilir. Yani yazdırılamayan karakterler neredeyse hiç kullanılmaz.

Tablo 1 - ASCII kod tablosu

Sayı Komut Değeri Sayı Komut Değeri

0	BOŞ	boş işaretçisi	10	DLE	İletim sisteminden çıkma
1	SOH	başlık başlangıcı	11	DC1	Cihaz yönetimi
2	STX	Metnin başlangıcı	12	DC2	Cihaz yönetimi
3	ETX	Metnin sonu	13	DC3	Cihaz yönetimi
4	EOT	İletimin sonu	14	DC4	Cihaz yönetimi
5	ACK	Rica etmek	15	NAK	Resepsiyonun onaylanmaması
6	BEL	Kabul onayı	16	SEN	Basit
7	BS	Çan sembolü	17	ETB	İletim bloğunun sonu
8	HT	Geri girinti	18	OLABİLMEK	işaret
9	LF	Yatay sekme	19	EM	Medya Sonu
A	VT	Satır çevirisi	1 A	ALT	alt simge
B	FF	Dikey sekme	1B	ESC	çıkış
C	CR	Sayfa çevirisi	1C	FS	Dosya ayırıcı
D	BU YÜZDEN	Satırbaşı	1 boyutlu	GS	Grup ayırıcı
e	Sİ	Ek bir kayda geçiş	1E	RS	Kayıt ayırıcı
	Sİ	Standart kasaya geçiş	1F	BİZ	Modül ayırıcı

Sayı Sembol Sayı Sembol Sayı Sembol Sayı Sembol Sayı Sembol Sayı Sembol

20	uzay	30	0	40	@	50	P	60	.	70	P
21	!	31	1	41	A	51	Q	61	A	71	Q
22	‘	32	2	42	B	52	R	62	B	72	R
23	#	33	3	43	C	53	S	63	C	73	S
24	φ	34	4	44	D	54	T	64	D	74	T
25	%	35	5	45	e	55	VE	65	e	75	Ve
26	&	36	6	46	F	56	V	66	F	76	v
27	‘	37	7	47	G	57	K	67	G	77	w
28	(	38	8	48	H	58	X	68	H	78	X
29	)	39	9	49	BEN	59	e	69	Ben	70	sen
2A	‘	3 A	;	4A	J	5A	Z	6A	J	7A	z
2B	+	3B	;	4B	k	5B	[	6B	k	7B	{
2C	‘	3C	<	4C	L	5C	\	6C	ben	7C	\|
2 boyutlu	—	3 boyutlu	=	4 boyutlu	M	5 boyutlu	]	6 boyutlu	M	7 boyutlu	}
2E		3E	>	4E	N	5E	—	6E	N	7E	~
2F	/	3F	G	4F	Ö	5F	_	6F	Ö	7F	DEL

Unicode standardı

Önceki kodlama İngilizce için harikadır ancak diğer diller için uygun değildir. Örneğin, Almanca'da çift nokta işaretleri varken, Fransızca'da aksan vardır. Bazı dillerin tamamen farklı alfabeleri vardır. ASCII'yi genişletmeye yönelik ilk girişim, önceki kodlamayı 128 karakter daha genişleten IS646 idi. Latin harfleri vuruşlar ve aksanlarla eklendi ve Latince 1 olarak adlandırıldı. Bir sonraki girişim, bir kod sayfası içeren IS 8859'du. Hala genişleme girişimleri vardı, ancak bu evrensel değildi. UNICODE kodlaması (10646'dır) oluşturuldu. Kodlamanın amacı, her karaktere kod işaretçisi adı verilen tek bir sabit 16 bitlik değer atamaktır. Toplamda 65536 işaretçi elde ediliyor. Yerden tasarruf etmek için 0-255 kodları için Latin-1'i kullandık, ASII'yi kolayca UNICODE olarak değiştirdik. Bu standart birçok sorunu çözdü, ancak hepsini değil. Örneğin Japonca için yeni kelimelerin gelmesiyle bağlantılı olarak terim sayısını yaklaşık 20 bin artırmak gerekiyor, ayrıca Braille alfabesini de etkinleştirmeniz gerekiyor.

[8 bit kodlamalar: ASCII, KOI-8R ve CP1251] ABD'de oluşturulan ilk kodlama tabloları bayttaki sekizinci biti kullanmıyordu. Metin bir bayt dizisi olarak sunuldu, ancak sekizinci bit dikkate alınmadı (resmi amaçlarla kullanıldı).

ASCII tablosu (Bilgi Değişimi için Amerikan Standart Kodu) genel olarak tanınan bir standart haline geldi. ASCII tablosunun ilk 32 karakteri (00 - 1F) yazdırılmayan karakterler için kullanıldı. Bir baskı cihazını ve benzerlerini kontrol etmek için tasarlandılar. Geri kalanlar (20'den 7F'ye kadar) normal (yazdırılabilir) karakterlerdir.

Tablo 1 - ASCII kodlaması

Aralık Onaltılı Ekim Karakter Açıklama

0	0	000		hükümsüz
1	1	001		başlığın başlangıcı
2	2	002		metnin başlangıcı
3	3	003		metnin sonu
4	4	004		iletim sonu
5	5	005		sorgu
6	6	006		kabullenmek
7	7	007		zil
8	8	010		geri tuşu
9	9	011		yatay sekme
10	A	012		Yeni hat
11	B	013		dikey sekme
12	C	014		yeni sayfa
13	D	015		satırbaşı
14	e	016		dışarı çıkmak
15	F	017		vardiya
16	10	020		veri bağlantısı kaçışı
17	11	021		cihaz kontrolü 1
18	12	022		cihaz kontrolü 2
19	13	023		cihaz kontrolü 3
20	14	024		cihaz kontrolü 4
21	15	025		olumsuz kabul
22	16	026		senkron rölanti
23	17	027		Trans'ın sonu. engellemek
24	18	030		iptal etmek
25	19	031		ortamın sonu
26	1 A	032		yerine geçmek
27	1B	033		kaçmak
28	1C	034		dosya ayırıcı
29	1 boyutlu	035		grup ayırıcı
30	1E	036		kayıt ayırıcı
31	1F	037		birim ayırıcı
32	20	040		uzay
33	21	041	!
34	22	042	"
35	23	043	#
36	24	044	$
37	25	045	%
38	26	046	&
39	27	047	"
40	28	050	(
41	29	051	)
42	2A	052	*
43	2B	053	+
44	2C	054	,
45	2 boyutlu	055	-
46	2E	056	.
47	2F	057	/
48	30	060	0
49	31	061	1
50	32	062	2
51	33	063	3
52	34	064	4
53	35	065	5
54	36	066	6
55	37	067	7
56	38	070	8
57	39	071	9
58	3 A	072	:
59	3B	073	;
60	3C	074	<
61	3 boyutlu	075	=
62	3E	076	>
63	3F	077	?

Aralık Onaltılık Ekim Karakter

64	40	100	@
65	41	101	A
66	42	102	B
67	43	103	C
68	44	104	D
69	45	105	e
70	46	106	F
71	47	107	G
72	48	110	H
73	49	111	BEN
74	4A	112	J
75	4B	113	k
76	4C	114	L
77	4 boyutlu	115	M
78	4E	116	N
79	4F	117	Ö
80	50	120	P
81	51	121	Q
82	52	122	R
83	53	123	S
84	54	124	T
85	55	125	sen
86	56	126	V
87	57	127	K
88	58	130	X
89	59	131	e
90	5A	132	Z
91	5B	133	[
92	5C	134	\
93	5 boyutlu	135	]
94	5E	136	^
95	5F	137	_
96	60	140	`
97	61	141	A
98	62	142	B
99	63	143	C
100	64	144	D
101	65	145	e
102	66	146	F
103	67	147	G
104	68	150	H
105	69	151	Ben
106	6A	152	J
107	6B	153	k
108	6C	154	ben
109	6 boyutlu	155	M
110	6E	156	N
111	6F	157	Ö
112	70	160	P
113	71	161	Q
114	72	162	R
115	73	163	S
116	74	164	T
117	75	165	sen
118	76	166	v
119	77	167	w
120	78	170	X
121	79	171	sen
122	7A	172	z
123	7B	173	{
124	7C	174	\|
125	7 boyutlu	175	}
126	7E	176	~
127	7F	177	DEL

Kolayca görebileceğiniz gibi, bu kodlamada yalnızca Latin harfleri ve İngilizce'de kullanılanlar temsil edilmektedir. Aritmetik ve diğer hizmet sembolleri de vardır. Ancak Rusça harfler, hatta Almanca ve Fransızca için özel Latin harfleri bile yoktur. Bunu açıklamak kolaydır; kodlama bir Amerikan standardı olarak geliştirilmiştir. Dünya çapında bilgisayarlar kullanılmaya başlandıkça diğer karakterlerin de kodlanması gerekti.

Bunu yapmak için her baytta sekizinci bitin kullanılmasına karar verildi. Böylece karakterleri kodlamak için kullanılabilecek 128 değer daha mevcuttu (80'den FF'ye kadar). Sekiz bitlik tablolardan ilki - "genişletilmiş ASCII" (Genişletilmiş ASCII) - bazı Batı Avrupa dillerinde kullanılan Latin karakterlerinin çeşitli varyantlarını içeriyordu. Ayrıca sözde grafikler de dahil olmak üzere başka ek karakterler de vardı.

Sözde grafik karakterler, yalnızca metin karakterlerini görüntüleyerek bazı grafik benzerlikleri sağlamaya olanak tanır. Örneğin, sözde grafiklerin kullanılmasıyla FAR Manager dosya yönetimi programı çalışır.

Genişletilmiş ASCII tablosunda Rusça harfler yoktu. Rusya'da (eski adıyla SSCB) ve diğer eyaletlerde, 8 bitlik metin dosyalarında belirli "ulusal" karakterleri temsil etmeyi mümkün kılan kendi kodlamaları oluşturuldu - Lehçe ve Çek dillerinin Latin harfleri, Kiril (Rusça harfler dahil) ve diğer alfabeler.

Yaygınlaşan tüm kodlamalarda ilk 127 karakter (yani sekizinci biti 0'a eşit olan bayt değerleri) ASCII ile aynıdır. Yani bir ASCII dosyası bu kodlamaların herhangi birinde çalışır; İngilizce dilinin harfleri de aynı şekilde temsil edilir.

Organizasyon ISO (Uluslararası Standardizasyon Organizasyonu - Uluslararası Standartlar Organizasyonu), ISO 8859 standartlarını benimsemiştir. Farklı dil grupları için 8 bitlik kodlamaları tanımlar. Dolayısıyla ISO 8859-1, ABD ve Batı Avrupa için bir tablo olan Genişletilmiş ASCII'dir. ISO 8859-5 ise Kiril (Rusça dahil) için bir tablodur.

Ancak tarihsel nedenlerden dolayı ISO 8859-5 kodlaması tutunamadı. Gerçekte, Rus dili için aşağıdaki kodlamalar kullanılmaktadır:

Kod Sayfası 866 (CP866), diğer adıyla "DOS", diğer adıyla "alternatif GOST kodlaması". 1990'ların ortalarına kadar yaygın olarak kullanıldı; artık sınırlı kullanımda. İnternette metin dağıtımı için pratik olarak kullanılmaz.
- KOI-8. 70'li ve 80'li yıllarda geliştirildi. Rus İnternet'te posta mesajları göndermek için genel kabul görmüş bir standarttır. Ayrıca Linux dahil Unix ailesinin işletim sistemlerinde de yaygın olarak kullanılmaktadır. KOI-8'in Rusça versiyonuna KOI-8R adı verilir; diğer Kiril dilleri için versiyonlar vardır (örneğin, KOI8-U Ukrayna dilinin bir çeşididir).
- Kod Sayfası 1251, CP1251, Windows-1251. Windows sisteminde Rusça dilini desteklemek için Microsoft tarafından geliştirilmiştir.

CP866'nın temel avantajı, sözde karakterlerin Genişletilmiş ASCII'dekiyle aynı yerlerde korunmasıydı; bu nedenle, ünlü Norton Commander gibi yabancı metin programları değişiklik yapmadan çalışabilir. CP866 şu anda FAR Manager da dahil olmak üzere metin pencerelerinde veya tam ekran metin modunda çalışan Windows programları için kullanılmaktadır.

CP866'daki metinler son yıllarda oldukça nadirdir (ancak Windows'ta Rusça dosya adlarını kodlamak için kullanılır). Bu nedenle diğer iki kodlama üzerinde duracağız - KOI-8R ve CP1251.

Gördüğünüz gibi CP1251 kodlama tablosunda Rusça harfler alfabetik sıraya göre düzenlenmiştir (ancak YO harfi hariç). Bu düzenleme bilgisayar programlarının alfabetik olarak sıralanmasını çok kolaylaştırır.

Ancak KOI-8R'de Rusça harflerin sırası rastgele görünüyor. Ama aslında öyle değil.

Birçok eski programda, metin işlenirken veya aktarılırken 8. bit kayboluyordu. (Artık bu tür programların neredeyse "soyu tükendi", ancak 80'lerin sonlarında ve 90'ların başında yaygındılar). 8 bitlik bir değerden 7 bitlik bir değer elde etmek için yüksek basamaklı rakamdan 8 çıkarmak yeterlidir; örneğin E1 61 olur.

Şimdi KOI-8R'yi ASCII tablosuyla karşılaştırın (Tablo 1). Rus harflerinin Latin harfleriyle tam bir uyum içinde olduğunu göreceksiniz. Sekizinci bit kaybolursa, küçük Rus harfleri büyük Latin harflerine, büyük Rus harfleri de küçük Latin harflerine dönüşür. Yani KOI-8'deki E1, Rusça "A", ASCII'deki 61 ise Latince "a"dır.

Böylece KOI-8, 8. bit kaybıyla Rusça metnin okunabilirliğini korumanıza olanak tanır. “Herkese merhaba”, “pRIWET WSEM” olur.

Son zamanlarda hem kodlama tablosundaki karakterlerin alfabetik sırası hem de 8. bitin kaybıyla okunabilirlik belirleyici önemini yitirmiştir. Modern bilgisayarlardaki sekizinci bit, iletim veya işlem sırasında kaybolmaz. Ve alfabetik sıralama, kodların basit bir karşılaştırması değil, kodlama dikkate alınarak yapılır. (Bu arada, CP1251 kodları tamamen alfabetik değil - Y harfi yerinde değil).

İki ortak kodlamanın olması nedeniyle, İnternet ile çalışırken (posta, Web sitelerine göz atarken), bazen Rusça metin yerine anlamsız bir dizi harf görebilirsiniz. Örneğin, "Ben SBYFEMHEL'im". Sadece "saygılarımla" kelimeleri; ancak bunlar CP1251 kodlamasıyla kodlandı ve bilgisayar, metni KOI-8 tablosuna göre çözdü. Tam tersine aynı kelimeler KOI-8'de kodlanmış olsaydı ve bilgisayar metni CP1251 tablosuna göre çözseydi sonuç “U HCHBTSEOYEN” olurdu.

Bazen bir bilgisayarın Rusça harflerin şifresini çözmesi ve hatta Rus dili için tasarlanmamış bir tabloya göre olması mümkündür. Daha sonra Rus harfleri yerine anlamsız bir karakter kümesi belirir (örneğin, Doğu Avrupa dillerinin Latin harfleri); genellikle "timsahlar" olarak anılırlar.

Çoğu durumda, modern programlar İnternet belgelerinin (e-postalar ve Web sayfaları) kodlamalarını kendi başlarına belirlemeyi başarır. Ancak bazen “yanlış ateşlenirler” ve sonra garip Rus harfleri veya “timsah” dizilerini görebilirsiniz. Kural olarak böyle bir durumda gerçek metni görüntülemek için program menüsünde kodlamayı manuel olarak seçmek yeterlidir.

Makale için http://open-office.edusite.ru/TextProcessor/p5aa1.html sayfasındaki bilgiler kullanıldı.

Siteden alınan materyal:

Office 365 için Excel Office 365 için Word Office 365 için Outlook Office 365 için PowerPoint Office 365 için Publisher Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2 013 Yayıncı 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 200 7 PowerPoint 2007 Publisher 2007 Erişim 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standardı 2007 Visio Standardı 2010 Daha Az

Bu makalede Belgeye ASCII veya Unicode karakter ekleme

Yalnızca birkaç özel karakter veya simge girmeniz gerekiyorsa klavye kısayollarını kullanabilirsiniz. ASCII karakterlerinin listesi için aşağıdaki tablolara veya Klavye kısayollarını kullanarak ulusal alfabe ekleme makalesine bakın.

Notlar:

ASCII karakterleri ekleme

ASCII karakteri eklemek için karakter kodunu girerken ALT tuşunu basılı tutun. Örneğin, derece sembolü (°) eklemek için ALT tuşunu basılı tutun, ardından sayısal tuş takımında 0176 girin.

Sayıları girmek için ana klavyedeki sayıları değil sayısal tuş takımını kullanın. Sayısal tuş takımında sayı girmeniz gerekiyorsa NUM LOCK göstergesinin açık olduğundan emin olun.

Unicode karakterler ekleme

Unicode karakter eklemek için karakter kodunu yazın ve sırayla ALT + X tuşlarına basın. Örneğin, dolar ($) karakteri eklemek için 0024 yazın ve sırayla ALT + X tuşlarına basın. Tüm Unicode karakter kodları için bkz.

Önemli: PowerPoint ve InfoPath gibi bazı Microsoft Office programları Unicode kodlarının karakterlere dönüştürülmesini desteklemez. Bu programlardan birine Unicode karakter eklemeniz gerekiyorsa kullanın.

Notlar:

ALT+X tuşlarına bastıktan sonra yanlış bir Unicode karakteri görüntülenirse doğru kodu seçin ve ardından ALT+X tuşlarına tekrar basın.

Ayrıca kodun önüne "U+" yazmalısınız. Örneğin, "1U+B5" yazıp ALT+X tuşlarına basmak "1μ" metnini görüntülerken, "1B5" yazıp ALT+X tuşlarına basmak "Ƶ" karakterini görüntüler.

Sembol tablosunu kullanma

Karakter tablosu, seçilen bir yazı tipi için mevcut karakterleri görüntülemenizi sağlayan, Microsoft Windows'ta yerleşik bir programdır.

Sembol tablosunu kullanarak, tek tek karakterleri veya bir grup karakteri panoya kopyalayabilir ve bunları, bu karakterlerin görüntülenmesini destekleyen herhangi bir programa yapıştırabilirsiniz. Sembol tablosunun açılması

Windows 10'da Görev çubuğundaki arama kutusuna "sembol" yazın ve arama sonuçlarından sembol tablosunu seçin.

Windows 8'de Başlangıç ekranına "sembol" kelimesini yazın ve arama sonuçlarından sembol tablosunu seçin.

Windows 7'de Başlat düğmesine tıklayın, Tüm Programlar, Donatılar, Sistem Araçları'nı seçin ve Karakter Eşlem'e tıklayın.

Karakterler yazı tipine göre gruplandırılmıştır. Uygun karakter setini seçmek için yazı tipi listesine tıklayın. Bir sembolü seçmek için onu tıklayın, ardından Seç düğmesini tıklayın. Sembol eklemek için belgede istediğiniz konuma sağ tıklayın ve Yapıştır'ı seçin.

Sık kullanılan karakter kodları

Karakterlerin tam listesi için bilgisayarda ASCII karakter kodu tablosuna veya kümelere göre sıralanmış Unicode karakter tablolarına bakın.

Glif

Para birimleri

yasal semboller

Matematiksel semboller

Kesirler

Noktalama işaretleri ve lehçe simgeleri

Şekil Sembolleri

Yaygın olarak kullanılan aksan işaretleri için kodlar

Gliflerin ve karşılık gelen kodların tam listesi için bkz.

Glif

Yazdırılmayan ASCII kontrol karakterleri

Yazıcılar gibi bazı çevre birimlerini kontrol etmek için kullanılan karakterler ASCII tablosunda 0-31 arasında numaralandırılmıştır. Örneğin sayfa besleme/yeni sayfa karakteri 12 sayısına karşılık gelir. Bu karakter yazıcıya bir sonraki sayfanın başına gitmesini söyler.

ASCII yazdırılamayan kontrol karakter tablosu

Ondalık sayı	İmza	Ondalık sayı	İmza
		Veri kanalı sürümü
Başlık başlangıcı		İlk cihaz kontrol kodu
Metnin başlangıcı		İkinci cihaz kontrol kodu
Metnin sonu		Üçüncü cihaz kontrol kodu
İletimin sonu		Dördüncü cihaz kontrol kodu
	beş köşeli	Olumsuz onay
Onayla		Senkron aktarım modu
Ses sinyali		Veri bloğunun sonu

Yatay sekme		Medya Sonu
Satır besleme/yeni satır		Yedek karakter
Dikey sekme			aşmak
Sayfa Çevirisi/Yeni Sayfa	on iki	Dosya ayırıcı
Satırbaşı		Grup ayırıcı
Rakamları kaydetmeden geçiş yapın		Kayıt ayırıcı
Bit koruyucu kaydırma	on beş	Veri ayırıcı

Aralık	altıgen	Sembol	Aralık	altıgen	Sembol
000	00	uzman. hayır	128	80	Ђ
001	01	uzman. SOH	129	81	Ѓ
002	02	uzman. STX	130	82	‚
003	03	uzman. ETX	131	83	ѓ
004	04	uzman. EOT	132	84	„
005	05	uzman. TRQ	133	85	…
006	06	uzman. ACK	134	86	†
007	07	uzman. BEL	135	87	‡
008	08	uzman. BS	136	88	€
009	09	uzman. SEKME	137	89	‰
010	0A	uzman. LF	138	8A	Љ
011	0B	uzman. VT	139	8B	‹ ‹
012	0C	uzman. FF	140	8C	Њ
013	0 gün	uzman. CR	141	8 boyutlu	Ќ
014	0E	uzman. BU YÜZDEN	142	8E	Ћ
015	0F	uzman. Sİ	143	8F	Џ
016	10	uzman. DLE	144	90	ђ
017	11	uzman. DC1	145	91	‘
018	12	uzman. DC2	146	92	’
019	13	uzman. DC3	147	93	“
020	14	uzman. DC4	148	94	”
021	15	uzman. NAK	149	95
022	16	uzman. SEN	150	96	–
023	17	uzman. ETB	151	97	—
024	18	uzman. OLABİLMEK	152	98
025	19	uzman. EM	153	99	™
026	1 A	uzman. ALT	154	9A	љ
027	1B	uzman. ESC	155	9B	›
028	1C	uzman. FS	156	9C	њ
029	1 boyutlu	uzman. GS	157	9D	ќ
030	1E	uzman. RS	158	9E	ћ
031	1F	uzman. BİZ	159	9F	џ
032	20	debriyaj SP (Uzay)	160	A0
033	21	!	161	A1	Ў
034	22	"	162	A2	ў
035	23	#	163	A3	Ћ
036	24	$	164	A4	¤
037	25	%	165	A5	Ґ
038	26	&	166	A6	¦
039	27	"	167	A7	§
040	28	(	168	A8	Hey
041	29	)	169	A9	©
042	2A	*	170	AA	Є
043	2B	+	171	AB	«
044	2C	,	172	AC	¬
045	2 boyutlu	-	173	Reklam
046	2E	.	174	AE	®
047	2F	/	175	AF	Ї
048	30	0	176	B0	°
049	31	1	177	B1	±
050	32	2	178	B2	І
051	33	3	179	B3	і
052	34	4	180	B4	ґ
053	35	5	181	B5	µ
054	36	6	182	B6	¶
055	37	7	183	B7	·
056	38	8	184	B8	sen
057	39	9	185	B9	№
058	3 A	:	186	Lisans	є
059	3B	;	187	BB	»
060	3C	<	188	M.Ö	ј
061	3 boyutlu	=	189	BD	Ѕ
062	3E	>	190	OLMAK	ѕ
063	3F	?	191	erkek arkadaş	ї
064	40	@	192	C0	A
065	41	A	193	C1	B
066	42	B	194	C2	İÇİNDE
067	43	C	195	C3	G
068	44	D	196	C4	D
069	45	e	197	C5	e
070	46	F	198	C6	VE
071	47	G	199	C7	K
072	48	H	200	C8	VE
073	49	BEN	201	C9	e
074	4A	J	202	CA	İLE
075	4B	k	203	CB	L
076	4C	L	204	CC	M
077	4 boyutlu	M	205	CD	H
078	4E	N	206	CE	HAKKINDA
079	4F	Ö	207	CF	P
080	50	P	208	D0	R
081	51	Q	209	D1	İLE
082	52	R	210	D2	T
083	53	S	211	D3	Şu tarihte:
084	54	T	212	D4	F
085	55	sen	213	D5	X
086	56	V	214	D6	C
087	57	K	215	D7	H
088	58	X	216	D8	K
089	59	e	217	D9	SCH
090	5A	Z	218	Savcı	Kommersant
091	5B	[	219	D.B.	S
092	5C	\	220	DC	B
093	5 boyutlu	]	221	GG	e
094	5E	^	222	Almanya	YU
095	5F	_	223	D.F.	BEN
096	60	`	224	E0	A
097	61	A	225	E1	B
098	62	B	226	E2	V
099	63	C	227	E3	G
100	64	D	228	E 4	D
101	65	e	229	E5	e
102	66	F	230	E6	Ve
103	67	G	231	E7	H
104	68	H	232	E8	Ve
105	69	Ben	233	E9	o
106	6A	J	234	EA	İle
107	6B	k	235	EB	ben
108	6C	ben	236	AB	M
109	6 boyutlu	M	237	ED	N
110	6E	N	238	enerji verimliliği	Ö
111	6F	Ö	239	EF	P
112	70	P	240	F0	R
113	71	Q	241	F1	İle
114	72	R	242	F2	T
115	73	S	243	F3	en
116	74	T	244	F4	F
117	75	sen	245	F5	X
118	76	v	246	F6	C
119	77	w	247	F7	H
120	78	X	248	F8	ş
121	79	sen	249	F9	şaka
122	7A	z	250	FA	B
123	7B	{	251	Facebook	S
124	7C	\|	252	FC	B
125	7 boyutlu	}	253	FD	ah
126	7E	~	254	F.E.	Yu
127	7F	Uzman. DEL	255	FF	BEN

Windows karakter kodlarının ASCII tablosu.
Özel (kontrol) karakterlerin açıklaması Başlangıçta ASCII tablosunun kontrol karakterlerinin teletip yoluyla veri alışverişi, delikli banttan veri girişi sağlamak ve harici cihazların en basit kontrolü için kullanıldığına dikkat edilmelidir.
Şu anda tablodaki ASCII kontrol karakterlerinin çoğu artık bu yükü taşımamaktadır ve başka amaçlar için kullanılabilir. Kod Açıklama

NUL, 00	Boş, boş
SO-01	Başlığın Başlangıcı
STX 02	TeXt'in başlangıcı, metnin başlangıcı.
ETX 03	TeXt'in sonu
EOT, 04	İletimin Sonu
ENQ, 05	Sormak. Lütfen onaylayın
ACK, 06	Teşekkürler. onaylıyorum
B.E.L.07	Bell, ara
Lisans 08	Geri tuşu, bir karakter geri gitme
SEKME, 09	Sekme, yatay sekme
LF, 0A	Satır Beslemesi, satır beslemesi. Artık çoğu programlama dilinde \n olarak gösterilir
VT, 0B	Dikey Sekme, dikey tablolama.
FF, 0C	Form beslemesi, sayfa beslemesi, yeni sayfa
CR, 0D	Satırbaşı Artık çoğu programlama dilinde \r olarak gösterilir
Yani, 0E	Dışarı Kaydır, yazıcıdaki mürekkep şeridinin rengini değiştirin
SI, 0F	Shift In, yazdırma aygıtındaki mürekkep şeridinin rengini geri döndürür
DLE, 10	Data Link Escape, veri aktarımına kanal geçişi
DC1, 11 DC2, 12 DC3, 13 DC4, 14	Cihaz Kontrolü, cihaz kontrol sembolleri
NAK 15	Olumsuz Onay, onaylamıyorum.
SEN, 16	senkronizasyon. Senkronizasyon sembolü
ETB, 17	Metin Bloğunun Sonu, metin bloğunun sonu
CAN, 18	İptal, daha önce geçirilen bir işlemin iptal edilmesi
EM, 19	Ortamın Sonu
ALT, 1A	Yedek, ikame. İletim sırasında değeri kaybolan veya bozulan karakterin yerine konur
ESC, 1B	Kaçış kaçış dizisi
FS, 1C	Dosya Ayırıcı, dosya ayırıcı
GS, 1D	Grup Ayırıcı, grup ayırıcı
RS, 1E	Kayıt Ayırıcı
ABD, 1F	Birim Ayırıcı, birim ayırıcı
DEL, 7F	Sil, son karakteri sil.

Metin yazmak için kullanılan semboller kümesine ne ad verilir? alfabetik olarak.

Alfabedeki karakter sayısı güç.

Bilgi miktarını belirleme formülü: N = 2b,

burada N, alfabenin önem derecesidir (sembollerin sayısı),

b, bit sayısıdır (sembolün bilgi ağırlığı).

256 karakter kapasiteli bir alfabeye neredeyse gerekli tüm karakterler yerleştirilebilir. Bu alfabenin adı yeterli.

Çünkü 256 = 2 8 ise 1 karakterin ağırlığı 8 bittir.

8 bitlik ölçü birimine bir isim verildi 1 bayt:

1 bayt = 8 bit.

Bilgisayar metnindeki her karakterin ikili kodu 1 byte hafıza kaplar.

Metinsel bilgiler bilgisayar belleğinde nasıl temsil edilir?

Bayt, belleğin adreslenebilir en küçük kısmı olduğundan ve bu nedenle işlemci, metin işlemeyi gerçekleştirirken her karaktere ayrı ayrı erişebildiğinden, karakterleri bayt bayt kodlamanın rahatlığı açıktır. Öte yandan 256 karakter, çok çeşitli karakter bilgilerini temsil etmek için oldukça yeterlidir.

Şimdi her karaktere hangi sekiz bitlik ikili kodun yerleştirileceği sorusu ortaya çıkıyor.

Bunun şartlı bir mesele olduğu açıktır, kodlamanın birçok yolunu bulabilirsiniz.

Bilgisayar alfabesindeki tüm karakterler 0'dan 255'e kadar numaralandırılır. Her sayı, 00000000'dan 11111111'e kadar sekiz bitlik bir ikili koda karşılık gelir. Bu kod, ikili sayı sistemindeki karakterin yalnızca sıra numarasıdır.

Bilgisayar alfabesindeki tüm karakterlere seri numaralarının atandığı tabloya kodlama tablosu denir.

Farklı bilgisayar türleri için farklı kodlama tabloları kullanılır.

Tablo, PC'ler için uluslararası standart haline geldi. ASCII(asci olarak telaffuz edilir) (Bilgi Değişimi için Amerikan Standart Kodu).

ASCII kod tablosu iki bölüme ayrılmıştır.

Tablonun yalnızca ilk yarısı uluslararası bir standarttır; sayıları içeren karakterler 0 (00000000), kadar 127 (01111111).

ASCII kodlama tablosunun yapısı

Seri numarası	Kod	Sembol
0 - 31	00000000 - 00011111	0'dan 31'e kadar sayıların bulunduğu karakterlere kontrol karakterleri denir. İşlevleri, metnin ekranda görüntülenmesi veya yazdırılması, ses sinyali verilmesi, metnin işaretlenmesi vb. işlemlerini kontrol etmektir.
32 - 127	00100000 - 01111111	Tablonun standart kısmı (İngilizce). Buna Latin alfabesinin küçük ve büyük harfleri, ondalık rakamlar, noktalama işaretleri, her türlü parantez, ticari ve diğer semboller dahildir. Karakter 32 bir boşluktur, yani. metinde boş konum. Geri kalan her şey belirli işaretlerle yansıtılır.
128 - 255	10000000 - 11111111	Tablonun alternatif kısmı (Rusça). ASCII kod tablosunun kod sayfası olarak adlandırılan ikinci yarısı (10000000 ile başlayan ve 11111111 ile biten 128 kod) farklı seçeneklere sahip olabilir, her seçeneğin kendi numarası vardır. Kod sayfası öncelikle Latince dışındaki ulusal alfabelere uyum sağlamak için kullanılır. Rus ulusal kodlamalarında, Rus alfabesinin karakterleri tablonun bu kısmına yerleştirilmiştir.

ASCII kod tablosunun ilk yarısı

Kodlama tablosunda harflerin (büyük ve küçük harf) alfabetik sıraya göre, sayıların ise artan değerlere göre sıralandığına dikkatinizi çekerim. Karakterlerin düzenlenmesinde sözlükbilimsel sıraya bu şekilde uyulması, alfabenin sıralı kodlanması ilkesi olarak adlandırılır.

Rus alfabesinin harfleri için sıralı kodlama ilkesi de gözetilmektedir.

ASCII kod tablosunun ikinci yarısı

Ne yazık ki şu anda beş farklı Kiril kodlaması mevcut (KOI8-R, Windows. MS-DOS, Macintosh ve ISO). Bu nedenle, Rusça metnin bir bilgisayardan diğerine, bir yazılım sisteminden diğerine aktarılmasında sıklıkla sorunlar ortaya çıkar.

Kronolojik olarak, Rusça harfleri bilgisayarlarda kodlamanın ilk standartlarından biri KOI8'di ("Bilgi Değişim Kodu, 8 bit"). Bu kodlama 70'li yıllarda EC serisi bilgisayarların bilgisayarlarında kullanılmış ve 80'li yılların ortalarından itibaren UNIX işletim sisteminin ilk Ruslaştırılmış sürümlerinde kullanılmaya başlanmıştır.

MS DOS işletim sisteminin hakim olduğu 90'lı yılların başından itibaren, CP866 kodlaması kalır ("CP", "Kod Sayfası", "kod sayfası" anlamına gelir).

Mac OS işletim sistemini çalıştıran Apple bilgisayarlar kendi Mac kodlamalarını kullanır.

Ayrıca Uluslararası Standardizasyon Örgütü (Uluslararası Standartlar Örgütü, ISO), Rus dili için standart olarak ISO 8859-5 adı verilen başka bir kodlamayı onayladı.

Şu anda kullanılan en yaygın kodlama, CP1251 olarak kısaltılan Microsoft Windows'tur.

90'lı yılların sonundan bu yana, karakter kodlamasının standardizasyon sorunu, yeni bir uluslararası standardın getirilmesiyle çözüldü. Unicode. Bu 16 bitlik bir kodlamadır, yani. karakter başına 2 bayt hafızaya sahiptir. Elbette bu durumda kaplanan hafıza miktarı 2 kat artar. Ancak böyle bir kod tablosu 65536 karaktere kadar eklenmesine izin verir. Unicode standardının tam özellikleri, dünyadaki mevcut, tükenmiş ve yapay olarak oluşturulmuş tüm alfabelerin yanı sıra birçok matematiksel, müzikal, kimyasal ve diğer sembolleri içerir.

Kelimelerin bilgisayarın hafızasında nasıl görüneceğini hayal etmek için bir ASCII tablosu kullanmayı deneyelim. Kelimelerin bilgisayar belleğindeki dahili temsili

Bazen başka bir bilgisayardan alınan Rus alfabesinin harflerinden oluşan metin okunamıyor - monitör ekranında bir tür "abrakadabra" görünüyor. Bunun nedeni bilgisayarların Rus dilinin farklı karakter kodlamalarını kullanmasıdır.