• کد 100 کدام کاراکتر است. رمزگذاری ASCII (کد استاندارد آمریکایی برای تبادل اطلاعات) - رمزگذاری متن اصلی برای لاتین

    اکسل برای آفیس 365 ورد برای آفیس 365 Outlook برای آفیس 365 پاورپوینت برای آفیس 365 ناشر برای آفیس 365 اکسل 2019 ورد 2019 Outlook 2019 پاورپوینت 2019 OneNote 2016 ناشر 2019 Visio Outlook 2019 Visio Professional 612019 ورد 620120 ok 2016 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 PowerPoint 2013 ورد201201 10 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 2007 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standards 2010 Visio Standards 2010 Visio

    در این مقاله درج یک کاراکتر ASCII یا Unicode در یک سند

    اگر فقط نیاز به وارد کردن چند کاراکتر یا نماد خاص دارید، می توانید از میانبرهای صفحه کلید استفاده کنید. برای فهرستی از کاراکترهای ASCII، به جداول زیر یا مقاله درج الفبای ملی با استفاده از میانبرهای صفحه کلید مراجعه کنید.

    یادداشت:

    درج کاراکترهای ASCII

    برای درج یک نویسه ASCII، کلید ALT را فشار داده و در حین وارد کردن کد کاراکتر نگه دارید. به عنوان مثال، برای درج نماد درجه (º)، کلید ALT را فشار داده و نگه دارید، سپس 0176 را در صفحه کلید عددی وارد کنید.

    از صفحه کلید عددی برای وارد کردن اعداد استفاده کنید، نه اعداد روی صفحه کلید اصلی. اگر نیاز به وارد کردن اعداد روی صفحه کلید عددی دارید، مطمئن شوید که نشانگر NUM LOCK روشن است.

    درج کاراکترهای یونیکد

    برای درج یک کاراکتر یونیکد، کد کاراکتر را تایپ کنید، سپس ALT + X را به ترتیب فشار دهید. به عنوان مثال، برای درج یک کاراکتر دلاری ($)، 0024 را تایپ کنید و ALT + X را به ترتیب فشار دهید. برای همه کدهای کاراکتر یونیکد، نگاه کنید.

    مهم: برخی از برنامه‌های مایکروسافت آفیس، مانند PowerPoint و InfoPath، از تبدیل کدهای یونیکد به نویسه پشتیبانی نمی‌کنند. اگر نیاز به درج یک کاراکتر یونیکد در یکی از این برنامه ها دارید، از .

    یادداشت:

      اگر بعد از فشار دادن ALT+X یک کاراکتر یونیکد نادرست نمایش داده شد، کد صحیح را انتخاب کنید و سپس دوباره ALT+X را فشار دهید.

      علاوه بر این، قبل از کد باید "U+" را وارد کنید. به عنوان مثال، با تایپ کردن "1U+B5" و فشار دادن ALT+X، متن "1µ" نمایش داده می شود، در حالی که با تایپ "1B5" و فشار دادن ALT+X، کاراکتر "Ƶ" نمایش داده می شود.

    با استفاده از جدول نمادها

    جدول کاراکترها برنامه ای است که در ویندوز مایکروسافت تعبیه شده است که به شما امکان می دهد کاراکترهای موجود برای یک فونت انتخاب شده را مشاهده کنید.

    با استفاده از جدول نمادها، می توانید کاراکترهای جداگانه یا گروهی از کاراکترها را در کلیپ بورد کپی کرده و آنها را در هر برنامه ای که از نمایش این کاراکترها پشتیبانی می کند، قرار دهید. باز کردن جدول نمادها

      در ویندوز 10 "symbol" را در کادر جستجو در نوار وظیفه تایپ کنید و جدول نمادها را از نتایج جستجو انتخاب کنید.

      در ویندوز 8 کلمه "symbol" را در صفحه شروع تایپ کنید و جدول نمادها را از نتایج جستجو انتخاب کنید.

      در ویندوز 7 روی دکمه Start کلیک کنید، All Programs, Accessories, System Tools را انتخاب کنید و Character Map را کلیک کنید.

    کاراکترها بر اساس فونت گروه بندی می شوند. برای انتخاب مجموعه کاراکتر مناسب، روی لیست فونت کلیک کنید. برای انتخاب یک نماد، روی آن کلیک کنید، سپس روی دکمه انتخاب کلیک کنید. برای درج نماد، روی محل مورد نظر در سند کلیک راست کرده و Paste را انتخاب کنید.

    کدهای کاراکتر پرکاربرد

    برای فهرست کامل نویسه‌ها، در رایانه، جدول کد نویسه‌های ASCII یا جدول‌های کاراکتر یونیکد مرتب‌شده بر اساس مجموعه‌ها را ببینید.

    گلیف

    گلیف

    واحدهای پولی

    نمادهای قانونی

    نمادهای ریاضی

    کسری

    علائم نگارشی و گویش

    نمادهای شکل

    کدهایی برای دیاکریتیک های رایج

    برای فهرست کامل حروف و کدهای مربوطه، نگاه کنید.

    گلیف

    گلیف

    کاراکترهای کنترلی ASCII غیرچاپی

    کاراکترهای مورد استفاده برای کنترل برخی از لوازم جانبی مانند چاپگرها در جدول ASCII 0-31 شماره گذاری شده اند. به عنوان مثال، کاراکتر صفحه خوراک/صفحه جدید با عدد 12 مطابقت دارد. این کاراکتر به چاپگر می گوید که به ابتدای صفحه بعدی برود.

    جدول کاراکترهای کنترل غیرقابل چاپ ASCII

    عدد اعشاری

    امضا کردن

    عدد اعشاری

    امضا کردن

    انتشار کانال داده

    شروع هدر

    اولین کد کنترل دستگاه

    شروع متن

    کد دوم کنترل دستگاه

    انتهای متن

    کد کنترل دستگاه سوم

    پایان انتقال

    کد کنترل دستگاه چهارم

    پنج نقطه ای

    تایید منفی

    تائیدیه

    حالت انتقال همزمان

    سیگنال صوتی

    پایان بلوک داده

    زبانه افقی

    پایان رسانه

    تغذیه خط/خط جدید

    شخصیت جایگزین

    زبانه عمودی

    تجاوز

    ترجمه صفحه/صفحه جدید

    دوازده

    جداکننده فایل

    برگشت محموله

    جداکننده گروه

    تغییر بدون ذخیره ارقام

    جداکننده رکورد

    تغییر حفظ بیت

    پانزده

    جداکننده داده ها

    همانطور که می دانید یک کامپیوتر اطلاعات را به صورت دودویی ذخیره می کند و آن را به صورت دنباله ای از یک ها و صفرها نشان می دهد. به منظور ترجمه اطلاعات به شکلی مناسب برای ادراک انسان، هر دنباله منحصر به فرد اعداد در هنگام نمایش با نماد مربوطه جایگزین می شود.

    یکی از سیستم های ارتباط کدهای باینری با کاراکترهای چاپی و کنترلی است

    با سطح فعلی توسعه فناوری رایانه، کاربر نیازی به دانستن کد هر کاراکتر خاص ندارد. با این حال، درک کلی از نحوه انجام کدنویسی بسیار مفید است و برای برخی دسته از متخصصان حتی ضروری است.

    ایجاد ASCII

    در شکل اصلی خود، رمزگذاری در سال 1963 توسعه یافت و سپس در طول 25 سال دو بار به روز شد.

    در نسخه اصلی، جدول کاراکترهای ASCII شامل 128 کاراکتر بود، بعداً یک نسخه توسعه یافته ظاهر شد، که در آن 128 کاراکتر اول ذخیره شدند و کاراکترهای گمشده قبلی به کدهایی با بیت هشتم اختصاص داده شدند.

    برای چندین سال، این رمزگذاری محبوب ترین در جهان بوده است. در سال 2006، لاتین 1252 پیشتاز شد و از پایان سال 2007 تا به امروز، یونیکد به طور محکم جایگاه پیشرو را حفظ کرده است.

    نمایش کامپیوتر ASCII

    هر کاراکتر ASCII کد مخصوص به خود را دارد که از 8 کاراکتر به نمایندگی از صفر یا یک تشکیل شده است. حداقل عدد در این نمایش صفر است (هشت صفر به صورت باینری) که کد اولین عنصر جدول است.

    دو کد در جدول برای جابجایی بین استاندارد US-ASCII و نوع ملی آن کنار گذاشته شده است.

    پس از اینکه ASCII نه 128، بلکه 256 کاراکتر را شامل شد، نوع رمزگذاری گسترده شد، که در آن نسخه اصلی جدول در 128 کد اول با بیت هشتم صفر ذخیره می شد. نشانه های ملی نویسی در نیمه بالایی جدول نگهداری می شد (مواضع 128-255).

    کاربر نیازی به دانستن مستقیم کدهای کاراکتر ASCII ندارد. معمولاً برای یک توسعه‌دهنده نرم‌افزار کافی است که تعداد یک عنصر در جدول را بداند تا در صورت لزوم با استفاده از یک سیستم باینری کد آن را محاسبه کند.

    زبان روسی

    پس از توسعه رمزگذاری برای زبان های اسکاندیناوی، چینی، کره ای، یونانی و غیره در اوایل دهه 70، اتحاد جماهیر شوروی نیز ساخت نسخه خود را آغاز کرد. به زودی نسخه ای از رمزگذاری 8 بیتی به نام KOI8 ساخته شد که اولین 128 کد کاراکتر ASCII را حفظ می کند و همان تعداد موقعیت را برای حروف الفبای ملی و کاراکترهای اضافی اختصاص می دهد.

    قبل از معرفی یونیکد، KOI8 بر بخش روسی اینترنت تسلط داشت. گزینه های رمزگذاری برای هر دو الفبای روسی و اوکراینی وجود داشت.

    مشکلات ASCII

    از آنجایی که تعداد عناصر حتی در جدول توسعه یافته از 256 تجاوز نمی کرد، امکان قرار دادن چندین اسکریپت مختلف در یک رمزگذاری وجود نداشت. در دهه 90، مشکل "crocozyabr" در Runet ظاهر شد، زمانی که متون تایپ شده با حروف ASCII روسی به اشتباه نمایش داده شدند.

    مشکل عدم تطابق بین انواع مختلف ASCII بود. به یاد بیاورید که موقعیت‌های 128-255 می‌توانند شامل کاراکترهای مختلفی باشند، و هنگام تغییر یک رمزگذاری سیریلیک به دیگری، همه حروف متن با حروف دیگری جایگزین می‌شوند که دارای شماره یکسان در نسخه دیگری از رمزگذاری هستند.

    وضعیت فعلی

    با ظهور یونیکد، محبوبیت ASCII به شدت کاهش یافت.

    دلیل این امر در این واقعیت نهفته است که رمزگذاری جدید امکان قرار دادن کاراکترهای تقریباً همه زبان های نوشتاری را فراهم می کند. در این مورد، 128 کاراکتر ASCII اول با همان کاراکترهای یونیکد مطابقت دارد.

    در سال 2000، ASCII محبوب ترین رمزگذاری در اینترنت بود و در 60٪ از صفحات وب فهرست شده توسط گوگل استفاده می شد. تا سال 2012، سهم چنین صفحاتی به 17٪ کاهش یافت و یونیکد (UTF-8) جای محبوب ترین رمزگذاری را گرفت.

    بنابراین، ASCII بخش مهمی از تاریخ فناوری اطلاعات است، اما استفاده از آن در آینده بی‌امید به نظر می‌رسد.

    به هر حال، در وب سایت ما می توانید با استفاده از ماشین حساب آنلاین کد، هر متنی را به کد اعشاری، هگزادسیمال، باینری تبدیل کنید.

    جدول ASCII

    ASCII (کد استاندارد آمریکایی برای تبادل اطلاعات)

    جدول خلاصه کدهای اسکی

    جدول کد کاراکتر ASCII ویندوز (Win-1251)

    سمبل

    متخصص. جدول بندی

    متخصص. LF (کالسکه برگشت)

    متخصص. CR (خط جدید)

    کلاچ SP (فضا)

    سمبل

    جدول کد ASCII توسعه یافته
    قالب بندی کاراکترها

    Backspace (یک کاراکتر برگردانید). حرکت مکانیسم چاپ یا مکان نما نمایشگر را یک موقعیت به عقب نشان می دهد.

    جدول بندی افقی (جدول افقی). حرکت موتور چاپ یا مکان‌نمای نمایشگر را به "ایستگاه تب" بعدی مشخص می‌کند.

    تغذیه خط. حرکت موتور چاپ یا مکان نما نمایشگر را تا ابتدای خط بعدی (یک خط به پایین) نشان می دهد.

    جدول بندی عمودی (جدول عمودی). حرکت موتور چاپ یا مکان نما نمایشگر را به گروه بعدی خطوط نشان می دهد.

    فید فرم (ترجمه صفحه). حرکت موتور چاپ یا مکان نما نمایشگر را به موقعیت اصلی صفحه، فرم یا صفحه بعدی نشان می دهد.

    برگشت محموله. حرکت موتور چاپ یا مکان نما نمایشگر را به موقعیت اولیه (سمت چپ) خط فعلی نشان می دهد.

    انتقال اطلاعات.

    شروع سرفصل. برای تعیین شروع یک هدر، که ممکن است حاوی اطلاعات مسیریابی یا آدرس باشد، استفاده می شود.

    شروع متن ابتدای متن و در عین حال انتهای عنوان را نشان می دهد.

    پایان متن (پایان متن). در انتهای متنی که با کاراکتر STX شروع شده بود اعمال می شود.

    استعلام (درخواست). درخواست داده های شناسایی (مانند "تو کی هستی؟") از یک ایستگاه راه دور.

    تصدیق (تأیید). دستگاه دریافت کننده این کاراکتر را به عنوان تاییدیه دریافت موفقیت آمیز داده ها برای فرستنده ارسال می کند.

    تصدیق منفی (عدم تایید). دستگاه دریافت کننده در صورت انکار (شکست) دریافت داده، این کاراکتر را به فرستنده منتقل می کند.

    همزمان / بیکار (همگام سازی). در سیستم های انتقال سنکرون استفاده می شود. هنگامی که هیچ انتقال داده ای وجود ندارد، سیستم به طور مداوم کاراکترهای SYN را برای اطمینان از همگام سازی ارسال می کند.

    پایان بلوک انتقال پایان یک بلوک داده را برای اهداف ارتباطی نشان می دهد. برای تقسیم مقادیر زیادی از داده ها به بلوک های جداگانه استفاده می شود.

    تقسیم کاراکترها در انتقال اطلاعات. نمادهای دیگر

    خالی. (بدون کاراکتر - بدون داده). برای انتقال زمانی که داده ای وجود ندارد استفاده می شود.

    زنگ (تماس). برای کنترل دستگاه های هشدار استفاده می شود.

    شیفت کردن. نشان می دهد که همه رمزهای بعدی باید بر اساس مجموعه کاراکترهای بیرونی قبل از ورود کاراکتر SI تفسیر شوند.

    جابجایی در نشان می دهد که کلمات رمز بعدی باید بر اساس مجموعه کاراکترهای استاندارد تفسیر شوند.

    Data Link Escape (Switching). تغییر معنی کاراکترهای زیر برای کنترل اضافی یا برای انتقال ترکیب دلخواه از بیت ها استفاده می شود.

    DC1، ​​DC2، DC3، DC4

    کنترل های دستگاه نمادهایی برای کنترل وسایل کمکی (کارکردهای ویژه).

    لغو کنید. نشان می دهد که داده هایی که قبل از این کاراکتر در یک پیام یا بلوک قرار گرفته اند باید نادیده گرفته شوند (معمولاً در صورت بروز خطا).

    پایان متوسط ​​(پایان حامل). انتهای فیزیکی نوار یا رسانه های دیگر را نشان می دهد

    جانشین (معاون). برای جایگزینی یک کاراکتر اشتباه یا نامعتبر استفاده می شود.

    فرار (گسترش). برای گسترش یک کد استفاده می شود که نشان می دهد کاراکتر زیر معنای دیگری دارد.

    فضا (فضا). یک کاراکتر غیرچاپی برای جدا کردن کلمات یا حرکت موتور چاپ یا مکان نما نمایشگر یک موقعیت به جلو.

    حذف. برای حذف (پاک کردن) کاراکتر قبلی در پیام استفاده می شود

    [رمزگذاری های 8 بیتی: ASCII، KOI-8R و CP1251] اولین جداول رمزگذاری ایجاد شده در ایالات متحده از بیت هشتم در یک بایت استفاده نکردند. متن به صورت دنباله ای از بایت ها ارائه شد، اما بیت هشتم در نظر گرفته نشد (برای اهداف رسمی استفاده شد).

    جدول ASCII (کد استاندارد آمریکایی برای تبادل اطلاعات) به یک استاندارد عمومی شناخته شده تبدیل شده است. 32 کاراکتر اول جدول ASCII (00 تا 1F) برای کاراکترهای غیرچاپ استفاده شد. آنها برای کنترل دستگاه چاپ و موارد مشابه طراحی شده بودند. بقیه - از 20 تا 7F - کاراکترهای معمولی (قابل چاپ) هستند.

    جدول 1 - رمزگذاری ASCII

    Dec Hex Oct Char شرح
    0 0 000 خالی
    1 1 001 شروع سرفصل
    2 2 002 شروع متن
    3 3 003 انتهای متن
    4 4 004 پایان انتقال
    5 5 005 استعلام
    6 6 006 اذعان
    7 7 007 زنگ
    8 8 010 بک اسپیس
    9 9 011 زبانه افقی
    10 آ 012 خط جدید
    11 ب 013 زبانه عمودی
    12 سی 014 صفحه جدید
    13 D 015 برگشت محموله
    14 E 016 جابجا کردن
    15 اف 017 جابجایی در
    16 10 020 فرار لینک داده
    17 11 021 کنترل دستگاه 1
    18 12 022 کنترل دستگاه 2
    19 13 023 کنترل دستگاه 3
    20 14 024 کنترل دستگاه 4
    21 15 025 تصدیق منفی
    22 16 026 بیکار همزمان
    23 17 027 پایان ترانس مسدود کردن
    24 18 030 لغو
    25 19 031 پایان متوسط
    26 1A 032 جایگزین
    27 1B 033 در رفتن
    28 1C 034 جداکننده فایل
    29 1D 035 جداکننده گروه
    30 1E 036 جداکننده رکورد
    31 1F 037 جداکننده واحد
    32 20 040 فضا
    33 21 041 !
    34 22 042 "
    35 23 043 #
    36 24 044 $
    37 25 045 %
    38 26 046 &
    39 27 047 "
    40 28 050 (
    41 29 051 )
    42 2A 052 *
    43 2B 053 +
    44 2C 054 ,
    45 2 بعدی 055 -
    46 2E 056 .
    47 2F 057 /
    48 30 060 0
    49 31 061 1
    50 32 062 2
    51 33 063 3
    52 34 064 4
    53 35 065 5
    54 36 066 6
    55 37 067 7
    56 38 070 8
    57 39 071 9
    58 3A 072 :
    59 3B 073 ;
    60 3C 074 <
    61 سه بعدی 075 =
    62 3E 076 >
    63 3F 077 ?
    Dec Hex Oct Char
    64 40 100 @
    65 41 101 آ
    66 42 102 ب
    67 43 103 سی
    68 44 104 D
    69 45 105 E
    70 46 106 اف
    71 47 107 جی
    72 48 110 اچ
    73 49 111 من
    74 4A 112 جی
    75 4B 113 ک
    76 4C 114 L
    77 4 بعدی 115 م
    78 4E 116 ن
    79 4F 117 O
    80 50 120 پ
    81 51 121 س
    82 52 122 آر
    83 53 123 اس
    84 54 124 تی
    85 55 125 U
    86 56 126 V
    87 57 127 دبلیو
    88 58 130 ایکس
    89 59 131 Y
    90 5A 132 ز
    91 5B 133 [
    92 5C 134 \
    93 5 بعدی 135 ]
    94 5E 136 ^
    95 5F 137 _
    96 60 140 `
    97 61 141 آ
    98 62 142 ب
    99 63 143 ج
    100 64 144 د
    101 65 145 ه
    102 66 146 f
    103 67 147 g
    104 68 150 ساعت
    105 69 151 من
    106 6A 152 j
    107 6B 153 ک
    108 6C 154 ل
    109 6D 155 متر
    110 6E 156 n
    111 6F 157 o
    112 70 160 پ
    113 71 161 q
    114 72 162 r
    115 73 163 س
    116 74 164 تی
    117 75 165 تو
    118 76 166 v
    119 77 167 w
    120 78 170 ایکس
    121 79 171 y
    122 7A 172 z
    123 7B 173 {
    124 7C 174 |
    125 7D 175 }
    126 7E 176 ~
    127 7F 177 DEL

    همانطور که به راحتی می توانید ببینید، فقط حروف لاتین در این رمزگذاری نشان داده شده است، و آنهایی که در انگلیسی استفاده می شوند. نمادهای حسابی و دیگر خدمات نیز وجود دارد. اما هیچ حروف روسی یا حتی حروف لاتین خاص برای آلمانی یا فرانسوی وجود ندارد. توضیح این امر آسان است - رمزگذاری به عنوان یک استاندارد آمریکایی توسعه یافته است. با شروع استفاده از رایانه ها در سراسر جهان، سایر کاراکترها نیاز به کدگذاری داشتند.

    برای این کار تصمیم گرفته شد که در هر بایت از بیت هشتم استفاده شود. بنابراین، 128 مقدار بیشتر (از 80 تا FF) در دسترس بود که می‌توان از آنها برای رمزگذاری کاراکترها استفاده کرد. اولین جداول هشت بیتی - "Extended ASCII" (Extended ASCII) - شامل انواع مختلفی از حروف لاتین است که در برخی از زبان های اروپای غربی استفاده می شود. همچنین شخصیت‌های اضافی دیگری از جمله شبه‌نگاری داشت.

    کاراکترهای شبه گرافیکی با نمایش تنها کاراکترهای متنی اجازه می‌دهند تا ظاهری از گرافیک ارائه دهند. به عنوان مثال، با استفاده از شبه نگاری، برنامه مدیریت فایل FAR Manager کار می کند.

    در جدول Extended ASCII حروف روسی وجود نداشت. در روسیه (سابق اتحاد جماهیر شوروی سابق) و در سایر ایالت ها، رمزگذاری های خاص آنها ایجاد شد که امکان نمایش کاراکترهای "ملی" خاص را در فایل های متنی 8 بیتی - حروف لاتین زبان های لهستانی و چکی، سیریلیک (از جمله حروف روسی) و سایر الفباها فراهم کرد.

    در تمام رمزگذاری هایی که گسترده شده اند، 127 کاراکتر اول (یعنی مقادیر بایت با بیت هشتم برابر با 0) با ASCII یکسان است. بنابراین یک فایل ASCII در هر یک از این کدگذاری ها کار می کند. حروف زبان انگلیسی به همین ترتیب نشان داده می شوند.

    سازمان ISO (سازمان بین المللی استاندارد - سازمان بین المللی استانداردها) گروهی از استانداردهای ISO 8859 را پذیرفته است. رمزگذاری های 8 بیتی را برای گروه های مختلف زبان ها تعریف می کند. بنابراین، ISO 8859-1 Extended ASCII است، جدولی برای ایالات متحده و اروپای غربی. و ISO 8859-5 جدولی برای سیریلیک (از جمله روسی) است.

    با این حال، به دلایل تاریخی، کدگذاری ISO 8859-5 مورد توجه قرار نگرفت. در واقع، رمزگذاری های زیر برای زبان روسی استفاده می شود:

    کد صفحه 866 (CP866)، با نام مستعار "DOS"، با نام مستعار "کدگذاری جایگزین GOST". تا اواسط دهه 1990 به طور گسترده مورد استفاده قرار گرفت. در حال حاضر در استفاده محدود عملاً برای توزیع متون در اینترنت استفاده نمی شود.
    - KOI-8. در دهه 70 و 80 توسعه یافت. این یک استاندارد عمومی پذیرفته شده برای ارسال پیام های پستی در اینترنت روسیه است. همچنین به طور گسترده در سیستم عامل های خانواده یونیکس از جمله لینوکس استفاده می شود. نسخه روسی KOI-8 KOI-8R نام دارد. نسخه هایی برای سایر زبان های سیریلیک وجود دارد (به عنوان مثال، KOI8-U یک نوع برای زبان اوکراینی است).
    - کد صفحه 1251, CP1251 , Windows-1251. توسط مایکروسافت برای پشتیبانی از زبان روسی در سیستم ویندوز توسعه یافته است.

    مزیت اصلی CP866 حفظ کاراکترهای شبه در همان مکان‌هایی بود که در Extended ASCII وجود داشت. بنابراین، برنامه های متنی خارجی، به عنوان مثال، فرمانده معروف نورتون، می توانند بدون تغییر کار کنند. CP866 در حال حاضر برای برنامه های ویندوزی که در پنجره های متنی یا در حالت متن تمام صفحه اجرا می شوند، از جمله FAR Manager استفاده می شود.

    متن در CP866 در سال های اخیر بسیار نادر است (اما برای رمزگذاری نام فایل های روسی در ویندوز استفاده می شود). بنابراین، ما در مورد دو رمزگذاری دیگر - KOI-8R و CP1251 صحبت خواهیم کرد.



    همانطور که می بینید، در جدول رمزگذاری CP1251، حروف روسی به ترتیب حروف الفبا مرتب شده اند (البته به استثنای حرف YO). این ترتیب مرتب سازی بر اساس حروف الفبا را برای برنامه های کامپیوتری بسیار آسان می کند.

    اما در KOI-8R ترتیب حروف روسی تصادفی به نظر می رسد. اما در واقع اینطور نیست.

    در بسیاری از برنامه های قدیمی، بیت هشتم هنگام پردازش یا انتقال متن از بین می رفت. (اکنون چنین برنامه هایی عملا "منقرض" شده اند، اما در اواخر دهه 80 و اوایل دهه 90 آنها گسترده بودند). برای به دست آوردن یک مقدار 7 بیتی از یک مقدار 8 بیتی، کافی است 8 را از رقم مرتبه بالا کم کنید. به عنوان مثال، E1 می شود 61.

    اکنون KOI-8R را با جدول ASCII مقایسه کنید (جدول 1). متوجه خواهید شد که حروف روسی کاملاً مطابق با حروف لاتین هستند. اگر بیت هشتم ناپدید شود، حروف کوچک روسی به حروف لاتین بزرگ و حروف روسی بزرگ به حروف کوچک لاتین تبدیل می شوند. بنابراین، E1 در KOI-8 روسی "A" است، در حالی که 61 در ASCII لاتین "a" است.

    بنابراین، KOI-8 به شما اجازه می دهد تا خوانایی متن روسی را با از دست دادن بیت 8 حفظ کنید. "سلام به همه" به "pRIWET WSEM" تبدیل می شود.

    اخیراً هم ترتیب حروف الفبای کاراکترها در جدول رمزگذاری و هم خوانایی با از دست دادن بیت هشتم اهمیت تعیین کننده خود را از دست داده اند. بیت هشتم در کامپیوترهای مدرن چه در حین انتقال و چه در حین پردازش از بین نمی رود. و مرتب سازی بر اساس حروف الفبا با در نظر گرفتن رمزگذاری انجام می شود و نه مقایسه ساده کدها. (به هر حال، کدهای CP1251 کاملاً حروف الفبا نیستند - حرف Y در جای خود نیست).

    با توجه به این واقعیت که دو رمزگذاری رایج وجود دارد، هنگام کار با اینترنت (ایمیل، مرور وب سایت ها)، گاهی اوقات می توانید مجموعه ای بی معنی از حروف را به جای متن روسی مشاهده کنید. به عنوان مثال، "من SBYFEMHEL هستم". این فقط عبارت "با احترام" است. اما آنها در رمزگذاری CP1251 کدگذاری شدند و کامپیوتر متن را مطابق جدول KOI-8 رمزگشایی کرد. اگر همان کلمات، برعکس، در KOI-8 رمزگذاری شده باشند، و کامپیوتر متن را مطابق جدول CP1251 رمزگشایی کند، نتیجه "U HCHBTSEOYEN" خواهد بود.

    گاهی اوقات اتفاق می افتد که رایانه حروف روسی زبان را رمزگشایی می کند و حتی طبق جدولی که برای زبان روسی در نظر گرفته نشده است. سپس، به جای حروف روسی، مجموعه ای بی معنی از کاراکترها ظاهر می شود (به عنوان مثال، حروف لاتین زبان های اروپای شرقی). آنها اغلب به عنوان "کروکوس" نامیده می شوند.

    در بیشتر موارد، برنامه های مدرن به تنهایی قادر به تعیین رمزگذاری اسناد اینترنتی (ایمیل ها و صفحات وب) هستند. اما گاهی اوقات آنها "اشتباه" می کنند و سپس می توانید دنباله های عجیبی از حروف روسی یا "تمساح" را مشاهده کنید. به عنوان یک قاعده، برای نمایش متن واقعی در چنین شرایطی، کافی است رمزگذاری را به صورت دستی در منوی برنامه انتخاب کنید.

    از اطلاعات صفحه http://open-office.edusite.ru/TextProcessor/p5aa1.html برای مقاله استفاده شد.

    مطالب برگرفته از سایت:

    دسامبرهگزسمبل دسامبرهگزسمبل
    000 00 متخصص. نه 128 80 Ђ
    001 01 متخصص. SOH 129 81 Ѓ
    002 02 متخصص. STX 130 82
    003 03 متخصص. ETX 131 83 ѓ
    004 04 متخصص. EOT 132 84
    005 05 متخصص. ENQ 133 85
    006 06 متخصص. ACK 134 86
    007 07 متخصص. BEL 135 87
    008 08 متخصص. لیسانس 136 88
    009 09 متخصص. TAB 137 89
    010 0Aمتخصص. LF 138 8AЉ
    011 0Bمتخصص. VT 139 8B‹ ‹
    012 0Cمتخصص. FF 140 8CЊ
    013 0Dمتخصص. CR 141 8DЌ
    014 0Eمتخصص. بنابراین 142 8EЋ
    015 0Fمتخصص. SI 143 8FЏ
    016 10 متخصص. DLE 144 90 ђ
    017 11 متخصص. DC1 145 91
    018 12 متخصص. DC2 146 92
    019 13 متخصص. DC3 147 93
    020 14 متخصص. DC4 148 94
    021 15 متخصص. NAK 149 95
    022 16 متخصص. SYN 150 96
    023 17 متخصص. ETB 151 97
    024 18 متخصص. می توان 152 98
    025 19 متخصص. EM 153 99
    026 1Aمتخصص. زیر 154 9Aљ
    027 1Bمتخصص. خروج 155 9B
    028 1Cمتخصص. FS 156 9 درجه سانتیگرادњ
    029 1Dمتخصص. جی اس 157 9Dќ
    030 1Eمتخصص. RS 158 9Eћ
    031 1Fمتخصص. ایالات متحده 159 9Fџ
    032 20 کلاچ SP (فضا) 160 A0
    033 21 ! 161 A1 Ў
    034 22 " 162 A2ў
    035 23 # 163 A3Ћ
    036 24 $ 164 A4¤
    037 25 % 165 A5Ґ
    038 26 & 166 A6¦
    039 27 " 167 A7§
    040 28 ( 168 A8یو
    041 29 ) 169 A9©
    042 2A* 170 AAЄ
    043 2B+ 171 AB«
    044 2C, 172 AC¬
    045 2 بعدی- 173 آگهی­
    046 2E. 174 AE®
    047 2F/ 175 AFЇ
    048 30 0 176 B0°
    049 31 1 177 B1±
    050 32 2 178 B2І
    051 33 3 179 B3і
    052 34 4 180 B4ґ
    053 35 5 181 B5µ
    054 36 6 182 B6
    055 37 7 183 B7·
    056 38 8 184 B8یو
    057 39 9 185 B9
    058 3A: 186 BAє
    059 3B; 187 BB»
    060 3C< 188 قبل از میلاد مسیحј
    061 سه بعدی= 189 BDЅ
    062 3E> 190 بودنѕ
    063 3F? 191 bfї
    064 40 @ 192 C0 آ
    065 41 آ 193 C1 ب
    066 42 ب 194 C2 که در
    067 43 سی 195 C3 جی
    068 44 D 196 C4 D
    069 45 E 197 C5 E
    070 46 اف 198 C6 و
    071 47 جی 199 C7 ز
    072 48 اچ 200 C8 و
    073 49 من 201 C9 Y
    074 4Aجی 202 CA به
    075 4Bک 203 CB L
    076 4CL 204 CC م
    077 4 بعدیم 205 سی دی اچ
    078 4Eن 206 CE در باره
    079 4FO 207 CF پ
    080 50 پ 208 D0 آر
    081 51 س 209 D1 با
    082 52 آر 210 D2 تی
    083 53 اس 211 D3 در
    084 54 تی 212 D4 اف
    085 55 U 213 D5 ایکس
    086 56 V 214 D6 سی
    087 57 دبلیو 215 D7 اچ
    088 58 ایکس 216 D8 دبلیو
    089 59 Y 217 D9 SCH
    090 5Aز 218 DA کومرسانت
    091 5B[ 219 D.B. اس
    092 5C\ 220 دی سی ب
    093 5 بعدی] 221 DD E
    094 5E^ 222 DE YU
    095 5F_ 223 D.F. من
    096 60 ` 224 E0 آ
    097 61 آ 225 E1 ب
    098 62 ب 226 E2 V
    099 63 ج 227 E3 جی
    100 64 د 228 E4 د
    101 65 ه 229 E5 ه
    102 66 f 230 E6 و
    103 67 g 231 E7 ساعت
    104 68 ساعت 232 E8 و
    105 69 من 233 E9 هفتم
    106 6Aj 234 EA به
    107 6Bک 235 EB ل
    108 6Cل 236 اتحادیه اروپا متر
    109 6Dمتر 237 ED n
    110 6En 238 EE O
    111 6Fo 239 EF پ
    112 70 پ 240 F0 آر
    113 71 q 241 F1 با
    114 72 r 242 F2 تی
    115 73 س 243 F3 در
    116 74 تی 244 F4 f
    117 75 تو 245 F5 ایکس
    118 76 v 246 F6 ج
    119 77 w 247 F7 ساعت
    120 78 ایکس 248 F8 w
    121 79 y 249 F9 sch
    122 7Az 250 FA ب
    123 7B{ 251 فیس بوک س
    124 7C| 252 اف سی ب
    125 7D} 253 FD اوه
    126 7E~ 254 F.E. یو
    127 7Fمتخصص. DEL 255 FF من
    جدول اسکی کدهای کاراکتر ویندوز.
    شرح کاراکترهای ویژه (کنترلی) لازم به ذکر است که در ابتدا از کاراکترهای کنترلی جدول ASCII برای ارائه تبادل داده از طریق تله تایپ، ورودی داده از نوار پانچ شده و برای ساده ترین کنترل دستگاه های خارجی استفاده می شد.
    در حال حاضر، بیشتر کاراکترهای کنترل ASCII جدول دیگر این بار را تحمل نمی کنند و می توان از آنها برای اهداف دیگر استفاده کرد. توضیحات کد
    NUL، 00پوچ، خالی
    SO-01شروع سرفصل
    STX 02شروع TeXt، ابتدای متن.
    ETX 03پایان متن
    EOT، 04پایان انتقال
    ENQ، 05جویا شدن. لطفا تایید کنید
    ACK، 06تصدیق. من تایید میکنم
    B.E.L. 07زنگ، زنگ بزن
    B.S. 08Backspace، یک کاراکتر به عقب برگردید
    TAB, 09زبانه، زبانه افقی
    LF، 0Aتغذیه خط، خوراک خط.
    اکنون در اکثر زبان های برنامه نویسی با \n نشان داده می شود
    VT، 0Bبرگه عمودی، جدول بندی عمودی.
    FF، 0Cفید فرم، فید صفحه، صفحه جدید
    CR، 0Dبرگشت محموله
    اکنون در اکثر زبان های برنامه نویسی با \r نشان داده می شود
    SO، 0EShift Out، رنگ نوار جوهر چاپگر را تغییر دهید
    SI، 0FShift In، رنگ نوار جوهر موجود در دستگاه چاپ را به عقب برگردانید
    DLE، 10Data Link Escape، تغییر کانال به انتقال داده
    DC1، ​​11
    DC2، 12
    DC3، 13
    DC4، 14
    کنترل دستگاه، نمادهای کنترل دستگاه
    N.A.K. 15تایید منفی، تایید نمی کنم.
    SYN، 16هماهنگ سازی. نماد همگام سازی
    ETB، 17پایان بلوک متن، پایان بلوک متنی
    CAN، 18لغو، لغو تایید قبلی
    EM، 19پایان متوسط
    SUB، 1Aجانشین، جانشین. به جای شخصیتی قرار می گیرد که ارزش آن در حین انتقال از بین رفته یا خراب شده است
    ESC، 1Bدنباله فرار فرار
    FS، 1Cجداکننده فایل، جداکننده فایل
    GS، 1Dجداکننده گروه، جداکننده گروه
    RS، 1Eجداکننده رکورد
    ایالات متحده، 1Fجداکننده واحد، جداکننده واحد
    DEL, 7Fحذف کنید، آخرین کاراکتر را حذف کنید.