• جدول asci یک کد باینری است. رمزگذاری اطلاعات متنی

    با سلام خدمت خوانندگان محترم سایت وبلاگ. امروز با شما در مورد اینکه کراکوزیابرها از کجا در سایت و برنامه ها آمده اند، کدگذاری متنی وجود دارد و کدام یک باید استفاده شود، صحبت خواهیم کرد. بیایید نگاهی دقیق‌تر به تاریخچه توسعه آنها بیندازیم، از ASCII پایه، و همچنین نسخه‌های توسعه‌یافته آن CP866، KOI8-R، Windows 1251، و با رمزگذاری‌های مدرن کنسرسیوم یونیکد UTF 16 و 8 پایان می‌دهیم.

    برای برخی، این اطلاعات ممکن است زائد به نظر برسد، اما می‌دانید که من به‌طور خاص در مورد کراکوزیابرهای خزیده‌شده (یک مجموعه کاراکتر غیرقابل خواندن) چقدر سؤال دارم. اکنون این فرصت را خواهم داشت که همه را به متن این مقاله ارجاع دهم و به طور مستقل به دنبال گیره های خود بگردم. خوب، برای جذب اطلاعات آماده شوید و سعی کنید روند داستان را دنبال کنید.

    ASCII - رمزگذاری متن اصلی برای لاتین

    توسعه رمزگذاری های متنی همزمان با شکل گیری صنعت IT اتفاق افتاد و در این مدت آنها توانستند دستخوش تغییرات بسیار زیادی شوند. از نظر تاریخی، همه چیز با EBCDIC شروع شد، که در تلفظ روسی نسبتاً ناهماهنگ بود، که امکان رمزگذاری حروف الفبای لاتین، اعداد عربی و علائم نگارشی با کاراکترهای کنترلی را فراهم می کرد.

    با این حال، ASCII معروف (کد استاندارد آمریکایی برای تبادل اطلاعات، که در روسی معمولا به عنوان "aski" تلفظ می شود) را باید نقطه شروع توسعه رمزگذاری های متن مدرن در نظر گرفت. این 128 نویسه اول از متداول ترین نویسه های استفاده شده توسط کاربران انگلیسی زبان - حروف لاتین، اعداد عربی و علائم نگارشی را توصیف می کند.

    حتی در این 128 کاراکتر توصیف شده در ASCII، برخی از کاراکترهای خدماتی مانند براکت، میله، ستاره و غیره وجود داشت. در واقع، شما می توانید آنها را خودتان ببینید:

    این 128 کاراکتر از نسخه اصلی ASCII هستند که به استاندارد تبدیل شده‌اند و در هر کدگذاری دیگری قطعاً آنها را ملاقات خواهید کرد و آنها به این ترتیب خواهند ایستاد.

    اما واقعیت این است که با کمک یک بایت اطلاعات، می توان نه 128، بلکه 256 مقدار مختلف را رمزگذاری کرد (دو عدد به توان هشت برابر است با 256)، بنابراین، پس از نسخه اصلی Asuka، یک سری کامل از رمزگذاری های ASCII توسعه یافته ظاهر شد که در آن امکان رمزگذاری نویسه های پایه، 12، 8 به کاراکتر ملی نیز وجود داشت.

    در اینجا، احتمالاً ارزش دارد که در مورد سیستم های اعدادی که در توضیحات استفاده می شود کمی بیشتر صحبت کنیم. اولا، همانطور که همه می دانید، یک کامپیوتر فقط با اعداد در سیستم دودویی کار می کند، یعنی با صفر و یک ("جبر بولی"، اگر کسی در یک موسسه یا مدرسه درس خوانده باشد). که هر کدام در درجه دو است که از صفر شروع می شود و در درجه هفتم تا دو می رسد:

    درک اینکه تنها 256 از تمام ترکیب های ممکن صفر و یک می تواند در چنین ساختاری وجود داشته باشد دشوار نیست.تبدیل یک عدد از دودویی به اعشاری بسیار ساده است. شما فقط باید تمام قدرت های دو را جمع آوری کنید، که بیش از آن ها یکی هستند.

    در مثال ما، این 1 (2 به توان صفر) به اضافه 8 (دو به توان 3)، به اضافه 32 (دو به پنجم)، به اضافه 64 (به ششم)، به اضافه 128 (به توان هفتم) است. مجموع در نماد اعشاری 233 می شود. همانطور که می بینید، همه چیز بسیار ساده است.

    اما اگر به جدول با کاراکترهای ASCII نگاه دقیق تری بیندازید، خواهید دید که آنها در کدگذاری هگزا دسیمال نشان داده شده اند. به عنوان مثال، "ستاره" در Asci با عدد هگزادسیمال 2A مطابقت دارد. احتمالاً می دانید که سیستم اعداد هگزادسیمال علاوه بر اعداد عربی از حروف لاتین A (به معنی ده) تا F (به معنای پانزده) نیز استفاده می کند.

    خب برای تبدیل یک عدد باینری به هگزادسیمال به روش ساده و بصری زیر متوسل می شوند. همانطور که در تصویر بالا نشان داده شده است، هر بایت اطلاعات به دو قسمت چهار بیتی تقسیم می شود. که در هر نیم بایت، فقط شانزده مقدار را می توان در کد باینری (دو تا توان چهارم) کدگذاری کرد، که به راحتی می توان آن را به عنوان یک عدد هگزادسیمال نشان داد.

    علاوه بر این، در نیمه سمت چپ بایت، لازم است دوباره درجه ها را بشمارید، از صفر شروع کنید، نه همانطور که در تصویر نشان داده شده است. در نتیجه با محاسبات ساده دریافتیم که عدد E9 در اسکرین شات کدگذاری شده است. امیدوارم مسیر استدلال من و راه حل این معما برای شما روشن شده باشد. خوب، اکنون اجازه دهید در واقع به صحبت در مورد رمزگذاری متن ادامه دهیم.

    نسخه های توسعه یافته Asuka - رمزگذاری CP866 و KOI8-R با شبه نگاری

    بنابراین، ما شروع به صحبت در مورد ASCII کردیم، که، همانطور که بود، نقطه شروع توسعه همه رمزگذاری های مدرن (ویندوز 1251، یونیکد، UTF 8) بود.

    در ابتدا فقط شامل 128 کاراکتر از الفبای لاتین، اعداد عربی و چیزهای دیگر بود، اما در نسخه توسعه یافته امکان استفاده از تمام 256 مقداری که می توانند در یک بایت اطلاعات رمزگذاری شوند، وجود داشت. آن ها اضافه کردن کاراکترهای حروف زبان خود به Asci امکان پذیر شد.

    در اینجا لازم است یک بار دیگر به انحراف بپردازیم تا توضیح دهیم که چرا رمزگذاری متن اصلاً مورد نیاز است و چرا اینقدر مهم است. کاراکترهای روی صفحه کامپیوتر شما بر اساس دو چیز تشکیل می‌شوند - مجموعه‌ای از اشکال برداری (نمایش‌ها) از انواع کاراکترها (آنها در فایل‌های co هستند) و کدی که به شما امکان می‌دهد از این مجموعه اشکال برداری (فایل فونت) دقیقاً کاراکتری را که باید در جای مناسب درج شود بیرون بکشید.

    واضح است که فونت ها مسئول خود فرم های برداری هستند، اما سیستم عامل و برنامه های استفاده شده در آن وظیفه رمزگذاری را بر عهده دارند. آن ها هر متنی در رایانه شما مجموعه ای از بایت ها خواهد بود که هر کدام یک کاراکتر از همین متن را رمزگذاری می کند.

    برنامه ای که این متن را روی صفحه نمایش می دهد (ویرایشگر متن، مرورگر و ...)، هنگام تجزیه کد، رمزگذاری کاراکتر بعدی را می خواند و در فایل فونت مورد نظر که برای نمایش این سند متنی متصل است، به دنبال فرم برداری مربوطه می گردد. همه چیز ساده و پیش پا افتاده است.

    این بدان معنی است که برای رمزگذاری هر کاراکتری که نیاز داریم (مثلاً از الفبای ملی)، دو شرط باید رعایت شود - شکل برداری این کاراکتر باید با فونت استفاده شده باشد و این کاراکتر می تواند در رمزگذاری های ASCII توسعه یافته در یک بایت رمزگذاری شود. بنابراین، یک دسته کامل از این گزینه ها وجود دارد. فقط برای رمزگذاری کاراکترهای زبان روسی، انواع مختلفی از Aska توسعه یافته وجود دارد.

    به عنوان مثال، CP866 در ابتدا ظاهر شد، که در آن امکان استفاده از حروف الفبای روسی وجود داشت و نسخه توسعه یافته ASCII بود.

    آن ها قسمت بالای آن کاملاً با نسخه اصلی Asuka (128 کاراکتر از الفبای لاتین، اعداد و هر چیز مزخرفی) که در تصویر بالا نشان داده شده است، منطبق بود، اما قسمت پایین جدول با رمزگذاری CP866 شکلی را داشت که در تصویر زیر نشان داده شده بود و اجازه داشت 128 کاراکتر دیگر را رمزگذاری کند (حروف شبه روسی و همه حروف شبه روسی):

    ببینید، در ستون سمت راست، اعداد با 8 شروع می شوند، زیرا اعداد از 0 تا 7 به قسمت پایه ASCII اشاره دارند (نگاه کنید به تصویر اول). که حرف روسی "M" در CP866 دارای کد 9C خواهد بود (در تقاطع ردیف مربوطه با 9 و ستون با عدد C در سیستم اعداد هگزادسیمال قرار دارد) که می تواند در یک بایت اطلاعات نوشته شود و در صورت وجود فونت مناسب با کاراکترهای روسی، این حرف بدون هیچ مشکلی در متن نمایش داده می شود.

    این همه شبه گرافیک در CP866 از کجا آمده است؟ نکته این است که این رمزگذاری برای متن روسی در آن سال های خزدار توسعه یافته بود، زمانی که چنین توزیعی از سیستم عامل های گرافیکی مانند اکنون وجود نداشت. و در Dosa و سیستم‌عامل‌های متنی مشابه، شبه گرافیک‌ها این امکان را به وجود می‌آورد که به نوعی طراحی متون را متنوع کنید، و بنابراین در CP866 و سایر همتایان آن از دسته نسخه‌های توسعه‌یافته Asuka فراوان است.

    CP866 توسط IBM توزیع شد، اما علاوه بر این، تعدادی رمزگذاری برای کاراکترهای روسی توسعه داده شد، به عنوان مثال، KOI8-R را می توان به همان نوع نسبت داد (ASCII توسعه یافته):

    اصل عملکرد آن مانند CP866 است که کمی پیشتر توضیح داده شد - هر کاراکتر متن توسط یک بایت واحد رمزگذاری می شود. اسکرین شات نیمه دوم جدول KOI8-R را نشان می دهد، زیرا نیمه اول کاملاً مطابق با Asuka اصلی است که در اولین تصویر در این مقاله نشان داده شده است.

    از جمله ویژگی های رمزگذاری KOI8-R می توان به این اشاره کرد که حروف روسی در جدول آن به ترتیب حروف الفبا نیستند، همانطور که برای مثال در CP866 انجام شد.

    اگر به اولین اسکرین شات (قسمت پایه، که در تمام رمزگذاری های توسعه یافته موجود است) نگاه کنید، متوجه خواهید شد که در KOI8-R حروف روسی در همان سلول های جدول قرار دارند که حروف الفبای لاتین با آنها از قسمت اول جدول همخوانی دارند. این کار برای راحتی جابجایی از حروف روسی به لاتین با حذف تنها یک بیت (دو به توان هفتم یا 128) انجام شد.

    ویندوز 1251 - نسخه مدرن ASCII و چرا krakozyabry به بیرون خزیده است

    توسعه بیشتر رمزگذاری متن به این دلیل بود که سیستم عامل های گرافیکی محبوبیت بیشتری پیدا کردند و نیاز به استفاده از شبه نگاری در آنها در نهایت ناپدید شد. در نتیجه، یک گروه کامل به وجود آمد که در اصل، هنوز نسخه های توسعه یافته Asuka بودند (یک کاراکتر متن فقط با یک بایت اطلاعات رمزگذاری شده است)، اما بدون استفاده از کاراکترهای شبه.

    آنها متعلق به رمزگذاری های به اصطلاح ANSI بودند که توسط مؤسسه استانداردهای آمریکایی توسعه یافته بودند. در اصطلاح رایج، نام سیریلیک نیز برای نوع با پشتیبانی از زبان روسی استفاده می شود. یک مثال از این می تواند خدمت کند.

    تفاوت مطلوبی با CP866 و KOI8-R که قبلاً استفاده شده بود به این دلیل بود که نمادهای گمشده تایپوگرافی روسی (به غیر از علامت لهجه) و همچنین نمادهایی که در زبان های اسلاوی نزدیک به روسی (اوکراینی ، بلاروسی و غیره) استفاده می شد ، نمادهای شبه نگاری در آن گرفته شد:

    به دلیل فراوانی رمزگذاری‌های زبان روسی، تولیدکنندگان فونت و تولیدکنندگان نرم‌افزار دائماً دچار سردرد می‌شدند و ما، خوانندگان عزیز، اغلب هنگامی که با نسخه استفاده شده در متن اشتباه می‌شد، از کراکوزیابری بسیار بدنام بیرون آمدیم.

    اغلب آنها هنگام ارسال و دریافت پیام از طریق ایمیل خارج می شدند که منجر به ایجاد جداول تبدیل بسیار پیچیده می شد که در واقع نمی توانست این مشکل را در ریشه حل کند و اغلب کاربران برای جلوگیری از کراکوزیابرهای بدنام هنگام استفاده از رمزگذاری های روسی مانند CP866، KOI8-R یا Windows 1251 از مکاتبات استفاده می کردند.

    در واقع، کراکوزیابری که به جای متن روسی ظاهر شد، نتیجه استفاده نادرست از رمزگذاری این زبان بود، که با زبانی که پیام متنی در آن ابتدا کدگذاری شده بود، مطابقت نداشت.

    به عنوان مثال، اگر سعی کنید کاراکترهای رمزگذاری شده با استفاده از CP866 را با استفاده از جدول کد ویندوز 1251 نمایش دهید، همان krakozyabry (مجموعه کاراکترهای بی معنی) ظاهر می شود و کاملاً جایگزین متن پیام می شود.

    وضعیت مشابهی اغلب در انجمن‌ها یا وبلاگ‌ها اتفاق می‌افتد، زمانی که متن با حروف روسی به اشتباه در رمزگذاری اشتباهی که به طور پیش‌فرض در سایت استفاده می‌شود ذخیره می‌شود، یا در ویرایشگر متن اشتباهی که به کدی که با چشم غیرمسلح قابل مشاهده نیست، گگ اضافه می‌کند.

    در نهایت، بسیاری از مردم از چنین وضعیتی با رمزگذاری های زیاد خسته شدند و دائماً از کراکوزیابری خارج شدند، پیش نیازهایی برای ایجاد یک تنوع جهانی جدید وجود داشت که جایگزین همه موارد موجود شود و در نهایت مشکل را با ظاهر متون ناخوانا حل کند. علاوه بر این، مشکل زبان هایی مانند چینی وجود داشت که در آن حروف زبان بسیار بیشتر از 256 بود.

    یونیکد (یونیکد) - رمزگذاری جهانی UTF 8، 16 و 32

    این هزاران کاراکتر از گروه زبان آسیای جنوب شرقی را نمی توان به هیچ وجه در یک بایت اطلاعات توصیف کرد، که برای رمزگذاری کاراکترها در نسخه های توسعه یافته ASCII اختصاص داده شده است. در نتیجه، کنسرسیومی به نام یونیکد (یونیکد - کنسرسیوم یونیکد) با همکاری بسیاری از رهبران صنعت فناوری اطلاعات (کسانی که نرم‌افزار تولید می‌کنند، سخت‌افزار کدنویسی می‌کنند، فونت ایجاد می‌کنند) که علاقه مند به ظهور یک رمزگذاری متن جهانی بودند، ایجاد شد.

    اولین نسخه ای که تحت نظارت کنسرسیوم یونیکد منتشر شد UTF 32 بود. عدد در نام رمزگذاری به معنای تعداد بیت هایی است که برای رمزگذاری یک کاراکتر استفاده می شود. 32 بیت 4 بایت اطلاعات است که برای رمزگذاری یک کاراکتر در UTF جدید رمزگذاری جهانی مورد نیاز است.

    در نتیجه، همان فایل با متن، کدگذاری شده در نسخه توسعه یافته ASCII و در UTF-32، در مورد دوم دارای اندازه (وزن) چهار برابر بزرگتر خواهد بود. این بد است، اما اکنون ما این فرصت را داریم که با استفاده از UTF تعدادی کاراکتر معادل دو تا درجه سی و دوم را رمزگذاری کنیم (میلیاردها کاراکتر که هر مقدار واقعاً مورد نیاز را با یک حاشیه بزرگ پوشش می دهد).

    اما برای بسیاری از کشورهای با زبان های گروه اروپایی، به هیچ وجه نیازی به استفاده از چنین تعداد زیادی کاراکتر در رمزگذاری وجود نداشت، با این حال، هنگام استفاده از UTF-32، وزن اسناد متنی را چهار برابر افزایش دادند و در نتیجه، حجم ترافیک اینترنت و میزان داده های ذخیره شده را افزایش دادند. این مقدار زیادی است و هیچ کس نمی تواند چنین ضایعاتی را بپردازد.

    در نتیجه توسعه یونیکد، UTF-16 ظاهر شد که آنقدر موفق بود که به عنوان فضای پایه پیش فرض برای همه کاراکترهایی که استفاده می کنیم پذیرفته شد. از دو بایت برای رمزگذاری یک کاراکتر استفاده می کند. بیایید ببینیم این چیز چگونه به نظر می رسد.

    در سیستم عامل ویندوز، می توانید از مسیر "شروع" - "برنامه ها" - "لوازم جانبی" - "ابزار" - "جدول کاراکتر" بروید. در نتیجه، جدولی با اشکال برداری از تمام فونت های نصب شده در سیستم شما باز می شود. اگر مجموعه کاراکترهای یونیکد را در «گزینه‌های پیشرفته» انتخاب کنید، می‌توانید برای هر فونت به‌صورت جداگانه کل محدوده کاراکترهای موجود در آن را ببینید.

    ضمناً با کلیک بر روی هر یک از آنها می توانید کد دو بایتی آن را با فرمت UTF-16 متشکل از چهار رقم هگزادسیمال مشاهده کنید:

    چند کاراکتر را می توان در UTF-16 با استفاده از 16 بیت کدگذاری کرد؟ 65536 (دو به توان شانزده)، و این عدد بود که به عنوان فضای پایه در یونیکد پذیرفته شد. علاوه بر این، راه هایی برای رمزگذاری با آن حدود دو میلیون کاراکتر وجود دارد، اما محدود به فضای گسترده ای از یک میلیون کاراکتر متن است.

    اما حتی این نسخه موفق رمزگذاری یونیکد رضایت زیادی را برای کسانی که مثلاً برنامه ها را فقط به زبان انگلیسی می نوشتند، به ارمغان نمی آورد، زیرا پس از تغییر از نسخه توسعه یافته ASCII به UTF-16، وزن اسناد دو برابر شد (یک بایت به ازای هر کاراکتر در Asci و دو بایت برای هر کاراکتر مشابه در UTF-16).

    این برای رضایت همه و همه چیز در کنسرسیوم یونیکد، تصمیم گرفته شد که یک رمزگذاری با طول متغیر ارائه شود. UTF-8 نام دارد. با وجود هشت در نام، واقعا طول متغیری دارد، یعنی. هر کاراکتر متنی را می توان به دنباله ای از یک تا شش بایت کدگذاری کرد.

    در عمل، در UTF-8، فقط از محدوده یک تا چهار بایت استفاده می شود، زیرا در پشت چهار بایت کد، حتی از نظر تئوری نیز چیزی قابل تصور نیست. تمام حروف لاتین موجود در آن در یک بایت کدگذاری می شوند، درست مانند ASCII خوب قدیمی.

    قابل توجه است، در مورد رمزگذاری فقط لاتین، حتی برنامه هایی که یونیکد را درک نمی کنند، همچنان آنچه را که در UTF-8 کدگذاری شده است، می خوانند. آن ها بخش اصلی Asuka به سادگی به این زاده فکری کنسرسیوم یونیکد منتقل شد.

    کاراکترهای سیریلیک در UTF-8 در دو بایت کدگذاری می شوند و برای مثال کاراکترهای گرجی در سه بایت کدگذاری می شوند. کنسرسیوم یونیکد، پس از ایجاد UTF 16 و 8، مشکل اصلی را حل کرد - اکنون ما یک فضای کد واحد در فونت ها داریم. و اکنون سازندگان آنها فقط می توانند آن را با فرم های برداری از کاراکترهای متنی بر اساس نقاط قوت و قابلیت های خود پر کنند. در حال حاضر حتی در ست.

    در «جدول کاراکترها» بالا، می‌توانید ببینید که فونت‌های مختلف از تعداد کاراکترهای متفاوتی پشتیبانی می‌کنند. برخی از فونت های غنی از یونیکد می توانند بسیار بزرگ باشند. اما اکنون تفاوت آنها نه در این است که برای رمزگذاری های مختلف ایجاد شده اند، بلکه در این واقعیت است که سازنده فونت فضای کد واحد را با یک یا آن فرم برداری دیگر تا انتها پر کرده یا پر نکرده است.

    Krakozyabry به جای حروف روسی - نحوه تعمیر

    حال ببینیم چگونه کراکوزیابراها به جای متن ظاهر می شوند یا به عبارت دیگر چگونه رمزگذاری صحیح برای متن روسی انتخاب می شود. در واقع، در برنامه ای تنظیم می شود که در آن شما همین متن یا کد را با استفاده از قطعات متن ایجاد یا ویرایش می کنید.

    برای ویرایش و ایجاد فایل های متنی، من شخصا از یک بسیار خوب، به نظرم، استفاده می کنم. با این حال، می تواند سینتکس صد زبان برنامه نویسی و نشانه گذاری دیگر را برجسته کند، و همچنین این قابلیت را دارد که با استفاده از افزونه ها گسترش یابد. بررسی دقیق این برنامه فوق العاده را در لینک زیر بخوانید.

    در منوی بالای Notepad ++ یک مورد "Encodings" وجود دارد، که در آن شما این فرصت را خواهید داشت که به طور پیش فرض یک گزینه موجود را به گزینه مورد استفاده در سایت خود تبدیل کنید:

    در مورد سایتی در جوملا 1.5 و بالاتر و همچنین در مورد وبلاگ در وردپرس، باید گزینه UTF 8 را بدون BOM انتخاب کنید تا باگ ظاهر نشود. پیشوند BOM چیست؟

    واقعیت این است که هنگامی که رمزگذاری UTF-16 توسعه یافت، به دلایلی آنها تصمیم گرفتند چیزی مانند توانایی نوشتن یک کد کاراکتر، هم به ترتیب مستقیم (به عنوان مثال، 0A15) و هم به صورت معکوس (150A) به آن متصل کنند. و برای اینکه برنامه ها بفهمند در کدام دنباله کدها را بخوانند ، BOM (Byte Order Mark یا به عبارت دیگر امضا) اختراع شد که با افزودن سه بایت اضافی به همان ابتدای اسناد بیان شد.

    در رمزگذاری UTF-8، هیچ BOM در کنسرسیوم یونیکد پیش بینی نشده بود، و بنابراین افزودن یک امضا (این بدنام ترین سه بایت اضافی به ابتدای سند) به سادگی از خواندن کد برخی از برنامه ها جلوگیری می کند. بنابراین، هنگام ذخیره فایل ها در UTF، همیشه باید گزینه بدون BOM (بدون امضا) را انتخاب کنیم. بنابراین، شما از قبل از خزیدن krakozyabry از خود محافظت خواهید کرد.

    قابل توجه است که برخی از برنامه های ویندوز نمی دانند چگونه این کار را انجام دهند (آنها نمی توانند متن را در UTF-8 بدون BOM ذخیره کنند)، به عنوان مثال، همان Notepad بدنام ویندوز. سند را در UTF-8 ذخیره می کند، اما همچنان امضا (سه بایت اضافی) را به ابتدای آن اضافه می کند. علاوه بر این، این بایت ها همیشه یکسان خواهند بود - کد را به ترتیب مستقیم بخوانید. اما در سرورها، به دلیل این چیز کوچک، ممکن است مشکلی ایجاد شود - krakozyabry بیرون خواهد آمد.

    بنابراین، اگر نمی خواهید اشکالات ظاهر شوند، به هیچ وجه از دفترچه یادداشت معمول ویندوز برای ویرایش اسناد در سایت خود استفاده نکنید. من ویرایشگر Notepad ++ را که قبلاً ذکر شد بهترین و ساده ترین گزینه می دانم که عملاً هیچ ایرادی ندارد و فقط از مزایایی برخوردار است.

    در Notepad++، زمانی که رمزگذاری را انتخاب می‌کنید، این گزینه را خواهید داشت که متن را به کدگذاری UCS-2 تبدیل کنید، که ذاتاً به استاندارد یونیکد بسیار نزدیک است. همچنین در Notepad امکان رمزگذاری متن در ANSI وجود خواهد داشت. در رابطه با زبان روسی، این ویندوز 1251 خواهد بود که قبلاً کمی در بالا توضیح دادیم، این اطلاعات از کجا آمده است؟

    در رجیستری سیستم عامل ویندوز شما نوشته شده است - در مورد ANSI کدام کد را انتخاب کنید، در مورد OEM کدام را انتخاب کنید (برای زبان روسی CP866 خواهد بود). اگر زبان پیش‌فرض دیگری را روی رایانه خود نصب کنید، این کدگذاری‌ها با زبان‌های مشابه از دسته ANSI یا OEM برای همان زبان جایگزین می‌شوند.

    پس از اینکه سند را در Notepad ++ در رمزگذاری مورد نیاز خود ذخیره کردید یا سند را از سایت برای ویرایش باز کردید، می توانید نام آن را در گوشه سمت راست پایین ویرایشگر مشاهده کنید:

    برای جلوگیری از krakozyabr، علاوه بر اقداماتی که در بالا توضیح داده شد، نوشتن اطلاعاتی در مورد این رمزگذاری در سربرگ کد منبع آن در تمام صفحات سایت مفید خواهد بود تا هیچ سردرگمی در سرور یا میزبان محلی ایجاد نشود.

    به طور کلی در تمام زبان های نشانه گذاری فرامتن به جز Html از یک اعلان خاص xml استفاده می شود که کدگذاری متن را مشخص می کند.

    قبل از تجزیه کد، مرورگر می داند که از کدام نسخه استفاده می شود و دقیقاً چگونه کدهای کاراکتر آن زبان باید تفسیر شوند. اما آنچه قابل توجه است، اگر سند را در یونیکد پیش‌فرض ذخیره کنید، می‌توان این اعلان xml را حذف کرد (اگر BOM وجود نداشته باشد رمزگذاری UTF-8 یا اگر BOM وجود داشته باشد UTF-16 در نظر گرفته می‌شود).

    در مورد یک سند زبان Html، عنصر Meta برای تعیین رمزگذاری استفاده می‌شود که بین تگ Head باز و بسته می‌شود:

    ... ...

    این ورودی کاملاً متفاوت از ورودی است، اما کاملاً با استاندارد جدید Html 5 که به آرامی معرفی می‌شود مطابقت دارد و برای مرورگرهایی که در حال حاضر استفاده می‌شوند، 100٪ به درستی درک می‌شود.

    در تئوری، بهتر است عنصر متا با کدگذاری Html سند تا حد امکان در هدر سند قرار داده شود، به طوری که در زمان اولین کاراکتر متن از ANSI پایه (که همیشه به درستی و با هر گونه تغییری خوانده می شود)، مرورگر از قبل اطلاعاتی در مورد نحوه تفسیر کدهای این کاراکترها داشته باشد.

    موفق باشی! به زودی شما را در سایت صفحات وبلاگ می بینیم

    با رفتن به ");"> می توانید ویدیوهای بیشتری را تماشا کنید

    ممکن است علاقه مند باشید

    URL چیست، تفاوت بین لینک های مطلق و نسبی برای یک سایت چیست
    OpenServer - یک سرور محلی مدرن و نمونه ای از استفاده از آن برای نصب وردپرس در رایانه
    Chmod چیست، چه مجوزهایی برای اختصاص دادن به فایل ها و پوشه ها (777، 755، 666) و نحوه انجام آن از طریق PHP
    جستجوی Yandex در سایت و فروشگاه آنلاین

    بیایید به برخی از حقایقی که می دانیم نگاهی بیندازیم:

    به مجموعه کاراکترهایی که متن با آن نوشته می شود الفبا می گویند.

    تعداد حروف الفبای اصلی آن است.

    فرمول تعیین مقدار اطلاعات: N \u003d 2 b,

    که در آن N قدرت الفبا (تعداد کاراکترها) است.

    ب - تعداد بیت ها (وزن اطلاعات نماد).

    تقریباً تمام کاراکترهای لازم را می توان در الفبای با ظرفیت 256 کاراکتر قرار داد. چنین الفبای کافی نامیده می شود.

    زیرا 256 = 2 8، سپس وزن 1 کاراکتر 8 بیت است.

    یک واحد اندازه گیری 8 بیتی به نام 1 بایت داده شده است:

    1 بایت = 8 بیت.

    کد باینری هر کاراکتر در متن کامپیوتر 1 بایت حافظه را اشغال می کند.

    چگونه اطلاعات متنی در حافظه کامپیوتر نمایش داده می شود؟

    رمزگذاری به این صورت است که به هر کاراکتر یک کد اعشاری منحصر به فرد از 0 تا 255 یا کد باینری مربوطه از 00000000 تا 11111111 اختصاص داده می شود. بنابراین، شخص کاراکترها را بر اساس سبک آنها و رایانه را با کد آنها متمایز می کند.

    راحتی رمزگذاری بایت به بایت کاراکترها واضح است، زیرا یک بایت کوچکترین بخش آدرس پذیر حافظه است و بنابراین، پردازنده هنگام انجام پردازش متن می تواند به هر کاراکتر جداگانه دسترسی داشته باشد. از سوی دیگر، 256 کاراکتر برای نشان دادن طیف گسترده ای از اطلاعات شخصیت ها کاملاً کافی است.

    حال این سوال پیش می آید که کدام کد هشت بیتی باینری را با هر کاراکتر مطابقت دهیم.

    واضح است که این یک موضوع مشروط است، شما می توانید راه های زیادی برای رمزگذاری پیدا کنید.

    جدول ASCII (بخوانید asci) (کد استاندارد آمریکایی برای تبادل اطلاعات) به استاندارد بین المللی رایانه های شخصی تبدیل شده است.

    فقط نیمه اول جدول یک استاندارد بین المللی است، یعنی. کاراکترهایی با اعداد از 0 (00000000) تا 127 (01111111).

    شماره سریال

    سمبل

    00000000 - 00011111


    عملکرد آنها کنترل فرآیند نمایش متن روی صفحه یا چاپ، دادن سیگنال صوتی، علامت گذاری متن و غیره است.

    32 - 127

    00100000 - 01111111


    128 - 255

    10000000 - 11111111


    نیمه دوم جدول کدهای ASCII که صفحه کد نامیده می شود (128 کد که با 10000000 شروع می شود و با 11111111 ختم می شود) می تواند گزینه های مختلفی داشته باشد که هر گزینه شماره مخصوص به خود را دارد.


    توجه شما را به این نکته جلب می کنم که در جدول رمزگذاری، حروف (بزرگ و کوچک) به ترتیب حروف الفبا و اعداد به ترتیب صعودی مقادیر مرتب شده اند. به این رعایت نظم واژگانی در چینش حروف، اصل رمزگذاری ترتیبی الفبا می گویند.


    رایج ترین رمزگذاری مورد استفاده در حال حاضر مایکروسافت ویندوز است که به اختصار CP1251 نامیده می شود.

    از اواخر دهه 90، مشکل استانداردسازی رمزگذاری کاراکترها با معرفی یک استاندارد بین المللی جدید به نام یونیکد حل شد. این یک رمزگذاری 16 بیتی است، یعنی. هر کاراکتر 2 بایت حافظه دارد. البته در این حالت میزان حافظه اشغال شده 2 برابر افزایش می یابد. اما چنین جدول کدی امکان گنجاندن حداکثر 65536 کاراکتر را فراهم می کند. مشخصات کامل استاندارد یونیکد شامل تمام الفبای موجود، منقرض شده و مصنوعی جهان و همچنین بسیاری از نمادهای ریاضی، موسیقی، شیمیایی و غیره است.

    بیایید سعی کنیم از جدول ASCII استفاده کنیم تا تصور کنیم کلمات در حافظه کامپیوتر چگونه به نظر می رسند.

    کلمات

    حافظه

    01100110

    01101001

    01101100

    01100101

    01100100

    01101001

    01110011

    01101011

    هنگامی که اطلاعات متنی در رایانه وارد می شود، کاراکترها (حروف، اعداد، علائم) با استفاده از سیستم های کد مختلف رمزگذاری می شوند که شامل مجموعه ای از جداول کد هستند که در صفحات مربوطه استانداردها برای رمزگذاری اطلاعات متنی قرار می گیرند. در چنین جداول، به هر کاراکتر یک کد عددی خاص در نماد هگزا دسیمال یا اعشاری اختصاص داده می شود، به عنوان مثال، جداول کد مطابقت بین تصاویر کاراکتر و کدهای عددی را منعکس می کنند و برای رمزگذاری و رمزگشایی اطلاعات متنی طراحی شده اند. هنگام وارد کردن اطلاعات متنی با استفاده از صفحه کلید کامپیوتر، هر کاراکتر ورودی کدگذاری می شود، یعنی به یک کد عددی تبدیل می شود، زمانی که اطلاعات متنی به یک دستگاه خروجی کامپیوتر (نمایشگر، چاپگر یا پلاتر) خروجی می شود، تصویر آن با استفاده از کد کاراکتر عددی ساخته می شود. تخصیص یک کد عددی خاص به یک نماد نتیجه توافق بین سازمان های مربوطه در کشورهای مختلف است. در حال حاضر، هیچ جدول کد جهانی واحدی وجود ندارد که حروف الفبای ملی کشورهای مختلف را برآورده کند.

    جداول کد مدرن شامل بخش‌های بین‌المللی و ملی است، یعنی شامل حروف الفبای لاتین و ملی، اعداد، علائم حسابی و نقطه‌گذاری، کاراکترهای ریاضی و کنترلی و کاراکترهای شبه‌شناختی است. بخش بین المللی جدول کد بر اساس استاندارد ASCII (کد استاندارد آمریکایی برای تبادل اطلاعات)،نیمه اول کاراکترهای جدول کد را با کدهای عددی از 0 تا 7 رمزگذاری می کند F16یا در سیستم اعداد اعشاری از 0 تا 127. در این حالت، کدهای 0 تا 20 16 (0 × 32 10) به کلیدهای عملکرد (F1، F2، F3 و غیره) صفحه کلید رایانه شخصی اختصاص داده می شود. روی انجیر 3.1 بخش بین المللی جداول کد را بر اساس استاندارد نشان می دهد ASCII.سلول های جدول به ترتیب در سیستم های اعداد اعشاری و هگزادسیمال شماره گذاری می شوند.

    شکل 3.1. بخش بین المللی جدول کد (استاندارد ASCII)با اعداد سلولی ارائه شده در سیستم اعداد اعشاری (الف) و هگزادسیمال (ب).


    قسمت ملی جداول کد حاوی کدهای الفبای ملی است که به آن جدول مجموعه کاراکتر نیز می گویند. (مجموعه شخصیت).

    در حال حاضر، برای پشتیبانی از حروف الفبای روسی (سیریلیک)، چندین جدول کد (رمزگذاری) وجود دارد که توسط سیستم عامل های مختلف استفاده می شود، که یک اشکال قابل توجه است و در برخی موارد منجر به مشکلات مربوط به عملیات رمزگشایی برای مقادیر عددی کاراکترها می شود. روی میز. 3.1 نام صفحات کد (استاندارد) را نشان می دهد که جداول کد سیریلیک (رمزگذاری) روی آنها قرار می گیرد.

    جدول 3.1

    یکی از اولین استانداردها برای رمزگذاری سیریلیک در کامپیوترها استاندارد KOI8-R بود. قسمت ملی جدول کد این استاندارد در شکل 1 نشان داده شده است. 3.2.

    برنج. 3.2. بخش ملی جدول کد استاندارد KOI8-R


    در حال حاضر از جدول کد نیز استفاده می شود که در صفحه CP866 استاندارد کدگذاری اطلاعات متنی که در سیستم عامل استفاده می شود. ام اس داسیا جلسه ام اس داسبرای رمزگذاری الفبای سیریلیک (شکل 3.3، آ).

    برنج. 3.3. بخش ملی جدول کد، واقع در صفحه СР866 (a) و در صفحه СР1251 (b) استاندارد کدگذاری اطلاعات متنی


    در حال حاضر، برای رمزگذاری سیریلیک، پرکاربردترین جدول کد در صفحه СР1251 استاندارد مربوطه قرار دارد که در سیستم عامل های خانواده استفاده می شود. پنجره هاشرکت ها مایکروسافت(شکل 3.2، ب).در تمام جداول کد ارائه شده به جز جدول استاندارد یونیکد، 8 بیت (8 بیت) برای رمزگذاری یک کاراکتر اختصاص داده شده است.

    در پایان قرن گذشته، یک استاندارد بین المللی جدید ظاهر شد یونیکد،که در آن یک کاراکتر با یک کد باینری دو بایتی نمایش داده می شود. استفاده از این استاندارد ادامه توسعه یک استاندارد جهانی جهانی است که امکان حل مشکل سازگاری رمزگذاری کاراکترهای ملی را فراهم می کند. با استفاده از این استاندارد می توانید 2 16 = 65536 کاراکتر مختلف را رمزگذاری کنید. روی انجیر 3.4 جدول کد 0400 (الفبای روسی) استاندارد را نشان می دهد یونیکد.

    برنج. 3.4. جدول کد 0400 استاندارد یونیکد


    اجازه دهید آنچه را که در مورد کدگذاری اطلاعات متنی گفته شد با استفاده از یک مثال توضیح دهیم.

    مثال 3.1

    کلمه "رایانه" را به عنوان دنباله ای از اعداد اعشاری و هگزادسیمال با استفاده از رمزگذاری CP1251 رمزگذاری کنید. هنگام استفاده از کد دریافتی چه کاراکتری در جداول کد SR866 و KOI8-R نمایش داده می شود.

    توالی کد هگزادسیمال و باینری برای کلمه "Computer" بر اساس جدول کدگذاری CP1251 (به شکل 3.3 مراجعه کنید، ب)به این صورت خواهد بود:

    این دنباله کد در کدهای CP866 و KOI8-R کاراکترهای زیر را نمایش می دهد:

    برای تبدیل اسناد متنی به زبان روسی از یک استاندارد کدگذاری اطلاعات متنی به دیگری، از برنامه های ویژه - مبدل ها استفاده می شود. مبدل ها معمولا در برنامه های دیگر ساخته می شوند. یک مثال یک برنامه مرورگر است - اینترنت اکسپلورر (IE)که دارای مبدل داخلی است. برنامه مرورگر یک برنامه ویژه برای مشاهده محتوا است صفحات وبدر شبکه جهانی کامپیوتر اینترنت بیایید از این برنامه برای تأیید نتیجه نگاشت کاراکتر به دست آمده در مثال 3.1 استفاده کنیم. برای این کار مراحل زیر را انجام دهید.

    1. Notepad را اجرا کنید (یادداشت).برنامه Notepad در سیستم عامل ویندوز XPبا استفاده از دستور راه اندازی شد: [دکمه شروع - برنامه ها - لوازم جانبی - دفترچه یادداشت]. در پنجره برنامه Notepad که باز می شود، کلمه "Computer" را با استفاده از نحو زبان نشانه گذاری سند فرامتن تایپ کنید - HTML (زبان نشانه گذاری هایپر متن).این زبان برای ایجاد اسناد در وب استفاده می شود. متن باید به شکل زیر باشد:

    کامپیوتر، مکان و برچسب ها (ساختارهای خاص) زبان HTMLبرای سرفصل ها روی انجیر 3.5 نتیجه این اقدامات را نشان می دهد.

    برنج. 3.5. نمایش متن در پنجره Notepad


    بیایید این متن را با اجرای دستور: [File - Save As ...] در پوشه مربوطه در رایانه ذخیره کنیم، هنگام ذخیره متن، به فایل یک نام - Note، با پسوند فایل می دهیم. html

    2. برنامه را اجرا کنید اینترنت اکسپلورر،با اجرای دستور: [دکمه شروع - برنامه ها - اینترنت اکسپلورر].هنگامی که برنامه شروع می شود، پنجره نشان داده شده در شکل. 3.6

    برنج. 3.6. پنجره دسترسی آفلاین


    دکمه Offline را انتخاب و فعال کنید، با این کار کامپیوتر به اینترنت جهانی متصل نمی شود. پنجره اصلی برنامه ظاهر می شود مایکروسافت اینترنت اکسپلورر،در شکل نشان داده شده است. 3.7.

    برنج. 3.7. پنجره اصلی Microsoft Internet Explorer


    بیایید دستور زیر را اجرا کنیم: [File - Open]، پنجره ای ظاهر می شود (شکل 3.8) که در آن باید نام فایل را مشخص کنید و OK کنید یا دکمه Browse ... را بزنید و فایل Note.html را پیدا کنید.

    برنج. 3.8. پنجره را باز کنید


    پنجره اصلی برنامه اینترنت اکسپلورر به شکل نشان داده شده در شکل خواهد بود. 3.9. در پنجره، کلمه "Computer" نمایش داده می شود. سپس با استفاده از منوی بالای برنامه اینترنت اکسپلورر،دستور زیر را اجرا کنید: [View - Encoding - Cyrillic (DOS)].پس از اجرای این دستور در پنجره برنامه اینترنت اکسپلوررنمادهای نشان داده شده در شکل 3.10. هنگام اجرای دستور: [مشاهده - رمزگذاری - سیریلیک (KOI8-R)]در پنجره برنامه اینترنت اکسپلوررنمادهای نشان داده شده در شکل 3.11.

    برنج. 3.9. کاراکترهایی که با رمزگذاری CP1251 نمایش داده می شوند


    برنج. 3.10. وقتی رمزگذاری CP866 برای یک دنباله کد ارائه شده در رمزگذاری CP1251 فعال است، نویسه‌هایی نمایش داده می‌شوند.


    برنج. 3.11. وقتی رمزگذاری KOI8-R برای دنباله کد ارائه شده در رمزگذاری CP1251 فعال است، نویسه‌هایی نمایش داده می‌شوند.


    بنابراین، با استفاده از برنامه به دست آمده است اینترنت اکسپلوررتوالی کاراکترها با توالی کاراکترهای به دست آمده با استفاده از جداول کد CP866 و KOI8-R در مثال 3.1 مطابقت دارند.

    3.2. رمزگذاری اطلاعات گرافیکی

    اطلاعات گرافیکی ارائه شده در قالب نقاشی، عکس، اسلاید، تصاویر متحرک (انیمیشن، ویدئو)، نمودارها، نقشه ها را می توان با استفاده از کامپیوتر ایجاد و ویرایش کرد، در حالی که به طور مناسب کدگذاری شده است. در حال حاضر، تعداد نسبتاً زیادی برنامه کاربردی برای پردازش اطلاعات گرافیکی وجود دارد، اما همه آنها سه نوع گرافیک کامپیوتری را اجرا می کنند: شطرنجی، برداری و فراکتال.

    اگر به تصویر گرافیکی روی صفحه مانیتور رایانه نگاه دقیق تری بیندازید، می توانید تعداد زیادی نقطه چند رنگ (پیکسل - از انگلیسی) را مشاهده کنید. پیکسل،تشکیل شده از عنصر تصویرعنصر تصویر) که وقتی کنار هم قرار می گیرند، تصویر گرافیکی داده شده را تشکیل می دهند. از اینجا می توان نتیجه گرفت: یک تصویر گرافیکی در رایانه به روش خاصی کدگذاری می شود و باید به عنوان یک فایل گرافیکی ارائه شود. فایل واحد ساختاری اصلی برای سازماندهی و ذخیره داده ها در یک کامپیوتر است و در این مورد باید حاوی اطلاعاتی در مورد نحوه ارائه این مجموعه از نقاط روی صفحه نمایشگر باشد.

    فایل‌هایی که بر اساس گرافیک برداری ایجاد می‌شوند حاوی اطلاعاتی به شکل وابستگی‌های ریاضی (توابع ریاضی که وابستگی‌های خطی را توصیف می‌کنند) و داده‌های مرتبط در مورد نحوه ساخت تصویر یک شی با استفاده از بخش‌های خط (بردار) هنگام نمایش بر روی صفحه نمایش مانیتور کامپیوتر هستند.

    فایل‌هایی که بر اساس گرافیک شطرنجی ایجاد می‌شوند، ذخیره داده‌های مربوط به هر نقطه در تصویر را فرض می‌کنند. نمایش گرافیک شطرنجی نیازی به محاسبات پیچیده ریاضی ندارد، کافی است اطلاعات مربوط به هر نقطه از تصویر (مختصات و رنگ آن) را بدست آورید و آنها را روی صفحه نمایشگر کامپیوتر نمایش دهید.

    در فرآیند رمزگذاری یک تصویر، نمونه برداری فضایی آن انجام می شود، یعنی تصویر به نقاط جداگانه تقسیم می شود و به هر نقطه یک کد رنگی (زرد، قرمز، آبی و ...) داده می شود. برای رمزگذاری هر نقطه از یک تصویر گرافیکی رنگی، اصل تجزیه یک رنگ دلخواه به اجزای اصلی آن اعمال می شود که به عنوان سه رنگ اصلی استفاده می شود: قرمز (کلمه انگلیسی قرمز،با حرف مشخص شده است به)،سبز (سبز،با حرف مشخص شده است ز)آبی (آبی،راش تعیین کنید که در).هر رنگ نقطه ای که توسط چشم انسان درک می شود را می توان با افزودن (مرتبط) افزودنی (اختلاط) سه رنگ اصلی - قرمز، سبز و آبی به دست آورد. این سیستم کدگذاری سیستم رنگ نامیده می شود. RGB.فایل های تصویری که از سیستم رنگی استفاده می کنند RGB،هر نقطه از تصویر را به عنوان یک سه رنگ - سه مقدار عددی نشان دهید R، Gو که در،مربوط به شدت قرمز، سبز و آبی است. فرآیند رمزگذاری یک تصویر گرافیکی با استفاده از ابزارهای فنی مختلف (اسکنر، دوربین دیجیتال، دوربین فیلمبرداری دیجیتال و غیره) انجام می شود. نتیجه یک تصویر بیت مپ است. هنگام پخش تصاویر گرافیکی رنگی بر روی صفحه نمایش یک مانیتور رنگی رایانه، رنگ هر نقطه (پیکسل) چنین تصویری با ترکیب سه رنگ اصلی به دست می آید. آر، جیو ب

    کیفیت یک تصویر شطرنجی توسط دو پارامتر اصلی تعیین می شود - وضوح (تعداد نقاط افقی و عمودی) و پالت رنگ استفاده شده (تعداد رنگ های مشخص شده برای هر نقطه تصویر). وضوح با تعیین تعداد نقاط افقی و عمودی، به عنوان مثال 800 در 600 نقطه مشخص می شود.

    بین تعداد رنگ های اختصاص داده شده به یک پیکسل از یک تصویر شطرنجی و مقدار اطلاعاتی که باید برای ذخیره رنگ یک پیکسل تخصیص داده شود، رابطه ای وجود دارد که توسط نسبت تعیین می شود (فرمول R. Hartley):

    جایی که من- مقدار اطلاعات؛ N-تعداد رنگ های داده شده به نقطه

    به مقدار اطلاعات مورد نیاز برای ذخیره رنگ یک نقطه، عمق رنگ یا کیفیت رنگ نیز گفته می شود.

    بنابراین، اگر تعداد رنگ های مشخص شده برای یک نقطه تصویر باشد N= 256، سپس مقدار اطلاعات مورد نیاز برای ذخیره سازی آن (عمق رنگ) مطابق با فرمول (3.1) برابر خواهد بود. من= 8 بیت

    رایانه ها از حالت های مختلف نمایش گرافیکی برای نمایش اطلاعات گرافیکی استفاده می کنند. در اینجا لازم به ذکر است که علاوه بر حالت گرافیکی مانیتور، حالت متنی نیز وجود دارد که در آن صفحه نمایش مانیتور به طور معمول به 25 خط 80 کاراکتری در هر خط تقسیم می شود. این حالت های گرافیکی با وضوح صفحه نمایش مانیتور و کیفیت رنگ (عمق رنگ) مشخص می شوند. برای تنظیم حالت گرافیکی صفحه نمایش مانیتور در سیستم عامل MS ویندوز XPشما باید دستور را اجرا کنید: [دکمه شروع - تنظیمات - کنترل پنل - صفحه نمایش]. در کادر محاوره ای "Properties: Display" که ظاهر می شود (شکل 3.12)، زبانه "Parameters" را انتخاب کنید و از نوار لغزنده "Screen Resolution" برای انتخاب وضوح صفحه نمایش مناسب (800x600 پیکسل، 1024x768 پیکسل و غیره) استفاده کنید. با استفاده از لیست کشویی "کیفیت رنگ"، می توانید عمق رنگ را انتخاب کنید - "بالاترین (32 بیت)"، "متوسط ​​(16 بیت)"، و غیره، در حالی که تعداد رنگ های اختصاص داده شده به هر نقطه از تصویر به ترتیب برابر با 2 32 (4294967296)، 2 16 (6553) و غیره خواهد بود.

    برنج. 3.12. کادر گفتگوی ویژگی های نمایش


    برای پیاده سازی هر یک از حالت های گرافیکی صفحه مانیتور، حجم اطلاعات مشخصی از حافظه ویدئویی کامپیوتر مورد نیاز است. حجم اطلاعات مورد نیاز حافظه ویدئویی (V)از رابطه مشخص می شود

    جایی که به -تعداد نقاط تصویر روی صفحه نمایشگر (K = A B)؛ آ -تعداد نقاط افقی روی صفحه مانیتور؛ که در -تعداد نقاط عمودی روی صفحه مانیتور؛ من– مقدار اطلاعات (عمق رنگ).

    بنابراین، اگر صفحه نمایش مانیتور دارای وضوح 1024 در 768 پیکسل و یک پالت متشکل از 65536 رنگ باشد، عمق رنگ مطابق با فرمول (3.1) I = log 2 65538 = 16 بیت خواهد بود، تعداد پیکسل های تصویر به صورت زیر خواهد بود: K = 1024 x 768 = 786432 و حجم اطلاعات مورد نیاز حافظه ویدئویی مطابق با (3.2) برابر خواهد بود.

    V = 786432 16 بیت = 12582912 بیت = 1572864 بایت = 1536 کیلوبایت = 1.5 مگابایت.

    در خاتمه لازم به ذکر است که علاوه بر مشخصات ذکر شده، مهمترین ویژگی مانیتور، ابعاد هندسی صفحه نمایش و نقاط تصویر آن است. ابعاد هندسی صفحه نمایش بر اساس اندازه قطر مانیتور تنظیم می شود. اندازه مورب مانیتورها بر حسب اینچ تنظیم می شود (1 اینچ = 1" = 25.4 میلی متر) و می تواند مقادیری برابر با 14، 15، 17، 21" و غیره داشته باشد. فناوری های مدرن تولید مانیتور می توانند اندازه نقطه تصویر 0.22 میلی متر را ارائه دهند.

    بنابراین، برای هر مانیتور حداکثر وضوح صفحه نمایش ممکن از لحاظ فیزیکی وجود دارد که با اندازه قطر آن و اندازه نقطه تصویر تعیین می شود.

    تمرین هایی برای خودشکوفایی

    1. استفاده از برنامه MS Excelجداول کد ASCII، СР866، СР1251، KOI8-R را به جدول هایی به این شکل تبدیل کنید: در خانه های ستون اول جداول، به ترتیب حروف الفبای بزرگ و سپس حروف کوچک لاتین و سیریلیک بنویسید، در سلول های ستون دوم - کدهای مربوط به حروف در سیستم اعداد اعشاری، در سلول های ستون کد اعداد اعشاری مربوط به سلول های هگزا. مقادیر کد باید از جداول کد مربوطه انتخاب شوند.

    2. کلمات زیر را به صورت دنباله ای از اعداد به صورت اعشاری و هگزادسیمال رمزگذاری کرده و یادداشت کنید:

    آ) اینترنت اکسپلورر،ب) مایکروسافت آفیس V) کورل دراو.

    برای تولید با استفاده از جدول رمزگذاری ASCII ارتقا یافته که در تمرین قبلی به دست آمد، کدگذاری کنید.

    3. با استفاده از جدول کدگذاری ارتقا یافته KOI8-R دنباله های اعداد نوشته شده در سیستم اعداد هگزادسیمال را رمزگشایی کنید:

    الف) FC CB DA C9 D3 D4 C5 CE C3 C9 D1;

    ب) EB CF CE C6 CF D2 CD C9 DA CD;

    ج) FC CB D3 D0 D2 C5 D3 C9 CF CE C9 DA CD.

    4. کلمه "Cybernetics" نوشته شده در رمزگذاری CP1251 هنگام استفاده از رمزگذاری های CP866 و KOI8-R چگونه خواهد بود؟ نتایج را با برنامه بررسی کنید اینترنت اکسپلورر.

    5. با استفاده از جدول کد نشان داده شده در شکل. 3.1 آ،دنباله کدهای زیر را که با نماد دودویی نوشته شده اند رمزگشایی کنید:

    الف) 01010111 01101111 01110010 01100100؛

    ب) 01000101 01111000 01100011 01100101 01101100;

    ج) 01000001 01100011 01100011 01100101 01110011 01110011.

    6. حجم اطلاعات کلمه "Economy" را با استفاده از جداول کد СР866، СР1251، Unicode و KOI8-R کدگذاری شده است.

    7. حجم اطلاعات فایلی که در نتیجه اسکن یک تصویر رنگی 12*12 سانتی متر به دست می آید را تعیین کنید وضوح اسکنر مورد استفاده برای اسکن این تصویر 600 dpi است. اسکنر عمق رنگ نقطه تصویر را روی 16 بیت تنظیم می کند.

    وضوح اسکنر 600 dpi (اینچ نقطه ای -نقطه در هر اینچ) توانایی اسکنر با این وضوح را برای تشخیص 600 نقطه در یک بخش 1 اینچی تعیین می کند.

    8. حجم اطلاعات فایل به دست آمده در نتیجه اسکن تصویر رنگی در اندازه A4 را تعیین کنید. وضوح اسکنر مورد استفاده برای اسکن این تصویر 1200 dpi است. اسکنر عمق رنگ نقطه تصویر را روی 24 بیت تنظیم می کند.

    9. تعداد رنگ های پالت را در عمق رنگ 8، 16، 24 و 32 بیت تعیین کنید.

    10. مقدار حافظه ویدئویی مورد نیاز را برای حالت های گرافیکی صفحه نمایش مانیتور 640 در 480، 800 در 600، 1024 در 768 و 1280 در 1024 پیکسل با عمق رنگ نقطه تصویر 8، 16، 24 و 32 بیت تعیین کنید. نتایج در یک جدول خلاصه شده است. توسعه در MS Excelبرنامه ای برای محاسبات خودکار

    11. اگر رایانه 2 کیلوبایت حافظه برای تصویر اختصاص داده باشد، حداکثر تعداد رنگ هایی را که می توان برای ذخیره یک تصویر 32 در 32 پیکسل استفاده کرد، تعیین کنید.

    12. حداکثر وضوح ممکن صفحه نمایش مانیتوری با طول مورب 15 اینچ و اندازه نقطه تصویر 0.28 میلی متر را تعیین کنید.

    13. چه حالت های گرافیکی عملکرد مانیتور توسط حافظه ویدئویی 64 مگابایتی قابل ارائه است؟

    محتوا

    I. تاریخچه کدگذاری اطلاعات…………………………………..3

    II. اطلاعات کدگذاری………………………………………4

    III. رمزگذاری اطلاعات متنی……………………………….4

    IV. انواع جداول رمزگذاری………………………………………………………………………………

    V. محاسبه مقدار اطلاعات متنی………………………14

    فهرست ادبیات استفاده شده……………………………………..16

    من. تاریخچه رمزگذاری اطلاعات

    بشر از همان لحظه ای که اولین اطلاعات مخفی ظاهر شد، از رمزگذاری متن (رمزگذاری) استفاده کرده است. در اینجا چندین تکنیک رمزگذاری متن وجود دارد که در مراحل مختلف توسعه تفکر بشری ابداع شده است:

    رمزنگاری رمزنگاری است، سیستمی برای تغییر نوشتار به منظور غیرقابل درک کردن متن برای افراد ناآشنا.

    کد مورس یا کد تلگرافی غیر یکنواخت که در آن هر حرف یا کاراکتر با ترکیب بسته‌های اولیه جریان الکتریکی کوتاه (نقطه) و بسته‌های اولیه با مدت زمان سه‌گانه (خط تیره) نشان داده می‌شود.

    زبان اشاره زبان اشاره ای است که توسط افراد دارای آسیب شنوایی استفاده می شود.

    یکی از اولین روش‌های رمزگذاری شناخته شده، نام امپراتور روم ژولیوس سزار (قرن اول قبل از میلاد) را دارد. این روش بر این اساس است که با جابجایی حروف الفبا از حرف اصلی توسط تعداد مشخصی کاراکتر، هر حرف از متن رمزگذاری شده با دیگری جایگزین شود و الفبا به صورت دایره ای خوانده شود، یعنی بعد از حرف i، a در نظر گرفته شود. بنابراین کلمه "بایت" هنگامی که دو کاراکتر به سمت راست منتقل می شود با کلمه "gvlf" رمزگذاری می شود. فرآیند معکوس رمزگشایی یک کلمه داده شده، جایگزینی هر حرف رمزگذاری شده با حرف دوم در سمت چپ آن است.

    II. رمزگذاری اطلاعات

    کد مجموعه ای از قراردادها (یا سیگنال ها) برای ضبط (یا انتقال) برخی مفاهیم از پیش تعریف شده است.

    رمزگذاری اطلاعات فرآیند تشکیل یک نمایش معین از اطلاعات است. در معنای محدودتر، اصطلاح "کدگذاری" اغلب به عنوان انتقال از یک شکل ارائه اطلاعات به شکل دیگر درک می شود که برای ذخیره، انتقال یا پردازش راحت تر است.

    معمولاً هر تصویر وقتی رمزگذاری می شود (گاهی اوقات می گویند - رمزگذاری شده است) با یک کاراکتر جداگانه نشان داده می شود.

    نشانه عنصری از مجموعه محدودی از عناصر متمایز است.

    در معنای محدودتر، اصطلاح "کدگذاری" اغلب به عنوان انتقال از یک شکل ارائه اطلاعات به شکل دیگر درک می شود که برای ذخیره، انتقال یا پردازش راحت تر است.

    کامپیوتر می تواند اطلاعات متنی را پردازش کند. وقتی وارد رایانه می‌شود، هر حرف با یک عدد مشخص رمزگذاری می‌شود و هنگام خروجی به دستگاه‌های خارجی (صفحه نمایش یا چاپ)، برای درک انسان، تصاویر حروف با استفاده از این اعداد ساخته می‌شوند. مطابقت بین مجموعه ای از حروف و اعداد را رمزگذاری کاراکتر می گویند.

    به عنوان یک قاعده، همه اعداد در رایانه با استفاده از صفر و یک نشان داده می شوند (و نه ده رقم، همانطور که برای مردم مرسوم است). به عبارت دیگر، رایانه ها معمولاً در سیستم باینری کار می کنند، زیرا دستگاه های پردازش آنها بسیار ساده تر هستند. وارد کردن اعداد به رایانه و خروجی آنها برای خواندن توسط انسان می تواند به شکل اعشاری معمول انجام شود و تمام تبدیل های لازم توسط برنامه های در حال اجرا بر روی رایانه انجام می شود.

    III. رمزگذاری اطلاعات متنی

    همان اطلاعات را می توان به چندین شکل ارائه کرد (رمزگذاری کرد). با ظهور رایانه ها، رمزگذاری انواع اطلاعاتی که هم فرد و هم کل بشریت با آن سروکار دارند، ضروری شد. اما بشر مدت ها قبل از ظهور رایانه ها شروع به حل مشکل رمزگذاری اطلاعات کرد. دستاوردهای بزرگ بشر - نوشتن و حساب - چیزی بیش از یک سیستم رمزگذاری گفتار و اطلاعات عددی نیست. اطلاعات هرگز به شکل خالص خود ظاهر نمی شوند، همیشه به نحوی ارائه می شوند، به نوعی رمزگذاری شده اند.

    کدگذاری باینری یکی از رایج ترین راه های نمایش اطلاعات است. در رایانه‌ها، روبات‌ها و ماشین‌ابزارها با کنترل عددی، به عنوان یک قاعده، تمام اطلاعاتی که دستگاه با آنها سروکار دارد به شکل کلمات الفبای باینری کدگذاری می‌شود.

    از اواخر دهه 60، رایانه ها به طور فزاینده ای برای پردازش اطلاعات متنی مورد استفاده قرار گرفتند و در حال حاضر سهم اصلی رایانه های شخصی در جهان (و بیشتر اوقات) به پردازش اطلاعات متنی اختصاص دارد. همه این نوع اطلاعات در یک کامپیوتر به صورت کد باینری نمایش داده می شوند، یعنی الفبای با توان دو استفاده می شود (فقط دو کاراکتر 0 و 1). این به این دلیل است که نمایش اطلاعات در قالب دنباله ای از تکانه های الکتریکی راحت است: هیچ ضربه ای (0) وجود ندارد، یک ضربه (1) وجود دارد.

    چنین کدگذاری معمولا باینری نامیده می شود و دنباله های منطقی صفر و یک خود زبان ماشین نامیده می شوند.

    از نقطه نظر کامپیوتر، متن از شخصیت های فردی تشکیل شده است. کاراکترها نه تنها شامل حروف (بزرگ یا کوچک، لاتین یا روسی)، بلکه اعداد، علائم نگارشی، کاراکترهای خاص مانند "="، "("، "&"، و غیره و حتی (توجه ویژه!) فاصله بین کلمات هستند.

    متون با استفاده از صفحه کلید وارد حافظه کامپیوتر می شوند. کلیدها با حروف، اعداد، علائم نگارشی و سایر علائم برای ما آشنا نوشته می شوند. آنها رم را به صورت کد باینری وارد می کنند. این بدان معنی است که هر کاراکتر با یک کد باینری 8 بیتی نشان داده می شود.

    به طور سنتی، برای رمزگذاری یک کاراکتر، از مقدار اطلاعات برابر با 1 بایت استفاده می شود، یعنی I \u003d 1 بایت \u003d 8 بیت. با استفاده از فرمولی که به تعداد رویدادهای احتمالی K و مقدار اطلاعات I مربوط می شود، می توانید محاسبه کنید که چند کاراکتر مختلف را می توان رمزگذاری کرد (با فرض اینکه کاراکترها رویدادهای احتمالی هستند): K = 2 I = 2 8 = 256، یعنی الفبای با ظرفیت 256 کاراکتر می تواند برای نمایش اطلاعات متنی استفاده شود.

    این تعداد کاراکتر برای نمایش اطلاعات متنی از جمله حروف بزرگ و کوچک الفبای روسی و لاتین، اعداد، علائم، علائم گرافیکی و غیره کاملاً کافی است.

    رمزگذاری به این صورت است که به هر کاراکتر یک کد اعشاری منحصر به فرد از 0 تا 255 یا کد باینری مربوطه از 00000000 تا 11111111 اختصاص داده می شود. بنابراین، شخص کاراکترها را بر اساس سبک آنها و رایانه را با کد آنها متمایز می کند.

    راحتی رمزگذاری بایت به بایت کاراکترها واضح است، زیرا یک بایت کوچکترین بخش آدرس پذیر حافظه است و بنابراین، پردازنده هنگام انجام پردازش متن می تواند به هر کاراکتر جداگانه دسترسی داشته باشد. از سوی دیگر، 256 کاراکتر برای نشان دادن طیف گسترده ای از اطلاعات شخصیت ها کاملاً کافی است.

    در فرآیند نمایش یک کاراکتر بر روی صفحه کامپیوتر، فرآیند معکوس انجام می شود - رمزگشایی، یعنی تبدیل کد کاراکتر به تصویر آن. مهم این است که انتساب یک کد خاص به یک نماد توافقی است که در جدول کد مشخص شده است.

    حال این سوال پیش می آید که کدام کد هشت بیتی باینری را با هر کاراکتر مطابقت دهیم. واضح است که این یک موضوع مشروط است، شما می توانید راه های زیادی برای رمزگذاری پیدا کنید.

    همه کاراکترهای الفبای کامپیوتر از 0 تا 255 شماره گذاری می شوند. هر عدد مربوط به یک کد باینری هشت بیتی از 00000000 تا 11111111 است. این کد به سادگی عدد ترتیبی کاراکتر در سیستم اعداد باینری است.

    IV. انواع جداول رمزگذاری

    جدولی که در آن به تمام کاراکترهای الفبای کامپیوتر شماره سریال اختصاص داده می شود، جدول رمزگذاری نامیده می شود.

    برای انواع کامپیوترها از جداول رمزگذاری متفاوتی استفاده می شود.

    جدول کد ASCII (کد استاندارد آمریکایی برای تبادل اطلاعات) به عنوان یک استاندارد بین المللی پذیرفته شده است و نیمه اول کاراکترها را با کدهای عددی از 0 تا 127 رمزگذاری می کند (کدهای 0 تا 32 نه به کاراکترها، بلکه به کلیدهای عملکرد اختصاص داده می شوند).

    جدول کد اسکی به دو قسمت تقسیم می شود.

    فقط نیمه اول جدول یک استاندارد بین المللی است، یعنی. کاراکترهایی با اعداد از 0 (00000000) تا 127 (01111111).

    ساختار جدول رمزگذاری ASCII

    شماره سریال کد سمبل
    0 - 31 00000000 - 00011111

    کاراکترهایی با اعداد از 0 تا 31 کاراکترهای کنترلی نامیده می شوند.

    عملکرد آنها کنترل فرآیند نمایش متن روی صفحه یا چاپ، دادن سیگنال صوتی، علامت گذاری متن و غیره است.

    32 - 127 0100000 - 01111111

    قسمت استاندارد جدول (انگلیسی). این شامل حروف کوچک و بزرگ الفبای لاتین، اعداد اعشاری، علائم نگارشی، انواع براکت ها، علامت های تجاری و سایر نمادها است.

    کاراکتر 32 یک فضا است، یعنی. جای خالی در متن

    همه بقیه با علائم خاصی منعکس می شوند.

    128 - 255 10000000 - 11111111

    قسمت جایگزین جدول (روسی).

    نیمه دوم جدول کدهای ASCII که صفحه کد نامیده می شود (128 کد که با 10000000 شروع می شود و با 11111111 ختم می شود) می تواند گزینه های مختلفی داشته باشد که هر گزینه شماره مخصوص به خود را دارد.

    صفحه کد عمدتاً برای قرار دادن اسکریپت های ملی به غیر از لاتین استفاده می شود. در رمزگذاری های ملی روسیه، حروف الفبای روسی در این قسمت از جدول قرار می گیرند.

    نیمه اول جدول کد اسکی

    توجه به این نکته جلب می شود که در جدول رمزگذاری، حروف (بزرگ و کوچک) به ترتیب حروف الفبا و اعداد به ترتیب صعودی مرتب شده اند. به این رعایت نظم واژگانی در چینش حروف، اصل رمزگذاری ترتیبی الفبا می گویند.

    برای حروف الفبای روسی، اصل کدگذاری متوالی نیز رعایت می شود.

    نیمه دوم جدول کد اسکی

    متأسفانه، در حال حاضر پنج رمزگذاری سیریلیک مختلف (KOI8-R، Windows. MS-DOS، Macintosh و ISO) وجود دارد. به همین دلیل، اغلب با انتقال متن روسی از یک رایانه به رایانه دیگر، از یک سیستم نرم افزاری به سیستم دیگر، مشکلاتی ایجاد می شود.

    از نظر زمانی، یکی از اولین استانداردها برای رمزگذاری حروف روسی در رایانه، KOI8 ("کد تبادل اطلاعات، 8 بیت") بود. این رمزگذاری در دهه 70 در رایانه های سری رایانه های EC مورد استفاده قرار گرفت و از اواسط دهه 80 در اولین نسخه های روسی شده سیستم عامل یونیکس استفاده شد.

    از ابتدای دهه 90، زمان تسلط سیستم عامل MS DOS، رمزگذاری CP866 باقی می ماند ("CP" مخفف "صفحه کد"، "صفحه کد" است).

    کامپیوترهای اپل که سیستم عامل مک را اجرا می کنند از کدگذاری مک خود استفاده می کنند.

    علاوه بر این، سازمان بین المللی استاندارد (سازمان بین المللی استاندارد، ISO) کدگذاری دیگری به نام ISO 8859-5 را به عنوان استاندارد برای زبان روسی تأیید کرد.

    رایج ترین رمزگذاری مورد استفاده در حال حاضر مایکروسافت ویندوز است که به اختصار CP1251 نامیده می شود. معرفی شده توسط مایکروسافت؛ با توجه به استفاده گسترده از سیستم عامل ها (OS) و سایر محصولات نرم افزاری این شرکت در فدراسیون روسیه، رواج یافته است.

    از اواخر دهه 90، مشکل استانداردسازی رمزگذاری کاراکترها با معرفی یک استاندارد بین المللی جدید به نام یونیکد حل شد.

    این یک رمزگذاری 16 بیتی است، یعنی. هر کاراکتر 2 بایت حافظه دارد. البته در این حالت میزان حافظه اشغال شده 2 برابر افزایش می یابد. اما چنین جدول کدی امکان گنجاندن حداکثر 65536 کاراکتر را فراهم می کند. مشخصات کامل استاندارد یونیکد شامل تمام الفبای موجود، منقرض شده و مصنوعی جهان و همچنین بسیاری از نمادهای ریاضی، موسیقی، شیمیایی و غیره است.

    نمایش داخلی کلمات در حافظه کامپیوتر

    با استفاده از جدول ASCII

    گاهی اوقات اتفاق می افتد که متن، متشکل از حروف الفبای روسی، دریافت شده از رایانه دیگری، قابل خواندن نیست - نوعی "abracadabra" روی صفحه نمایش مانیتور قابل مشاهده است. این به دلیل این واقعیت است که رایانه ها از رمزگذاری کاراکترهای مختلف زبان روسی استفاده می کنند.

    بنابراین، هر کدگذاری توسط جدول کد خود ارائه می شود. همانطور که از جدول مشاهده می شود، کاراکترهای مختلف به یک کد باینری در کدگذاری های مختلف اختصاص داده می شوند.

    به عنوان مثال، دنباله کدهای عددی 221، 194، 204 در رمزگذاری CP1251 کلمه "کامپیوتر" را تشکیل می دهد، در حالی که در کدگذاری های دیگر مجموعه ای از کاراکترهای بی معنی خواهد بود.

    خوشبختانه، در بیشتر موارد، کاربر نیازی به نگرانی در مورد رمزگذاری اسناد متنی ندارد، زیرا این کار توسط برنامه های مبدل ویژه ای که در برنامه ها تعبیه شده است انجام می شود.

    V. محاسبه مقدار اطلاعات متنی

    وظیفه 1:کلمه "Rome" را با استفاده از جداول رمزگذاری KOI8-R و CP1251 رمزگذاری کنید.

    راه حل:

    وظیفه 2:با فرض اینکه هر کاراکتر توسط یک بایت رمزگذاری شده است، حجم اطلاعات جمله زیر را تخمین بزنید:

    "عموی من از صادق ترین قوانین،

    وقتی به شدت بیمار شدم،

    خودش را مجبور به احترام کرد

    و نمی توانستم بهتر از این فکر کنم."

    راه حل:در این عبارت 108 کاراکتر وجود دارد که شامل علائم نگارشی، گیومه و فاصله است. این عدد را در 8 بیت ضرب می کنیم. 108*8=864 بیت می گیریم.

    وظیفه 3:دو متن دارای تعداد کاراکترهای یکسانی هستند. متن اول به زبان روسی و متن دوم به زبان قبیله ناگوری نوشته شده است که الفبای آن از 16 حرف تشکیل شده است. متن چه کسی حاوی اطلاعات بیشتری است؟

    راه حل:

    1) I \u003d K * a (حجم اطلاعات متن برابر است با حاصل ضرب تعداد کاراکترها و وزن اطلاعات یک کاراکتر).

    2) چون هر دو متن تعداد کاراکترهای یکسانی دارند (K)، سپس تفاوت به محتوای اطلاعاتی یک کاراکتر الفبا (a) بستگی دارد.

    3) 2 a1 = 32، یعنی. a 1 = 5 بیت، 2 a2 = 16، یعنی. و 2 = 4 بیت.

    4) I 1 = K * 5 بیت، I 2 = K * 4 بیت.

    5) یعنی متن نوشته شده به زبان روسی 5/4 برابر اطلاعات بیشتری دارد.

    وظیفه 4: حجم یک پیام حاوی 2048 کاراکتر 1/512 مگابایت بود. قدرت الفبا را تعیین کنید.

    راه حل:

    1) I = 1/512 * 1024 * 1024 * 8 = 16384 بیت - حجم اطلاعات پیام به بیت تبدیل شد.

    2) یک \u003d I / K \u003d 16384 / 1024 \u003d 16 بیت - روی یک کاراکتر الفبا می افتد.

    3) 2*16*2048 = 65536 کاراکتر - قدرت الفبای مورد استفاده.

    وظیفه 5:چاپگر لیزری Canon LBP با سرعت متوسط ​​6.3 کیلوبیت بر ثانیه چاپ می کند. اگر مشخص شود که در یک صفحه به طور متوسط ​​45 خط، 70 کاراکتر در هر خط (1 کاراکتر - 1 بایت) وجود دارد، چاپ یک سند 8 صفحه چقدر طول می کشد؟

    راه حل:

    1) مقدار اطلاعات موجود در 1 صفحه را بیابید: 45 * 70 * 8 بیت = 25200 بیت

    2) مقدار اطلاعات را در 8 صفحه بیابید: 25200 * 8 = 201600 بیت

    3) ما به واحدهای اندازه گیری یکنواخت می رسیم. برای انجام این کار، مگابیت در ثانیه را به بیت ترجمه می کنیم: 6.3 * 1024 = 6451.2 bps.

    4) زمان چاپ را پیدا کنید: 201600: 6451.2 = 31 ثانیه.

    کتابشناسی - فهرست کتب

    1. Ageev V.M. تئوری اطلاعات و کدگذاری: گسسته سازی و کدگذاری اطلاعات اندازه گیری. - M.: MAI، 1977.

    2. Kuzmin I.V., Kedrus V.A. مبانی تئوری اطلاعات و کدگذاری. - کیف، مدرسه ویشچا، 1986.

    3. ساده ترین روش های رمزگذاری متن / D.M. زلاتوپولسکی. - M.: Chistye Prudy، 2007 - 32 p.

    4. اوگرینویچ N.D. انفورماتیک و فناوری اطلاعات. کتاب درسی برای کلاس های 10-11 / N.D. Ugrinovich. - M.: BINOM. آزمایشگاه دانش، 1382. - 512 ص.

    5. http://school497.spb.edu.ru/uchint002/les10/les.html#n

    مطالبی برای خودآموزی در مورد موضوع سخنرانی 2

    رمزگذاریASCII

    جدول رمزگذاری ASCII (ASCII - کد استاندارد آمریکایی برای تبادل اطلاعات - کد استاندارد آمریکایی برای تبادل اطلاعات).

    در مجموع با استفاده از جدول رمزگذاری ASCII (شکل 1) می توان 256 کاراکتر مختلف را کدگذاری کرد. این جدول به دو بخش اصلی (با کدهای OOh تا 7Fh) و اضافی (از 80h تا FFh) تقسیم می‌شود که حرف h نشان می‌دهد که کد متعلق به سیستم اعداد هگزادسیمال است.

    تصویر 1

    برای رمزگذاری یک کاراکتر از جدول، 8 بیت (1 بایت) اختصاص داده می شود. هنگام پردازش اطلاعات متنی، یک بایت ممکن است حاوی کد برخی از کاراکترها باشد - حروف، اعداد، علائم نگارشی، علائم عمل و غیره. هر کاراکتر کد مخصوص به خود را به شکل یک عدد صحیح دارد. در این حالت تمامی کدها در جداول خاصی که به آنها جداول رمزگذاری می گویند جمع آوری می شوند. با کمک آنها، کد کاراکتر به نمایش قابل مشاهده خود در صفحه نمایشگر تبدیل می شود. در نتیجه، هر متنی در حافظه رایانه به صورت دنباله ای از بایت ها با کدهای کاراکتر نمایش داده می شود.

    مثلا کلمه سلام! به صورت زیر کدگذاری می شود (جدول 1).

    میز 1

    کد باینری

    کد اعشاری

    شکل 1 کاراکترهای موجود در کدگذاری استاندارد (انگلیسی) و توسعه یافته (روسی) ASCII را نشان می دهد.

    نیمه اول جدول ASCII استاندارد شده است. این شامل کدهای کنترل (از 00h تا 20h و 77h) است. این کدها از جدول حذف شده اند زیرا برای عناصر متن اعمال نمی شوند. علائم نگارشی و علائم ریاضی نیز در اینجا قرار می گیرند: 2lh - !، 26h - &، 28h - (، 2Bh -+، ...، حروف لاتین بزرگ و کوچک: 41h - A، 61h - a.

    نیمه دوم جدول شامل فونت های ملی، نمادهای شبه نگاری است که می توان از آنها جداول ساخت، نمادهای ریاضی خاص. قسمت پایین جدول رمزگذاری را می توان با استفاده از درایورهای مناسب - کنترل برنامه های کمکی جایگزین کرد. این تکنیک به شما این امکان را می دهد که از فونت های متعدد و فونت های آنها استفاده کنید.

    نمایشگر هر کد کاراکتر باید تصویر شخصیت را نمایش دهد - نه فقط یک کد دیجیتال، بلکه یک تصویر مربوط به آن، زیرا هر کاراکتر شکل خاص خود را دارد. شرح شکل هر کاراکتر در یک حافظه نمایشگر مخصوص - یک تولید کننده کاراکتر - ذخیره می شود. برای مثال، برجسته کردن یک کاراکتر در صفحه نمایش کامپیوتر IBM، با استفاده از نقاطی انجام می شود که یک ماتریس کاراکتر را تشکیل می دهند. هر پیکسل در چنین ماتریسی یک عنصر تصویر است و می تواند روشن یا تاریک باشد. یک نقطه تاریک با عدد 0، یک روشن (روشن) یک با 1 رمزگذاری می شود. اگر پیکسل های تیره با یک نقطه در میدان ماتریس علامت، و پیکسل های روشن با یک ستاره نشان داده می شوند، می توانید شکل نماد را به صورت گرافیکی به تصویر بکشید.

    مردم کشورهای مختلف از نمادها برای نوشتن کلمات زبان مادری خود استفاده می کنند. اکثر برنامه‌های کاربردی این روزها، از جمله سیستم‌های ایمیل و مرورگرهای وب، 8 بیتی خالص هستند، به این معنی که طبق استاندارد ISO-8859-1 فقط می‌توانند کاراکترهای 8 بیتی را نمایش داده و به درستی بخوانند.

    بیش از 256 کاراکتر در جهان وجود دارد (از جمله سیریلیک، عربی، چینی، ژاپنی، کره ای و تایلندی) و کاراکترهای بیشتر و بیشتری در حال اضافه شدن هستند. و این شکاف های زیر را برای بسیاری از کاربران ایجاد می کند:

    امکان استفاده از کاراکترهای مجموعه های رمزگذاری مختلف در یک سند وجود ندارد. از آنجایی که هر سند متنی از مجموعه ای از رمزگذاری های خاص خود استفاده می کند، در تشخیص خودکار متن مشکلات زیادی وجود دارد.

    نمادهای جدیدی ظاهر می شوند (به عنوان مثال: یورو) که در نتیجه ISO استاندارد جدیدی به نام ISO-8859-15 ایجاد می کند که بسیار شبیه به ISO-8859-1 است. تفاوت به شرح زیر است: نمادهای ارزهای قدیمی که در حال حاضر استفاده نمی شوند از جدول رمزگذاری استاندارد قدیمی ISO-8859-1 حذف شده اند تا جایی برای نمادهای تازه ظاهر شده (مانند یورو) ایجاد شود. در نتیجه، کاربران می توانند اسناد مشابهی را روی دیسک های خود داشته باشند، اما در کدگذاری های متفاوت. راه حل این مشکلات، اتخاذ یک مجموعه بین المللی واحد از رمزگذاری است که به آن رمزگذاری جهانی یا یونیکد می گویند.

    رمزگذارییونیکد

    این استاندارد در سال 1991 توسط سازمان غیرانتفاعی Unicode Consortium (English Unicode Consortium, Unicode Inc.) پیشنهاد شد. استفاده از این استاندارد امکان رمزگذاری تعداد بسیار زیادی کاراکتر از اسکریپت های مختلف را فراهم می کند: کاراکترهای چینی، نمادهای ریاضی، حروف الفبای یونانی، الفبای لاتین و سیریلیک می توانند در اسناد یونیکد همزیستی داشته باشند، در حالی که تعویض صفحات کد غیرضروری می شود.

    این استاندارد از دو بخش اصلی تشکیل شده است: مجموعه کاراکترهای جهانی (UCS، مجموعه کاراکترهای جهانی) و خانواده کدگذاری (UTF، فرمت تبدیل یونیکد). مجموعه کاراکتر جهانی مطابقت یک به یک کاراکترها با کدها را مشخص می کند - عناصر فضای کد که اعداد صحیح غیر منفی را نشان می دهند. یک خانواده کدگذاری نمایش ماشین دنباله ای از کدهای UCS را تعریف می کند.

    استاندارد یونیکد با هدف ایجاد رمزگذاری یک کاراکتر برای همه زبان‌های نوشتاری مدرن و باستانی ایجاد شد. هر کاراکتر در این استاندارد با 16 بیت کدگذاری شده است که به آن اجازه می دهد تعداد غیرقابل مقایسه ای از کاراکترها را نسبت به رمزگذاری های 8 بیتی پذیرفته شده قبلی پوشش دهد. تفاوت مهم دیگر بین یونیکد و سایر سیستم های رمزگذاری این است که نه تنها یک کد منحصر به فرد به هر کاراکتر اختصاص می دهد، بلکه ویژگی های مختلفی از آن کاراکتر را نیز تعریف می کند، به عنوان مثال:

      نوع کاراکتر (حرف بزرگ، حرف کوچک، عدد، علامت نقطه گذاری و غیره)؛

      ویژگی های کاراکتر (نمایش از چپ به راست یا راست به چپ، فاصله، شکست خط و غیره)؛

      حروف بزرگ یا کوچک مربوطه (به ترتیب برای حروف کوچک و بزرگ)؛

      مقدار عددی مربوطه (برای کاراکترهای عددی).

    کل محدوده کدها از 0 تا FFFF به چندین زیرمجموعه استاندارد تقسیم می شود که هر کدام به الفبای زبان یا گروهی از کاراکترهای خاص که از نظر عملکرد مشابه هستند مطابقت دارد. نمودار زیر شامل یک لیست کلی از زیر مجموعه های یونیکد 3.0 است (شکل 2).

    شکل 2

    استاندارد یونیکد مبنای ذخیره سازی و متن در بسیاری از سیستم های کامپیوتری مدرن است. با این حال، با اکثر پروتکل‌های اینترنتی سازگار نیست، زیرا کدهای آن می‌توانند حاوی هر مقدار بایت باشند و پروتکل‌ها معمولاً از بایت‌های 00 - 1F و FE - FF به عنوان بایت سرویس استفاده می‌کنند. برای دستیابی به سازگاری، چندین فرمت تبدیل یونیکد (UTFs، Unicode Transformation Formats) ایجاد شده است که امروزه UTF-8 رایج ترین آنهاست. این فرمت قوانین زیر را برای تبدیل هر کد یونیکد به مجموعه ای از بایت ها (از یک به سه) مناسب برای انتقال توسط پروتکل های اینترنتی تعریف می کند.

    در اینجا x،y،z بیت‌های کد منبع را نشان می‌دهند که باید از کوچک‌ترین استخراج شوند و از راست به چپ در بایت‌های نتیجه وارد شوند تا تمام موقعیت‌های مشخص شده پر شوند.

    توسعه بیشتر استاندارد یونیکد با افزودن سطوح زبانی جدید همراه است. کاراکترهایی در محدوده 10000 - 1FFFF، 20000 - 2FFFF، و غیره، که در آن قرار است رمزگذاری برای اسکریپت های زبان های مرده که در جدول بالا گنجانده نشده اند را شامل شود. یک قالب جدید UTF-16 برای رمزگذاری این کاراکترهای اضافی ایجاد شد.

    بنابراین، 4 روش اصلی برای رمزگذاری بایت ها در قالب یونیکد وجود دارد:

    UTF-8: 128 کاراکتر در یک بایت (قالب ASCII)، 1920 کاراکتر در 2 بایت ((رومی، یونانی، سیریلیک، قبطی، ارمنی، عبری، عربی)، 63488 کاراکتر در 3 بایت کدگذاری شده است (چینی، ژاپنی، 7 نویسه استفاده شده، 21، و غیره). 4، 5 یا 6 بایت کدگذاری شود.

    UCS-2: هر کاراکتر با 2 بایت نمایش داده می شود. این رمزگذاری فقط شامل 65535 کاراکتر اول از قالب یونیکد است.

    UTF-16: این افزونه UCS-2 است و شامل 1,114,112 کاراکتر یونیکد می باشد. 65535 کاراکتر اول با 2 بایت و بقیه با 4 بایت نمایش داده می شوند.

    USC-4: هر کاراکتر با 4 بایت کدگذاری می شود.

    دسامبرهگزسمبل دسامبرهگزسمبل
    000 00 متخصص. نه 128 80 Ђ
    001 01 متخصص. SOH 129 81 Ѓ
    002 02 متخصص. STX 130 82
    003 03 متخصص. ETX 131 83 ѓ
    004 04 متخصص. EOT 132 84
    005 05 متخصص. ENQ 133 85
    006 06 متخصص. ACK 134 86
    007 07 متخصص. BEL 135 87
    008 08 متخصص. لیسانس 136 88
    009 09 متخصص. TAB 137 89
    010 0Aمتخصص. LF 138 8AЉ
    011 0Bمتخصص. VT 139 8B‹ ‹
    012 0Cمتخصص. FF 140 8CЊ
    013 0Dمتخصص. CR 141 8DЌ
    014 0Eمتخصص. بنابراین 142 8EЋ
    015 0Fمتخصص. SI 143 8FЏ
    016 10 متخصص. DLE 144 90 ђ
    017 11 متخصص. DC1 145 91
    018 12 متخصص. DC2 146 92
    019 13 متخصص. DC3 147 93
    020 14 متخصص. DC4 148 94
    021 15 متخصص. NAK 149 95
    022 16 متخصص. SYN 150 96
    023 17 متخصص. ETB 151 97
    024 18 متخصص. می توان 152 98
    025 19 متخصص. EM 153 99
    026 1Aمتخصص. زیر 154 9Aљ
    027 1Bمتخصص. خروج 155 9B
    028 1Cمتخصص. FS 156 9 درجه سانتیگرادњ
    029 1Dمتخصص. جی اس 157 9Dќ
    030 1Eمتخصص. RS 158 9Eћ
    031 1Fمتخصص. ایالات متحده 159 9Fџ
    032 20 کلاچ SP (فضا) 160 A0
    033 21 ! 161 A1 Ў
    034 22 " 162 A2ў
    035 23 # 163 A3Ћ
    036 24 $ 164 A4¤
    037 25 % 165 A5Ґ
    038 26 & 166 A6¦
    039 27 " 167 A7§
    040 28 ( 168 A8یو
    041 29 ) 169 A9©
    042 2A* 170 AAЄ
    043 2B+ 171 AB«
    044 2C, 172 AC¬
    045 2 بعدی- 173 آگهی­
    046 2E. 174 AE®
    047 2F/ 175 AFЇ
    048 30 0 176 B0°
    049 31 1 177 B1±
    050 32 2 178 B2І
    051 33 3 179 B3і
    052 34 4 180 B4ґ
    053 35 5 181 B5µ
    054 36 6 182 B6
    055 37 7 183 B7·
    056 38 8 184 B8یو
    057 39 9 185 B9
    058 3A: 186 BAє
    059 3B; 187 BB»
    060 3C< 188 قبل از میلاد مسیحј
    061 سه بعدی= 189 BDЅ
    062 3E> 190 بودنѕ
    063 3F? 191 bfї
    064 40 @ 192 C0 آ
    065 41 آ 193 C1 ب
    066 42 ب 194 C2 که در
    067 43 سی 195 C3 جی
    068 44 D 196 C4 D
    069 45 E 197 C5 E
    070 46 اف 198 C6 و
    071 47 جی 199 C7 ز
    072 48 اچ 200 C8 و
    073 49 من 201 C9 Y
    074 4Aجی 202 CA به
    075 4Bک 203 CB L
    076 4CL 204 CC م
    077 4 بعدیم 205 سی دی اچ
    078 4Eن 206 CE در باره
    079 4FO 207 CF پ
    080 50 پ 208 D0 آر
    081 51 س 209 D1 با
    082 52 آر 210 D2 تی
    083 53 اس 211 D3 در
    084 54 تی 212 D4 اف
    085 55 U 213 D5 ایکس
    086 56 V 214 D6 سی
    087 57 دبلیو 215 D7 اچ
    088 58 ایکس 216 D8 دبلیو
    089 59 Y 217 D9 SCH
    090 5Aز 218 DA کومرسانت
    091 5B[ 219 D.B. اس
    092 5C\ 220 دی سی ب
    093 5 بعدی] 221 DD E
    094 5E^ 222 DE YU
    095 5F_ 223 D.F. من
    096 60 ` 224 E0 آ
    097 61 آ 225 E1 ب
    098 62 ب 226 E2 V
    099 63 ج 227 E3 جی
    100 64 د 228 E4 د
    101 65 ه 229 E5 ه
    102 66 f 230 E6 و
    103 67 g 231 E7 ساعت
    104 68 ساعت 232 E8 و
    105 69 من 233 E9 هفتم
    106 6Aj 234 EA به
    107 6Bک 235 EB ل
    108 6Cل 236 اتحادیه اروپا متر
    109 6 بعدیمتر 237 ED n
    110 6En 238 EE O
    111 6Fo 239 EF پ
    112 70 پ 240 F0 آر
    113 71 q 241 F1 با
    114 72 r 242 F2 تی
    115 73 س 243 F3 در
    116 74 تی 244 F4 f
    117 75 تو 245 F5 ایکس
    118 76 v 246 F6 ج
    119 77 w 247 F7 ساعت
    120 78 ایکس 248 F8 ش
    121 79 y 249 F9 sch
    122 7Az 250 FA ب
    123 7B{ 251 فیس بوک س
    124 7C| 252 اف سی ب
    125 7D} 253 FD اوه
    126 7E~ 254 F.E. یو
    127 7Fمتخصص. DEL 255 FF من
    جدول اسکی کدهای کاراکتر ویندوز.
    شرح کاراکترهای ویژه (کنترلی) لازم به ذکر است که در ابتدا از کاراکترهای کنترلی جدول ASCII برای ارائه تبادل داده از طریق تله تایپ، ورودی داده از نوار پانچ شده و برای ساده ترین کنترل دستگاه های خارجی استفاده می شد.
    در حال حاضر، بیشتر کاراکترهای کنترل ASCII جدول دیگر این بار را تحمل نمی کنند و می توان از آنها برای اهداف دیگر استفاده کرد. توضیحات کد
    NUL، 00پوچ، خالی
    SO-01شروع سرفصل
    STX 02شروع TeXt، ابتدای متن.
    ETX 03پایان متن
    EOT، 04پایان انتقال
    ENQ، 05جویا شدن. لطفا تایید کنید
    ACK، 06تصدیق. من تایید میکنم
    B.E.L. 07زنگ، زنگ بزن
    B.S. 08Backspace، یک کاراکتر به عقب برگردید
    TAB, 09زبانه، زبانه افقی
    LF، 0Aتغذیه خط، خوراک خط.
    اکنون در اکثر زبان های برنامه نویسی با \n نشان داده می شود
    VT، 0Bبرگه عمودی، جدول بندی عمودی.
    FF، 0Cفید فرم، فید صفحه، صفحه جدید
    CR، 0Dبرگشت محموله
    اکنون در اکثر زبان های برنامه نویسی با \r نشان داده می شود
    SO، 0EShift Out، رنگ نوار جوهر چاپگر را تغییر دهید
    SI، 0FShift In، رنگ نوار جوهر موجود در دستگاه چاپ را به عقب برگردانید
    DLE، 10Data Link Escape، تغییر کانال به انتقال داده
    DC1، ​​11
    DC2، 12
    DC3، 13
    DC4، 14
    کنترل دستگاه، نمادهای کنترل دستگاه
    N.A.K. 15تایید منفی، تایید نمی کنم.
    SYN، 16هماهنگ سازی. نماد همگام سازی
    ETB، 17پایان بلوک متن، پایان بلوک متنی
    CAN، 18لغو، لغو تایید قبلی
    EM، 19پایان متوسط
    SUB، 1Aجانشین، جانشین. به جای شخصیتی قرار می گیرد که ارزش آن در حین انتقال از بین رفته یا خراب شده است
    ESC، 1Bدنباله فرار فرار
    FS، 1Cجداکننده فایل، جداکننده فایل
    GS، 1Dجداکننده گروه، جداکننده گروه
    RS، 1Eجداکننده رکورد
    ایالات متحده، 1Fجداکننده واحد، جداکننده واحد
    DEL, 7Fحذف کنید، آخرین کاراکتر را حذف کنید.

    اکسل برای آفیس 365 ورد برای آفیس 365 Outlook برای آفیس 365 پاورپوینت برای آفیس 365 ناشر برای آفیس 365 اکسل 2019 ورد 2019 Outlook 2019 پاورپوینت 2019 OneNote 2016 ناشر 2019 Visio Outlook 2019 Visio Professional 612019 ورد 620120 ok 2016 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 PowerPoint 2013 ورد201201 10 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 2007 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standards 2010 Visio Standards 2010 Visio

    در این مقاله درج یک کاراکتر ASCII یا Unicode در یک سند

    اگر فقط نیاز به وارد کردن چند کاراکتر یا نماد خاص دارید، می توانید از میانبرهای صفحه کلید استفاده کنید. برای فهرستی از کاراکترهای ASCII، به جداول زیر یا مقاله درج الفبای ملی با استفاده از میانبرهای صفحه کلید مراجعه کنید.

    یادداشت:

    درج کاراکترهای ASCII

    برای درج یک نویسه ASCII، کلید ALT را فشار داده و در حین وارد کردن کد کاراکتر نگه دارید. به عنوان مثال، برای درج نماد درجه (º)، کلید ALT را فشار داده و نگه دارید، سپس 0176 را در صفحه کلید عددی وارد کنید.

    از صفحه کلید عددی برای وارد کردن اعداد استفاده کنید، نه اعداد روی صفحه کلید اصلی. اگر نیاز به وارد کردن اعداد روی صفحه کلید عددی دارید، مطمئن شوید که نشانگر NUM LOCK روشن است.

    درج کاراکترهای یونیکد

    برای درج یک کاراکتر یونیکد، کد کاراکتر را تایپ کنید، سپس ALT + X را به ترتیب فشار دهید. به عنوان مثال، برای درج یک کاراکتر دلاری ($)، 0024 را تایپ کنید و ALT + X را به ترتیب فشار دهید. برای همه کدهای کاراکتر یونیکد، نگاه کنید.

    مهم: برخی از برنامه‌های مایکروسافت آفیس، مانند PowerPoint و InfoPath، از تبدیل کدهای یونیکد به نویسه پشتیبانی نمی‌کنند. اگر نیاز به درج یک کاراکتر یونیکد در یکی از این برنامه ها دارید، از .

    یادداشت:

      اگر بعد از فشار دادن ALT+X یک کاراکتر یونیکد نادرست نمایش داده شد، کد صحیح را انتخاب کنید و سپس دوباره ALT+X را فشار دهید.

      علاوه بر این، قبل از کد باید "U+" را وارد کنید. به عنوان مثال، با تایپ کردن "1U+B5" و فشار دادن ALT+X، متن "1µ" نمایش داده می شود، در حالی که با تایپ "1B5" و فشار دادن ALT+X، کاراکتر "Ƶ" نمایش داده می شود.

    با استفاده از جدول نمادها

    جدول کاراکترها برنامه ای است که در ویندوز مایکروسافت تعبیه شده است که به شما امکان می دهد کاراکترهای موجود برای یک فونت انتخاب شده را مشاهده کنید.

    با استفاده از جدول نمادها، می توانید کاراکترهای جداگانه یا گروهی از کاراکترها را در کلیپ بورد کپی کرده و آنها را در هر برنامه ای که از نمایش این کاراکترها پشتیبانی می کند، قرار دهید. باز کردن جدول نمادها

      در ویندوز 10 "symbol" را در کادر جستجو در نوار وظیفه تایپ کنید و جدول نمادها را از نتایج جستجو انتخاب کنید.

      در ویندوز 8 کلمه "symbol" را در صفحه شروع تایپ کنید و جدول نمادها را از نتایج جستجو انتخاب کنید.

      در ویندوز 7 روی دکمه Start کلیک کنید، All Programs, Accessories, System Tools را انتخاب کنید و Character Map را کلیک کنید.

    کاراکترها بر اساس فونت گروه بندی می شوند. برای انتخاب مجموعه کاراکتر مناسب، روی لیست فونت کلیک کنید. برای انتخاب یک نماد، روی آن کلیک کنید، سپس روی دکمه انتخاب کلیک کنید. برای درج نماد، روی محل مورد نظر در سند کلیک راست کرده و Paste را انتخاب کنید.

    کدهای کاراکتر پرکاربرد

    برای فهرست کامل نویسه‌ها، در رایانه، جدول کد نویسه‌های ASCII یا جدول‌های کاراکتر یونیکد مرتب‌شده بر اساس مجموعه‌ها را ببینید.

    گلیف

    گلیف

    واحدهای پولی

    نمادهای قانونی

    نمادهای ریاضی

    کسری

    علائم نگارشی و گویش

    نمادهای شکل

    کدهایی برای دیاکریتیک های رایج

    برای فهرست کامل حروف و کدهای مربوطه، نگاه کنید.

    گلیف

    گلیف

    کاراکترهای کنترلی ASCII غیرچاپی

    کاراکترهای مورد استفاده برای کنترل برخی از لوازم جانبی مانند چاپگرها در جدول ASCII 0-31 شماره گذاری شده اند. به عنوان مثال، کاراکتر صفحه خوراک/صفحه جدید با عدد 12 مطابقت دارد. این کاراکتر به چاپگر می گوید که به ابتدای صفحه بعدی برود.

    جدول کاراکترهای کنترل غیرقابل چاپ ASCII

    عدد اعشاری

    امضا کردن

    عدد اعشاری

    امضا کردن

    انتشار کانال داده

    شروع هدر

    اولین کد کنترل دستگاه

    شروع متن

    کد دوم کنترل دستگاه

    انتهای متن

    کد کنترل دستگاه سوم

    پایان انتقال

    کد کنترل دستگاه چهارم

    پنج نقطه ای

    تایید منفی

    تائیدیه

    حالت انتقال همزمان

    سیگنال صوتی

    پایان بلوک داده

    زبانه افقی

    پایان رسانه

    تغذیه خط/خط جدید

    شخصیت جایگزین

    زبانه عمودی

    تجاوز

    ترجمه صفحه/صفحه جدید

    دوازده

    جداکننده فایل

    برگشت محموله

    جداکننده گروه

    تغییر بدون ذخیره ارقام

    جداکننده رکورد

    تغییر حفظ بیت

    پانزده

    جداکننده داده ها