• هنگام بایگانی، میزان فشرده سازی فایل به آن بستگی دارد. چه چیزی درجه فشرده سازی فایل را تعیین می کند؟ مفهوم و جنبه های اصلی. تعیین قابلیت فشرده سازی فایل ها با فرمت های مختلف

    اکثر کاربران می‌دانند که گاهی اوقات از فشرده‌سازی برای کاهش اندازه فایل‌های منبع استفاده می‌شود تا ذخیره یا ارسال آن‌ها آسان‌تر شود، مانند ایمیل. با این حال، به دلایلی، در این مورد، ارتباط فقط با برنامه های بایگانی اتفاق می افتد و سایر روش های فشرده سازی داده ها در نظر گرفته نمی شوند. در مرحله بعد، با استفاده از چند مورد از رایج ترین موقعیت ها به عنوان مثال، میزان فشرده سازی فایل به چه چیزی بستگی دارد.

    منظور از نسبت فشرده سازی یک فایل چیست؟

    بیایید با سوالات تئوری شروع کنیم. نسبت فشرده سازی یک فایل چقدر است؟ بر اساس ساده ترین تفاسیر این اصطلاح، به معنای نسبت اندازه جسم نهایی (فشرده) به حجم اولیه است. با این حال، چنین توضیحی ممکن است بیشتر به طور انحصاری در مورد داده های بایگانی شده اعمال شود، زیرا به هیچ وجه به برخی از مسائل مربوط به تغییر فرمت چند رسانه ای نمی پردازد، جایی که فشرده سازی نیز بسیار رایج است. به طور کلی نمی توان گفت که میزان فشرده سازی فایل تنها به یک ویژگی بستگی دارد. در این حالت، نوع شی و برنامه های مورد استفاده برای فشرده سازی داده ها و سرعت فرآیند فشرده سازی نقش دارد. در ادامه، به طور خلاصه به برخی از جنبه های مهمی که ممکن است بر نتیجه نهایی کاهش اندازه داده های اولیه تأثیر بگذارد، می پردازیم.

    میزان فشرده سازی فایل فقط به نوع فایل بستگی دارد: آیا واقعا اینطور است؟

    بله، در واقع، نوع داده های فشرده شده تأثیر نسبتا زیادی در کاهش اندازه نهایی فایل دارد و همه فرمت ها را نمی توان تحت چنین رویه هایی قرار داد. این را می توان با مثال فایل های صوتی توضیح داد که در ابتدا توسط خودشان فشرده می شوند.

    هنگام تلاش برای بسته بندی چنین داده هایی در یک آرشیو، دستیابی به کاهش قابل توجه در اندازه تقریبا غیرممکن است. در مورد فرمت WAV هم همینطور. با این حال، اگر فشرده نکنید، اما از WAV به MP3 تبدیل کنید، اندازه را می توان ده برابر یا بیشتر کاهش داد. بسیاری از کاربران بلافاصله از این واقعیت شروع می کنند که میزان فشرده سازی فایل به فرمت اولیه و نهایی بستگی دارد. این کاملا درست نیست، زیرا الگوریتم رمزگذاری مجدد اعمال شده نیز نقش مهمی ایفا می کند که به طور جداگانه مورد بحث قرار خواهد گرفت. در ضمن، بیایید روی استفاده از آرشیوها تمرکز کنیم.

    چه چیزی درجه فشرده سازی یک فایل را هنگام بسته بندی در یک آرشیو تعیین می کند؟

    برای درک اولیه ماهیت این نوع فشرده سازی، برای سادگی توضیح، اجازه دهید رایج ترین بایگانی کننده WinRAR را به عنوان مثال در نظر بگیریم. ما به انواع داده هایی که قرار است بسته بندی شوند دست نخواهیم داد، اما روی ابزارهای خود برنامه تمرکز خواهیم کرد.

    برای شروع باید به فرمت نهایی آرشیو و همچنین روش بسته بندی استفاده شده توجه کنید. واضح است که در این مورد میزان فشرده سازی فایل توسط برنامه بایگانی به تکنیک ترجیحی بستگی دارد. با روش سریع، فشرده سازی حداقل خواهد بود، اما با حداکثر نسبت فشرده سازی، اندازه به میزان قابل توجهی کاهش می یابد و زمان طولانی تر می شود.

    اگر در رابطه با بایگانی‌ها، فرمت‌های فایل را در نظر بگیریم، اسناد متنی با هر قالبی را می‌توان از فشرده‌ترین آنها تشخیص داد.

    برخی از فایل های اجرایی با فرمت EXE نسبتاً خوب فشرده می شوند (با روش فشرده سازی استاندارد، اندازه را می توان بیش از نصف کاهش داد). تراکم ناپذیرترین، همانطور که قبلا ذکر شد، اشیاء چند رسانه ای هستند. و اگر بتوان به نحوی حجم تصاویر را کاهش داد، چنین اقداماتی با صدا و تصویر بدون تغییر فرمت اولیه کار نمی کند و بایگانی کننده ها مطلقاً ربطی به آن ندارند.

    انواع گرافیک، فشرده سازی ویدئو و صدا

    در رابطه با چند رسانه ای، دو نوع فشرده سازی اصلی وجود دارد: با اتلاف و بدون اتلاف. و در این مورد، میزان فشرده سازی فایل به فناوری فشرده سازی مورد استفاده بستگی دارد.

    در حالت اول، فشرده سازی حداکثر است، در حالت دوم می تواند متفاوت باشد، که تحت تأثیر مجموعه کدک های مورد استفاده و فرمت نهایی ظرف قرار می گیرد. بنابراین، به عنوان مثال، یک فایل AVI یکسان می تواند دقیقاً یک محفظه حاوی داده هایی از انواع کاملاً متفاوت و با درجات مختلف فشرده سازی باشد. به همین دلیل، اتفاقا، گاهی اوقات ممکن است مشکلاتی در پخش ویدیو در پخش کننده های خانگی وجود داشته باشد.

    به طور کلی، اگر به طور خاص در مورد چند رسانه ای صحبت کنیم، باید به وضوح درک کنید که با وجود فناوری حذف محتوای اضافی، دستیابی به حداکثر کاهش اندازه فایل منبع با هر فرمتی بدون افت قابل توجه کیفیت، تقریبا غیرممکن است. (به عنوان مثال، برای گرافیک یا ویدئو، این فقط در مورد صحنه های تغییرناپذیر کار می کند). در مورد صدا، بیت ریت کاهش می یابد و فرکانس های خاصی قطع می شود. یک کاربر معمولی ممکن است تفاوت را احساس نکند، اما یک متخصص با گوش ظریف فوراً به شما خواهد گفت که چه چیزی کم است.

    رایج ترین برنامه ها برای همه مناسبت ها

    چیزی که میزان فشرده سازی فایل را تعیین می کند، کمی مشخص شد. حال لازم است چند کلمه در مورد محصولات نرم افزاری کاربردی بیان کنیم. از رایج ترین آرشیوها می توان به WinRAR، WinZIP و 7-Zip اشاره کرد.

    در مورد فشرده‌سازی چند رسانه‌ای، در ساده‌ترین حالت، می‌توانید از برنامه‌های مبدل ویژه‌ای استفاده کنید که بر اساس اصل رمزگذاری مواد منبع به فرمت دیگری به منظور کاهش اندازه فایل کار می‌کنند.

    خلاصه ای مختصر

    با خلاصه کردن یک نتیجه عجیب، می توان اشاره کرد که میزان فشرده سازی فایل توسط بایگانی کننده به عوامل مختلفی بستگی دارد و اغلب به نوع داده فشرده شده، نرم افزار مورد استفاده و (معمولاً الگوریتم های هافمن و لمپل-زیو استفاده می شود، کار به صورت جفت). در مورد محتوای چند رسانه ای نیز وضعیت تقریباً به همین صورت است، اما جایگاه غالب تبدیل قالب از یکی به دیگری است.

    میزان فشرده سازی اطلاعات به چند دلیل بستگی دارد:

    اول اینکه نوع داده های فشرده شده اهمیت زیادی دارد. فایل های گرافیکی و متنی به بهترین وجه فشرده می شوند. برای آنها، نسبت تراکم می تواند از پنج تا چهل درصد باشد. فایل های برنامه های اجرایی، ماژول های بوت، فایل های چند رسانه ای بدتر فشرده می شوند.

    دوم اینکه روش فشرده سازی از اهمیت بالایی برخوردار است.

    ثالثاً، همچنین مهم است که از کدام بایگانی استفاده شود. هنگام انتخاب نوع بایگانی، آنها معمولاً با ملاحظات زیر هدایت می شوند: به طوری که نسبت فشرده سازی تا حد امکان بالا باشد و زمان بسته بندی و باز کردن فایل ها تا حد امکان کوتاه باشد.

    برنامه های فشرده سازی اطلاعات

    فشرده سازی با کمک برنامه های بایگانی اتفاق می افتد. تا به امروز، رایج ترین آنها چهار بایگانی هستند - WinRar، WinAce، 7Zip و WinZip. در مورد آخرین برنامه، آن را در برابر موشکافی نمی ایستد.

    بیایید نگاهی دقیق تر به بایگانی بیندازیم - WinRar این بایگانی را می توان با انواع فایل های زیر مرتبط کرد: RAR، ZIP، CAB، ARJ، LZH، ACE، 7-Zip، TAR، GZip، UUE، BZ2، JAR، ISO.

    این برنامه از فایل هایی با حجم تقریبا نامحدود (تا 8,589,934,591 گیگابایت) پشتیبانی می کند. درست است، برای کار با فایل های بزرگتر از 4 گیگابایت، باید روی سیستم فایل NTFS کار کنید.

    هنگام انتخاب تنظیمات بهینه برای فشرده سازی، چند نکته وجود دارد که باید در نظر گرفته شود:

    اگرچه WinRAR از فرمت ZIP پشتیبانی می کند، اما در اکثر موارد توصیه می شود RAR را انتخاب کنید. این سطح فشرده سازی بالاتری را فراهم می کند. اگر مطمئن نیستید که برنامه ای روی رایانه نصب می شود که بسته بندی فایل ها روی آن باز می شود، می توانید فایل ها را به ZIP فشرده کنید و با آن می توانید فایل ها را با فرمت RAR باز کنید.

    شما باید تصمیم بگیرید که کدام روش فشرده سازی بهتر است استفاده کنید. هرچه نسبت فشرده سازی بیشتر باشد، زمان بیشتری برای آرشیو کردن طول می کشد، بنابراین در اینجا باید در نظر بگیرید که داده ها برای چه اهدافی بایگانی می شوند. اگر این ذخیره سازی طولانی مدت است، البته، منطقی است که منتظر بمانید و آرشیو را با حداکثر نسبت فشرده سازی دریافت کنید، اما اگر فقط نیاز به ارسال چند سند از طریق پست دارید، نسبت فشرده سازی معمولی (عادی) برای شما مناسب است. .

    اگر به حداکثر فشرده سازی فایل نیاز دارید، از گزینه Create solid archive استفاده کنید. با این حال، معایب خود را نیز دارد. اولاً، باز کردن این فایل‌ها به زمان بیشتری نسبت به استخراج از یک آرشیو معمولی نیاز دارد. تصور کنید که دویست فایل در آرشیو خود دارید. اگر به روش معمول ایجاد شده باشد، می توانید به راحتی یکی از فایل ها را استخراج کنید. اگر از آرشیو جامد استفاده کردید، مهم است که فایل مورد نیاز شما چگونه بایگانی شود. اگر در وسط صد دوم بود، پس برای باز کردن آن، برنامه باید 150 فایل را قبل از رسیدن به آن باز کند. ایجاد آرشیو به این روش نیز می تواند زیان های زیادی را به همراه داشته باشد، زیرا در صورت خراب شدن آرشیو، تمام فایل هایی که در آن بودند را از دست خواهید داد. در مورد بسته بندی به روش معمول، می توانید از آرشیو آسیب دیده، اگر نه همه، اما بیشتر فایل ها را استخراج کنید.

    اگر نیاز به ایجاد یک بایگانی بزرگ دارید، ممکن است زمان زیادی طول بکشد. WinRar به شما امکان می دهد تعیین کنید که برای انجام یک کار خاص چقدر زمان لازم است. گزینه Benchmark and hardware test برای این منظور در نظر گرفته شده است. یکی دیگر از دلایل استفاده از این گزینه شناسایی خطاهای احتمالی است که ممکن است هنگام بایگانی کردن رایانه با یک پیکربندی یا پیکربندی دیگر به دلیل نقص سخت افزاری رخ دهد.

    در میان سایر تنظیمات WinRar "a، می توان به امکان ایجاد آرشیوهای خود استخراج شونده با نشان دادن مسیر باز کردن بسته بندی اشاره کرد. چنین فایل هایی نیازی به برنامه بایگانی بر روی رایانه ای که قرار است از حالت فشرده خارج شوند، ندارند. چنین بایگانی هایی عبارتند از: SFX-archives نامیده می شوند و نقطه ضعف آنها در مقایسه با فایل های بایگانی معمولی اندازه بزرگتر است، زیرا آنها علاوه بر فایل های بسته بندی شده واقعی، حاوی ماژول اجرایی EXE نیز هستند.

    محتویات یک آرشیو RAR را می توان نامرئی کرد. برای انجام این کار، در تنظیمات برنامه، در پنجره Archiving with Password، باید کادر کنار خط Encrypt File Names را علامت بزنید.

    همچنین می توانید برای باز کردن آرشیو رمز عبور تعیین کنید. در نتیجه خطا در انتقال آرشیو از طریق یک شبکه محلی یا دانلود آن از اینترنت و همچنین به دلیل نقص سخت افزار یا حمله ویروس، ممکن است آرشیو آسیب ببیند. WinRar به شما این امکان را می دهد که با آزمایش آرشیو با استفاده از گزینه Test Archived Files، صحت داده ها را تعیین کنید.

    برای به حداقل رساندن احتمال از دست رفتن داده ها، توصیه می شود هنگام ایجاد بایگانی های WinRar از گزینه Put Recovery Record استفاده کنید (این چک باکس را می توانید در تب General در پنجره ایجاد بایگانی پیدا کنید).

    اگر این کار انجام شده باشد، در صورت آسیب به آرشیو، می توان آن را بازیابی کرد.

    علاوه بر این، در WinRar، می توانید با تعیین اندازه اطلاعاتی که باید هنگام ایجاد آن بازیابی شوند، احتمال آسیب به آرشیو RAR را کاهش دهید. برای این کار باید دستور Commands > Protect Archive From Damage را در پنجره Winrar اجرا کنید. در عین حال، حجم Recovery Record نمی تواند از ده درصد حجم کل آرشیو تجاوز کند.

    برای تعمیر آرشیوهای خراب RAR، فایل مورد نیاز را در پنجره WinRar انتخاب کنید و دستور Tools > Repair را اجرا کنید.

    WinRAR را می توان در منوی زمینه تعبیه کرد و نه تنها از منوی Explorer، بلکه از برنامه های دیگر مانند مدیر فایل محبوب Total Commander نیز پشتیبانی می کند. این باعث می شود تا با استفاده از تنظیمات پیش فرض و بدون باز کردن پنجره برنامه، به سرعت فایل ها را بایگانی کنید. به هر حال، تنظیمات پیش فرض را می توان مطابق با الزاماتی که در بایگانی خود قرار می دهید تغییر داد. می توانید این کار را با باز کردن پنجره WinRar و اجرای دستور Options > Settings انجام دهید. در این پنجره به تب Compression رفته و روی دکمه Create Default کلیک کنید. تنظیمات مشخص شده در این پنجره برای بایگانی سریع استفاده می شود. اگر نیاز به تغییر تنظیمات بایگانی دارید، این کار را می توان با استفاده از منوی زمینه نیز انجام داد. برای انجام این کار، دستور Add to Archive… را انتخاب کنید.در اینجا می توانید فرمت و نسبت فشرده سازی را تنظیم کنید، نام بایگانی را مشخص کنید و سایر گزینه های بایگانی را انتخاب کنید.

    WinRar به شما امکان می دهد تنظیمات تعریف شده توسط کاربر را در فایلی با پسوند Reg ذخیره کنید. بعداً می توان این فایل را برای استفاده مجدد از پیکربندی داده شده به برنامه وارد کرد. این فایل اطلاعاتی مانند تاریخچه آرشیوهایی که اخیرا ایجاد شده اند، تنظیمات فشرده سازی پیش فرض و غیره را ذخیره می کند.

    یکی دیگر از گزینه های مفید Winrar، توانایی ایجاد نشانک های خود - Favorities است. اغلب اوقات لازم است که به طور منظم از همان پوشه ها در هارد دیسک خود نسخه پشتیبان تهیه کنید. با بوکمارک کردن اطلاعات مربوط به محل این پوشه ها، می توانید به سرعت در پنجره برنامه به سراغ آنها رفته و از فایل ها و زیرشاخه های لازم نسخه پشتیبان تهیه کنید.

    بخش اول - تاریخی.

    معرفی

    الگوریتم‌های فشرده‌سازی داده‌های موجود را می‌توان به دو کلاس بزرگ تقسیم کرد - با اتلاف و بدون تلفات. الگوریتم های Lossy معمولا برای فشرده سازی تصاویر و صدا استفاده می شوند. این الگوریتم‌ها اجازه می‌دهند تا نسبت‌های فشرده‌سازی بالا از طریق از دست دادن انتخابی کیفیت به دست آید. با این حال، طبق تعریف، امکان بازیابی داده های اصلی از یک نتیجه فشرده وجود ندارد.
    الگوریتم‌های فشرده‌سازی بدون تلفات برای کاهش حجم داده‌ها استفاده می‌شوند و به گونه‌ای کار می‌کنند که امکان بازیابی داده‌ها دقیقاً به همان صورت قبل از فشرده‌سازی وجود دارد. آنها در ارتباطات، آرشیوها و برخی الگوریتم ها برای فشرده سازی اطلاعات صوتی و گرافیکی استفاده می شوند. در ادامه، فقط الگوریتم های فشرده سازی بدون تلفات را در نظر خواهیم گرفت.
    اصل اساسی الگوریتم های فشرده سازی بر این واقعیت استوار است که در هر فایلی که حاوی داده های غیر تصادفی باشد، اطلاعات تا حدی تکرار می شود. با استفاده از مدل های آماری ریاضی، می توانید احتمال تکرار ترکیب خاصی از کاراکترها را تعیین کنید. سپس می توانید کدهایی را برای عبارات انتخاب شده ایجاد کنید و کوتاه ترین کدها را به عباراتی که اغلب تکرار می شوند اختصاص دهید. برای این، تکنیک های مختلفی استفاده می شود، به عنوان مثال: کدگذاری آنتروپی، کدگذاری تکرار، و فشرده سازی فرهنگ لغت. با کمک آنها، یک کاراکتر 8 بیتی یا یک رشته کامل را می توان تنها با چند بیت جایگزین کرد و در نتیجه اطلاعات اضافی را حذف کرد.

    داستان

    سلسله مراتب الگوریتم ها:

    اگرچه فشرده‌سازی داده‌ها با اینترنت و پس از اختراع الگوریتم‌ها توسط Lempel و Ziv (الگوریتم‌های LZ) فراگیر شد، چند نمونه قبلی از فشرده‌سازی را می‌توان ذکر کرد. مورس با اختراع کد خود در سال 1838، متداول‌ترین حروف در زبان انگلیسی، "e" و "t" را که کوتاه‌ترین دنباله‌ها (به ترتیب نقطه و خط تیره) هستند را عاقلانه اختصاص داد. اندکی پس از ظهور مین فریم ها در سال 1949، الگوریتم شانون-فانو اختراع شد که کدهایی را به کاراکترهای یک بلوک داده بر اساس احتمال وقوع آنها در بلوک اختصاص می داد. احتمال ظاهر شدن یک کاراکتر در یک بلوک با طول کد نسبت معکوس داشت که امکان فشرده سازی نمایش داده ها را فراهم می کرد.
    دیوید هافمن دانش آموز کلاس رابرت فانو بود و تصمیم گرفت به عنوان بخشی از مطالعه خود به دنبال روش بهبود یافته کدگذاری داده های باینری باشد. در نتیجه، او موفق شد الگوریتم شانون-فانو را بهبود بخشد.
    نسخه های اولیه الگوریتم های شانون-فانو و هافمن از کدهای از پیش تعریف شده استفاده می کردند. بعداً، این شروع به استفاده از کدهای ایجاد شده به صورت پویا بر اساس داده های در نظر گرفته شده برای فشرده سازی کرد. در سال 1977، Lempel و Ziv الگوریتم LZ77 خود را بر اساس استفاده از یک فرهنگ لغت ایجاد شده به صورت پویا (که "پنجره کشویی" نیز نامیده می شود) منتشر کردند. در سال 78 آنها الگوریتم LZ78 را منتشر کردند که ابتدا داده ها را تجزیه می کند و به جای ایجاد پویا یک فرهنگ لغت ایجاد می کند.

    مسائل حقوقی

    الگوریتم های LZ77 و LZ78 محبوبیت زیادی به دست آوردند و موجی از بهبود دهنده ها را به وجود آوردند که DEFLATE، LZMA و LZX تا به امروز زنده مانده اند. بیشتر الگوریتم‌های محبوب مبتنی بر LZ77 هستند، زیرا LZW، مشتق شده از LZ78، توسط Unisys در سال 1984 ثبت اختراع شد و پس از آن شروع به ترول کردن همه افراد، حتی تصاویر GIF کردند. در این زمان، گونه ای از الگوریتم LZW به نام LZC در یونیکس مورد استفاده قرار گرفت و به دلیل مشکلات مجوز، استفاده از آنها باید حذف می شد. اولویت به الگوریتم DEFLATE (gzip) و تبدیل Burrows-Wheeler، BWT (bzip2) داده شد. که برای بهترین بود، زیرا این الگوریتم ها تقریباً همیشه از LZW در فشرده سازی بهتر عمل می کنند.
    تا سال 2003، حق ثبت اختراع منقضی شده بود، اما قطار قبلاً ترک کرده بود و الگوریتم LZW، شاید فقط در فایل‌های GIF حفظ شد. الگوریتم های مبتنی بر LZ77 غالب هستند.
    در سال 1993، زمانی که Stac Electronics متوجه شد که الگوریتم LZS آن توسط مایکروسافت در برنامه فشرده‌سازی دیسک همراه با MS-DOS 6.0 استفاده می‌شود، نبرد دیگری برای ثبت اختراع رخ داد. Stac Electronics شکایت کرد و آنها برنده این پرونده شدند که نتیجه آن بیش از 100 میلیون دلار بود.

    محبوبیت روزافزون Deflate

    شرکت های بزرگ از الگوریتم های فشرده سازی برای ذخیره مقادیر روزافزون داده استفاده می کردند، اما گسترش واقعی الگوریتم ها با تولد اینترنت در اواخر دهه 80 اتفاق افتاد. پهنای باند کانال ها بسیار باریک بود. برای فشرده سازی داده های ارسال شده از طریق شبکه، فرمت های ZIP، GIF و PNG اختراع شد.
    تام هندرسون اولین بایگانی موفق تجاری ARC را در سال 1985 (System Enhancement Associates) اختراع و منتشر کرد. ARC در بین کاربران BBS محبوب بوده است زیرا او یکی از اولین کسانی بود که توانست چندین فایل را در یک آرشیو فشرده کند، علاوه بر این، کدهای منبع او باز بودند. ARC از الگوریتم LZW اصلاح شده استفاده کرد.
    فیل کاتز، با الهام از محبوبیت ARC، برنامه اشتراک‌افزار PKARC را منتشر کرد که در آن الگوریتم‌های فشرده‌سازی را با بازنویسی آنها در اسمبلر بهبود بخشید. با این حال هندرسون او را مجرم شناخته و مجرم شناخته شد. PKARC ARC را چنان آشکارا کپی می کرد که گاهی اوقات حتی در نظرات کد منبع اشتباهات املایی وجود داشت.
    اما فیل کاتز سر خود را از دست نداد و در سال 1989 بایگانی را به شدت تغییر داد و PKZIP را منتشر کرد. پس از اینکه قبلاً در ارتباط با پتنت الگوریتم LZW مورد حمله قرار گرفت، او همچنین الگوریتم اصلی را به الگوریتم جدیدی به نام IMPLODE تغییر داد. این فرمت در سال 1993 با انتشار PKZIP 2.0 دوباره جایگزین شد و DEFLATE جایگزین آن شد. از جمله ویژگی های جدید، عملکرد تقسیم آرشیو به حجم بود. این نسخه با وجود قدمت بسیار زیاد هنوز هم به طور گسترده مورد استفاده قرار می گیرد.
    فرمت تصویر GIF (Graphics Interchange Format) توسط CompuServe در سال 1987 ایجاد شد. همانطور که می دانید، این فرمت از فشرده سازی تصویر بدون اتلاف پشتیبانی می کند و به یک پالت 256 رنگ محدود می شود. با وجود تمام تلاش های Unisys، او نتوانست جلوی گسترش این قالب را بگیرد. امروزه نیز محبوب است، به خصوص به دلیل پشتیبانی از انیمیشن.
    CompuServe که کمی به دلیل مشکلات ثبت اختراع آشفته شده بود، فرمت گرافیک شبکه قابل حمل (PNG) را در سال 1994 منتشر کرد. مانند ZIP، از الگوریتم فانتزی جدید DEFLATE استفاده کرد. اگرچه DEFLATE توسط کاتز ثبت شده بود، او هیچ ادعایی نداشت.
    اکنون محبوب ترین الگوریتم فشرده سازی است. علاوه بر PNG و ZIP، در gzip، HTTP، SSL و سایر فناوری های انتقال داده استفاده می شود.

    متأسفانه، فیل کاتز برای دیدن پیروزی DEFLATE زنده نماند، او در سال 2000 در سن 37 سالگی بر اثر اعتیاد به الکل درگذشت. شهروندان - مصرف زیاد الکل برای سلامتی شما خطرناک است! شما ممکن است زنده نمانید تا پیروزی خود را ببینید!

    آرشیوهای مدرن

    ZIP تا اواسط دهه 90 سلطنت کرد، اما در سال 1993، یک نابغه ساده روسی، اوگنی روشال، قالب و الگوریتم RAR خود را ارائه کرد. آخرین نسخه های آن بر اساس الگوریتم های PPM و LZSS است. اکنون ZIP شاید رایج ترین فرمت باشد، RAR تا همین اواخر استانداردی برای توزیع محتوای غیرقانونی مختلف از طریق اینترنت بود (به دلیل افزایش پهنای باند، فایل ها به طور فزاینده ای بدون بایگانی توزیع می شوند) و 7zip به عنوان فرمت با بهترین فشرده سازی در زمان قابل قبول در دنیای یونیکس، یک دسته tar + gzip استفاده می شود (gzip یک بایگانی کننده است و tar چندین فایل را در یک فایل ترکیب می کند، زیرا gzip نمی داند چگونه این کار را انجام دهد).

    توجه داشته باشید. ترجمهشخصاً علاوه بر موارد ذکر شده، با آرشیو ARJ (بایگانی شده توسط رابرت یونگ) نیز برخورد کردم که در دهه 90 در دوره BBS محبوب بود. از آرشیوهای چند جلدی پشتیبانی می کرد و مانند RAR بعد از آن، برای توزیع بازی ها و سایر ورزها استفاده می شد. همچنین آرشیو HA توسط هری هیرولا وجود داشت که از فشرده‌سازی HSC استفاده می‌کرد (توضیح واضحی پیدا نکرد - فقط «مدل بافت محدود و کدگذاری حسابی»)، که کار خوبی برای فشرده‌سازی فایل‌های متنی طولانی داشت.

    در سال 1996، یک نسخه منبع باز از الگوریتم BWT، bzip2، ظاهر شد و به سرعت محبوبیت یافت. در سال 1999، برنامه 7-zip با فرمت 7z ظاهر شد. از نظر فشرده سازی با RAR رقابت می کند، مزیت آن باز بودن و همچنین امکان انتخاب بین الگوریتم های bzip2، LZMA، LZMA2 و PPMd است.
    در سال 2002، بایگانی دیگری به نام PAQ ظاهر شد. نویسنده مت ماهون از نسخه بهبود یافته الگوریتم PPM با استفاده از تکنیکی به نام ترکیب متن استفاده کرد. این اجازه می دهد تا بیش از یک مدل آماری برای بهبود پیش بینی با فرکانس نماد استفاده شود.

    آینده الگوریتم های فشرده سازی

    البته خدا میدونه ولی ظاهرا الگوریتم PAQ به خاطر نسبت تراکم خیلی خوبش (البته خیلی کند عمل میکنه) داره محبوب میشه. اما به دلیل افزایش سرعت کامپیوترها، سرعت کار کمتر بحرانی می شود.
    از سوی دیگر، الگوریتم Lempel-Ziv-Markov LZMA یک مبادله بین سرعت و نسبت تراکم است و می تواند منجر به پیامدهای جالب بسیاری شود.
    یکی دیگر از فناوری های جالب «شمارش رشته های فرعی» یا CSE است که هنوز در برنامه ها کم استفاده می شود.

    در قسمت بعدی به جنبه فنی الگوریتم های مذکور و اصول عملکرد آنها خواهیم پرداخت.

    همه الگوریتم‌های فشرده‌سازی بر روی جریان اطلاعات ورودی کار می‌کنند تا با استفاده از نوعی تبدیل، جریان خروجی فشرده‌تری به دست آورند. مشخصات فنی اصلی فرآیندهای فشرده سازی و نتایج کار آنها عبارتند از:

    · درجه فشرده سازی - رابطه حجم جریان های اولیه و حاصل.

    · نرخ فشرده سازی - زمان صرف شده برای فشرده سازی مقدار معینی از اطلاعات در جریان ورودی، تا زمانی که یک جریان خروجی معادل از آن به دست آید.

    · کیفیت فشرده سازی - مقداری که نشان می دهد جریان خروجی در هنگام فشرده سازی مجدد آن با استفاده از همان الگوریتم یا الگوریتم دیگری چقدر پر شده است.

    الگوریتم هایی که افزونگی ثبت داده ها را حذف می کنند، الگوریتم های فشرده سازی داده ها یا الگوریتم های آرشیو نامیده می شوند. در حال حاضر، تعداد زیادی برنامه فشرده سازی داده ها بر اساس چندین روش اساسی وجود دارد.

    همه الگوریتم های فشرده سازی داده ها به دو دسته تقسیم می شوند:

    ) الگوریتم‌های فشرده‌سازی بدون تلفات که هنگام استفاده از آن‌ها داده‌های انتهای گیرنده بدون کوچک‌ترین تغییری بازیابی می‌شوند.

    ) الگوریتم‌های فشرده‌سازی با تلفات که اطلاعاتی را از جریان داده حذف می‌کنند که تأثیر کمی بر ماهیت داده‌ها دارد یا عموماً برای شخص غیرقابل درک است.

    دو روش اصلی بایگانی بدون ضرر وجود دارد:

    الگوریتم هافمن (eng. Huffman)، متمرکز بر فشرده سازی توالی بایت هایی که به هم مرتبط نیستند،

    الگوریتم Lempel-Ziv (eng. Lempel، Ziv)، بر فشرده سازی هر نوع متنی متمرکز شده است، یعنی با استفاده از واقعیت تکرار مکرر "کلمات" - دنباله ای از بایت ها.

    تقریباً همه برنامه‌های بایگانی بدون ضرر (ARJ، RAR، ZIP و غیره) از ترکیبی از این دو روش استفاده می‌کنند - الگوریتم LZH.

    الگوریتم هافمن

    این الگوریتم مبتنی بر این واقعیت است که برخی از کاراکترهای مجموعه استاندارد 256 کاراکتری در متن آزاد ممکن است بیشتر از میانگین دوره تکرار رخ دهند، در حالی که برخی دیگر به ترتیب کمتر. بنابراین، اگر $+o کاراکترهای معمولی را با استفاده از دنباله‌های کوتاه بیت‌هایی با طول کمتر از 8، و طولانی‌ها برای ضبط کاراکترهای کمیاب ضبط کند، حجم کل فایل کاهش می‌یابد.

    الگوریتم Lempel-Ziv. الگوریتم کلاسیک Lempel-Ziv -LZ77 که پس از سال انتشار آن نامگذاری شده است، بسیار ساده است. به صورت زیر فرموله می شود: اگر یک توالی مشابه از بایت ها قبلاً در جریان خروجی گذشته مواجه شده باشد و رکورد طول و آفست آن از موقعیت فعلی کوتاهتر از خود این دنباله باشد، پیوند (افست، طول) روی فایل خروجی نوشته می شود و نه خود توالی.

    4. نسبت فشرده سازی فایل

    فشرده‌سازی اطلاعات در فایل‌های آرشیو با حذف افزونگی به روش‌های مختلف انجام می‌شود، به عنوان مثال، با ساده‌سازی کدها، حذف بیت‌های ثابت از آن‌ها، یا نمایش کاراکترهای تکرار شونده یا یک دنباله تکراری از کاراکترها در قالب یک ضریب تکرار و کاراکترهای متناظر. الگوریتم هایی برای فشرده سازی چنین اطلاعاتی در برنامه های بایگانی ویژه (معروف ترین آنها arj / arjfolder، pkzip / pkunzip / winzip، rar / winrar) پیاده سازی شده است. یک فرم فشرده در به اصطلاح فایل یا آرشیو آرشیو.

    هدف از بسته‌بندی فایل معمولاً ارائه چینش فشرده‌تر اطلاعات روی دیسک، کاهش زمان و بر این اساس، هزینه انتقال اطلاعات از طریق کانال‌های ارتباطی در شبکه‌های کامپیوتری است. بنابراین، شاخص اصلی اثربخشی یک برنامه بایگانی خاص، میزان فشرده سازی فایل است.

    درجه فشرده سازی فایل با ضریب Kc مشخص می شود که به عنوان نسبت حجم فایل فشرده Vc به حجم فایل اصلی Vo تعریف می شود که به صورت درصد بیان می شود (برخی منابع از نسبت معکوس استفاده می کنند):

    Kc=(Vc/Vo)*100%

    میزان فشرده سازی به برنامه ای که استفاده می کنید، روش فشرده سازی و نوع فایل منبع بستگی دارد.

    فایل های تصاویر گرافیکی، فایل های متنی و فایل های داده به خوبی فشرده شده اند، که نسبت فشرده سازی می تواند به 5 تا 40 درصد برسد، فایل های برنامه های اجرایی و ماژول های بار کمتر Kc = 60 - 90 درصد فشرده می شوند. فایل های آرشیو تقریباً فشرده نیستند. توضیح این امر آسان است اگر بدانید که اکثر برنامه های بایگانی از انواع الگوریتم LZ77 (Lempel-Ziv) برای فشرده سازی استفاده می کنند که ماهیت آن رمزگذاری ویژه ای از تکرار توالی بایت ها (خواندن - کاراکترها) است. فراوانی چنین تکرارهایی در متون و نمودارهای پراکنده بالاترین و در آرشیوها عملاً به صفر می رسد.

    علاوه بر این، برنامه های بایگانی هنوز در اجرای الگوریتم های فشرده سازی متفاوت هستند که بر این اساس بر میزان فشرده سازی تأثیر می گذارد.

    برخی از برنامه های آرشیو علاوه بر این شامل ابزارهایی با هدف کاهش نسبت فشرده سازی Kc هستند. بنابراین، برنامه WinRAR مکانیزم بایگانی پیوسته (جامد) را پیاده سازی می کند که با استفاده از آن می توان نسبت فشرده سازی 10 تا 50 درصد بالاتری نسبت به روش های معمولی به دست آورد، به خصوص اگر تعداد قابل توجهی از فایل های کوچک از همان نوع محتوا بسته بندی شوند.

    ویژگی های بایگانی ها کمیت های وابسته معکوس هستند. یعنی هر چه میزان تراکم بیشتر باشد نسبت تراکم کمتر است و بالعکس.

    آرشیوهای زیادی در بازار رایانه وجود دارد - هر کدام مجموعه ای از فرمت های پشتیبانی شده، جوانب مثبت و منفی، حلقه تحسین کنندگان خاص خود را دارد که قاطعانه معتقدند آرشیو مورد استفاده آنها بهترین است. ما کسی یا چیزی را منصرف نخواهیم کرد - ما به سادگی سعی می کنیم بی طرفانه محبوب ترین آرشیوها را از نظر عملکرد و کارایی ارزیابی کنیم. اینها شامل WinZip، WinRAR، WinAce، 7-Zip هستند - آنها از نظر تعداد بارگیری در سرورهای نرم افزار پیشتاز هستند. به سختی توصیه می شود که بایگانی های دیگر را در نظر بگیرید، زیرا درصد کاربرانی که از آنها استفاده می کنند (با قضاوت بر اساس تعداد بارگیری ها) اندک است.

    3. نسبت فشرده سازی فایل

    فشرده‌سازی اطلاعات در فایل‌های آرشیو با حذف افزونگی به روش‌های مختلف انجام می‌شود، به عنوان مثال، با ساده‌سازی کدها، حذف بیت‌های ثابت از آن‌ها، یا نمایش کاراکترهای تکرار شونده یا یک دنباله تکراری از کاراکترها در قالب یک ضریب تکرار و کاراکترهای متناظر. الگوریتم هایی برای فشرده سازی چنین اطلاعاتی در برنامه های آرشیو ویژه (معروف ترین آنها arj / arjfolder، pkzip / pkunzip / winzip، rar / winrar) پیاده سازی می شوند. یک فرم فشرده در به اصطلاح فایل یا آرشیو آرشیو.

    هدف از بسته‌بندی فایل معمولاً ارائه چینش فشرده‌تر اطلاعات روی دیسک، کاهش زمان و بر این اساس، هزینه انتقال اطلاعات از طریق کانال‌های ارتباطی در شبکه‌های کامپیوتری است. بنابراین، شاخص اصلی اثربخشی یک برنامه بایگانی خاص، میزان فشرده سازی فایل است.

    درجه فشرده سازی فایل با ضریب Kc مشخص می شود که به عنوان نسبت حجم فایل فشرده Vc به حجم فایل اصلی Vo تعریف می شود که به صورت درصد بیان می شود (برخی منابع از نسبت معکوس استفاده می کنند):

    Kc=(Vc/Vo)*100%

    میزان فشرده سازی به برنامه ای که استفاده می کنید، روش فشرده سازی و نوع فایل منبع بستگی دارد.

    فایل های تصاویر گرافیکی، فایل های متنی و فایل های داده به خوبی فشرده شده اند، که نسبت فشرده سازی می تواند به 5 تا 40 درصد برسد، فایل های برنامه های اجرایی و ماژول های بار کمتر Kc = 60 - 90 درصد فشرده می شوند. فایل های آرشیو تقریباً فشرده نیستند. توضیح این امر آسان است اگر بدانید که اکثر برنامه های بایگانی از انواع الگوریتم LZ77 (Lempel-Ziv) برای فشرده سازی استفاده می کنند که ماهیت آن رمزگذاری ویژه ای از تکرار توالی بایت ها (خواندن - کاراکترها) است. فراوانی چنین تکرارهایی در متون و نمودارهای پراکنده بالاترین و در آرشیوها عملاً به صفر می رسد.

    علاوه بر این، برنامه های بایگانی هنوز در اجرای الگوریتم های فشرده سازی متفاوت هستند که بر این اساس بر میزان فشرده سازی تأثیر می گذارد.

    برخی از برنامه های آرشیو علاوه بر این شامل ابزارهایی با هدف کاهش نسبت فشرده سازی Kc هستند. بنابراین، برنامه WinRAR مکانیزم بایگانی پیوسته (جامد) را پیاده سازی می کند که با استفاده از آن می توان نسبت فشرده سازی 10 تا 50 درصد بالاتری نسبت به روش های معمولی به دست آورد، به خصوص اگر تعداد قابل توجهی از فایل های کوچک از همان نوع محتوا بسته بندی شوند.

    ویژگی‌های بایگانی‌ها مقادیر معکوس وابسته هستند. یعنی هر چه میزان تراکم بیشتر باشد نسبت تراکم کمتر است و بالعکس.

    آرشیوهای زیادی در بازار رایانه وجود دارد - هر کدام مجموعه ای از فرمت های پشتیبانی شده، جوانب مثبت و منفی، حلقه تحسین کنندگان خاص خود را دارد که قاطعانه معتقدند آرشیو مورد استفاده آنها بهترین است. ما کسی یا چیزی را منصرف نخواهیم کرد - ما به سادگی سعی می کنیم بی طرفانه محبوب ترین آرشیوها را از نظر عملکرد و کارایی ارزیابی کنیم. اینها شامل WinZip، WinRAR، WinAce، 7-Zip هستند - آنها از نظر تعداد بارگیری در سرورهای نرم افزار پیشتاز هستند. به سختی توصیه می شود که بایگانی های دیگر را در نظر بگیرید، زیرا درصد کاربرانی که از آنها استفاده می کنند (با قضاوت بر اساس تعداد بارگیری ها) اندک است.

    از آنجایی که در کار، هر جفت مقدار (,) یک بار رخ می دهد، جدول همبستگی به شکل یک ماتریس هویت خواهد بود. پس میانگین شرطی همان مقادیر است. نتیجه می شود که نسبت همبستگی برابر با 1 است و بنابراین ...

    تقریب توابع با روش حداقل مربعات

    سپس تابع را با یک تابع درجه دوم تقریب می کنیم. برای تعیین ضرایب و از سیستم (3.2.1) استفاده می کنیم. با استفاده از مجموعات جدول 3 که در خانه های B29، C29، D29، E29، F29، G29 و H29 قرار دارند، سیستم (2.1.4) را در قسمت می نویسیم. فرم (3.2...

    انواع آرشیو

    تعداد زیادی روش مختلف، اصلاحات و زیرگونه های آنها برای فشرده سازی داده ها توسعه یافته است. آرشیوهای مدرن، به عنوان یک قاعده، از چندین روش به طور همزمان استفاده می کنند. تعدادی اصلی وجود دارد ...

    چگونه می توان سیستم های اطلاعاتی را بر اساس درجه اتوماسیون طبقه بندی کرد؟

    طبقه بندی فناوری اطلاعات

    فن آوری های اطلاعات را باید در درجه اول بر اساس دامنه و درجه استفاده از رایانه در آنها طبقه بندی کرد. حوزه هایی از کاربرد فناوری اطلاعات مانند علم، آموزش، فرهنگ، اقتصاد و ... وجود دارد.

    به عنوان یکی از مراحل ضروری در ایجاد یک سیستم امنیتی موثر برای قلمرو، سازمانی، OID، تجزیه و تحلیل آسیب پذیری شرکت FitMax را انجام خواهیم داد.

    اثبات ریاضی درجه آسیب پذیری موضوع فعالیت اطلاعاتی به عنوان مثال شرکت LLC "FitMax"

    برای هر یک از کانال ها، محاسبات احتمال درجه امنیت اطلاعات انجام می شود. کانال صوتی: کانال ویبروآکوستیک: عامل انسانی: بر اساس داده های دریافتی...

    ریزپردازنده: هدف، ترکیب، ویژگی های اصلی

    روش های مختلفی برای کار با فایل ها در ویندوز وجود دارد. اولین مورد "پوشه های دیسک" در پوشه "رایانه من" است. با کمک آنها می توانید به هر فایل دلخواه در هر پوشه و روی هر دیسکی دسترسی پیدا کنید. با این حال، این روش بسیار دور از ایده آل است ...

    سیستم جستجو

    1. سیستم های اطلاعات دستی با عدم وجود وسایل فنی مدرن پردازش اطلاعات و انجام کلیه عملیات توسط یک شخص مشخص می شود. به عنوان مثال در مورد فعالیت های یک مدیر در شرکتی که کامپیوتر وجود ندارد ...

    شاخص اصلی اثربخشی دستیار فروش درب، سهم بازدیدهای موثر ارائه شده توسط وی در کل حجم ترافیک مشتری مربوط به وی است - شاخص حضور موثر فروشنده ...

    محاسبه پارامترهای یک موتور الکتریکی ناهمزمان کم مصرف

    مشخصات درجه حفاظت ماشین های الکتریکی با دو حرف لاتین IP (حفاظت بین المللی) و دو عدد نشان داده شده است.

    سامانه تجارت الکترونیک و آمار فروش قطعات خودرو

    تجزیه و تحلیل تعداد بازدیدکنندگان نه تنها جدید، بلکه همچنین بازدیدکنندگان بازگشته به فروشگاه آنلاین شما بسیار مهم است. این به شما امکان می دهد تا میزان جذابیت سایت خود را برای مخاطبان هدف ارزیابی کنید. علاوه بر این، بازگشت بازدیدکنندگان همیشه راحت تر است...