• Arşivleme sırasında, dosya sıkıştırma derecesi bağlıdır. Dosya sıkıştırma derecesini ne belirler? Konsept ve ana yönler. Farklı formatlardaki dosyaların sıkıştırılabilirliğini belirleme

    Çoğu kullanıcı, kaynak dosyaların e-posta ile olduğu gibi saklanmasını veya gönderilmesini kolaylaştırmak için boyutunu küçültmek için bazen sıkıştırmanın kullanıldığını bilir. Ancak nedense bu durumda ilişkilendirme yalnızca arşivleme uygulamalarıyla gerçekleşir ve diğer veri sıkıştırma yöntemleri dikkate alınmaz. Daha sonra, örnek olarak en yaygın durumlardan birkaçını kullanarak dosya sıkıştırma derecesinin neye bağlı olduğunu ele alacağız.

    Bir dosyanın sıkıştırma oranı ile kastedilen nedir?

    Teorik sorularla başlayalım. Bir dosyanın sıkıştırma oranı nedir? Bu terimin en basit yorumlarına göre, nihai (sıkıştırılmış) nesnenin boyutunun ilk hacme oranı anlamına gelir. Bununla birlikte, bu tür bir açıklama, sıkıştırmanın da çok yaygın olduğu multimedya formatının değiştirilmesiyle ilgili bazı sorunları hiç ele almadığından, daha özel olarak arşivlenmiş verilere uygulanabilir. Genel olarak, dosya sıkıştırma derecesinin yalnızca bir özniteliğe bağlı olduğunu söylemek imkansızdır. Bu durumda, nesnenin türü, verileri sıkıştırmak için kullanılan programlar ve sıkıştırma işleminin hızı rol oynar. Ardından, ilk verilerin boyutunu küçültmenin nihai sonucunu etkileyebilecek bazı önemli hususlar üzerinde kısaca duracağız.

    Bir dosyanın sıkıştırma derecesi yalnızca dosyanın türüne bağlıdır: gerçekten öyle mi?

    Evet, aslında, sıkıştırılan veri türünün nihai dosya boyutunu küçültmede oldukça büyük bir etkisi vardır ve tüm biçimler bu tür prosedürlere tabi tutulamaz. Bu, başlangıçta kendi kendilerine sıkıştırılan ses dosyaları örneğiyle açıklanabilir.

    Bu tür verileri bir arşive paketlemeye çalışırken, boyutta önemli bir küçülme elde etmek neredeyse imkansızdır. Aynı şey WAV formatı için de geçerli. Bununla birlikte, sıkıştırmaz, ancak WAV'dan MP3'e kod dönüştürürseniz, boyut on kat veya daha fazla küçültülebilir. Birçok kullanıcı, dosya sıkıştırma derecesinin ilk ve son formata bağlı olduğu gerçeğinden hemen yola çıkar. Uygulanan yeniden kodlama algoritması da ayrı olarak tartışılacak olan önemli bir rol oynadığından, bu tamamen doğru değildir. Bu arada arşivleyicilerin kullanımına odaklanalım.

    Bir arşive paketlenirken bir dosyanın sıkıştırma derecesini ne belirler?

    Başlangıçta bu tür sıkıştırmanın özünü anlamak için, açıklamanın basit olması için, en yaygın WinRAR arşivleyicisini örnek olarak alalım. Paketlenecek veri türlerine dokunmayacağız, ancak uygulamanın araçlarına odaklanacağız.

    Başlamak için, kullanılan paketleme yönteminin yanı sıra arşivin son biçimine de dikkat etmelisiniz. Bu durumda dosyanın arşivleme programı tarafından sıkıştırılma derecesinin tercih edilen tekniğe bağlı olduğu açıktır. Hızlı yöntemle sıkıştırma minimum düzeyde olacak, ancak maksimum sıkıştırma oranıyla boyut daha önemli ölçüde küçülecek ve daha fazla zaman gerekecektir.

    Arşivleyicilerle ilgili olarak dosya formatlarını ele alırsak, herhangi bir formattaki metin belgeleri en sıkıştırılabilir olanlardan ayırt edilebilir.

    Bazı EXE biçimli yürütülebilir dosyalar nispeten iyi sıkıştırılır (standart sıkıştırma yöntemiyle boyut yarıdan fazla azaltılabilir). En sıkıştırılamaz olanı, daha önce de belirtildiği gibi, multimedya nesneleridir. Ve resimlerin boyutu bir şekilde küçültülebilirse, bu tür eylemler ses ve video ile ilk biçimi değiştirmeden çalışmaz ve arşivleyicilerin bununla kesinlikle hiçbir ilgisi yoktur.

    Grafik türleri, video ve ses sıkıştırma

    Multimedya ile ilgili olarak, iki ana sıkıştırma türü vardır: kayıplı ve kayıpsız. Ve bu durumda, dosya sıkıştırma derecesi kullanılan sıkıştırma teknolojisine bağlıdır.

    İlk durumda, sıkıştırma maksimumdur, ikinci durumda, kullanılan kodek setinden ve kabın son biçiminden etkilenen değişebilir. Bu nedenle, örneğin, bir ve aynı AVI dosyası, tamamen farklı türlerde ve farklı sıkıştırma derecelerinde verileri içeren bir kap olabilir. Bu nedenle, bu arada, bazen ev oynatıcılarında video oynatmayla ilgili sorunlar olabilir.

    Genel olarak, özellikle multimedya hakkında konuşursak, fazla içeriği kaldırma teknolojisine rağmen, herhangi bir formattaki kaynak dosyanın boyutunda önemli bir kalite kaybı olmadan maksimum küçültme elde etmenin neredeyse imkansız olduğunu açıkça anlamanız gerekir. (örneğin, grafik veya video için bu yalnızca değişmez sahnelerde çalışır). Ses durumunda, bit hızı azaltılır ve belirli frekanslar kesilir. Sıradan bir kullanıcı farkı hissetmeyebilir, ancak iyi bir kulağı olan bir profesyonel size neyin eksik olduğunu hemen söyleyecektir.

    Tüm durumlar için en yaygın programlar

    Dosyanın sıkıştırma derecesini neyin belirlediğini biraz anladım. Şimdi uygulamalı yazılım ürünleri hakkında birkaç söz söylemek gerekiyor. En yaygın arşivleyiciler arasında WinRAR, WinZIP ve 7-Zip bulunur.

    Multimedya sıkıştırmaya gelince, en basit durumda, dosya boyutunu azaltmak için kaynak materyali başka bir formata dönüştürme prensibiyle çalışan özel dönüştürücü uygulamalarını kullanabilirsiniz.

    Kısa özet

    Tuhaf bir sonucu özetlemek gerekirse, arşivleyici tarafından dosya sıkıştırma derecesinin birkaç faktöre ve çoğunlukla sıkıştırılan veri türüne, kullanılan yazılıma ve (genellikle Huffman ve Lempel-Ziv algoritmalarına) bağlı olduğu belirtilebilir. kullanılır, çiftler halinde çalışır). Multimedya içeriği söz konusu olduğunda, durum hemen hemen aynıdır, ancak baskın konum, formatın birinden diğerine dönüştürülmesidir.

    Bilgi sıkıştırma derecesi birkaç nedene bağlıdır:

    İlk olarak, sıkıştırılan veri türü büyük önem taşımaktadır. Grafik ve metin dosyaları en iyi şekilde sıkıştırılır. Onlar için sıkıştırma oranı yüzde beş ila kırk arasında olabilir. Yürütülebilir programların dosyaları, önyükleme modülleri, multimedya dosyaları daha kötü sıkıştırılır.

    İkincisi, sıkıştırma yöntemi büyük önem taşımaktadır.

    Üçüncüsü, hangi arşivleyicinin kullanıldığı da önemlidir. Arşivleyici türünü seçerken, genellikle aşağıdaki hususlara göre yönlendirilirler: böylece sıkıştırma oranı mümkün olduğu kadar yüksek ve dosyaların paketlenmesi ve paketten çıkarılması için gereken süre mümkün olduğunca kısadır.

    Bilgi sıkıştırma programları

    Sıkıştırma, arşivleme programları yardımıyla gerçekleşir. Bugüne kadar en yaygın olanı dört arşivleyicidir - WinRar, WinAce, 7Zip ve WinZip. Son programa gelince, incelemeye dayanmıyor.

    Arşivleyiciye daha yakından bakalım - WinRar Bu arşivleyici şu dosya türleri ile ilişkilendirilebilir: RAR, ZIP, CAB, ARJ, LZH, ACE, 7-Zip, TAR, GZip, UUE, BZ2, JAR, ISO.

    Program, neredeyse sınırsız boyuttaki dosyaları destekler (8.589.934.591 GB'a kadar). Doğru, 4 GB'den büyük dosyalarla çalışmak için NTFS dosya sistemi üzerinde çalışmanız gerekir.

    Sıkıştırma için en uygun ayarları seçerken dikkate alınması gereken birkaç nokta vardır:

    WinRAR, ZIP biçimini desteklese de, çoğu durumda RAR'ın seçilmesi önerilir. Bu, daha yüksek bir sıkıştırma seviyesi sağlayacaktır. Dosyaların açılacağı bilgisayara bir programın yükleneceğinden emin değilseniz, dosyaları RAR formatında açabileceğiniz bir programın yükleneceğinden emin değilseniz, dosyaları ZIP olarak sıkıştırabilirsiniz.

    Hangi sıkıştırma yönteminin kullanılacağına karar vermeniz gerekir. Sıkıştırma oranı ne kadar yüksek olursa, arşivleme o kadar uzun sürer, bu nedenle burada verilerin hangi amaçlarla arşivlendiğini düşünmeniz gerekir. Bu uzun süreli bir depolamaysa elbette beklemek ve maksimum sıkıştırma oranıyla arşivi almak mantıklıdır, ancak yalnızca birkaç belgeyi postayla göndermeniz gerekiyorsa normal (Normal) sıkıştırma oranı sizin için uygundur .

    Maksimum dosya sıkıştırması elde etmeniz gerekiyorsa, Katı arşiv oluştur seçeneğini kullanın. Bununla birlikte, dezavantajları da vardır. İlk olarak, bu tür dosyaları paketinden çıkarmak, normal bir arşivden çıkarmaktan daha fazla zaman alacaktır. Arşivinizde iki yüz dosyanız olduğunu düşünün. Olağan şekilde oluşturulmuşsa, dosyalardan birini kolayca çıkarabilirsiniz. Katı arşiv kullandıysanız, ihtiyacınız olan dosyanın nasıl arşivleneceği önemli olacaktır. İkinci yüzün ortasındaysa, paketini açmak için programın kendisine ulaşmadan önce 150 dosyayı açması gerekecektir. Bu şekilde arşiv oluşturmak büyük kayıplara da yol açabilir, çünkü arşiv bozulursa içindeki tüm dosyaları kaybedersiniz. Olağan şekilde paketleme durumunda, tümü olmasa da dosyaların çoğunu hasarlı arşivden çıkarabilirsiniz.

    Büyük bir arşiv oluşturmanız gerekiyorsa, bu oldukça uzun sürebilir. WinRar, belirli bir görevi tamamlamanın ne kadar süreceğini belirlemenizi sağlar. Kıyaslama ve donanım testi seçeneği bunun için tasarlanmıştır. Bu seçeneği kullanmanın diğer bir nedeni, bir donanım arızası nedeniyle şu veya bu konfigürasyondaki bir bilgisayarda arşivleme yapılırken meydana gelebilecek olası hataları belirlemektir.

    WinRar "a'nın diğer ayarları arasında, paketten çıkarma yolunun bir göstergesi ile kendi kendine açılan arşivler oluşturma olasılığına dikkat çekilebilir. Bu tür dosyalar, sıkıştırılmaları planlanan bilgisayarda bir arşiv programı gerektirmez. Bu tür arşivler, SFX arşivleri olarak adlandırılırlar.Geleneksel arşiv dosyalarına kıyasla dezavantajları daha büyük olmalarıdır, çünkü gerçek paketlenmiş dosyalara ek olarak yürütülebilir EXE modülünü de içerirler.

    Bir RAR arşivinin içeriği görünmez hale getirilebilir. Bunu yapmak için, program ayarlarında, Parola ile Arşivleme penceresinde, Dosya Adlarını Şifrele satırının yanındaki kutuyu işaretlemeniz gerekir.

    Arşivi açmak için bir şifre de belirleyebilirsiniz. Bir arşivin yerel bir ağ üzerinden aktarılması veya internetten indirilmesi sırasındaki bir hatanın yanı sıra bir donanım arızası veya bir virüs saldırısı sonucunda arşiv zarar görebilir. WinRar, Arşivlenmiş Dosyaları Test Et seçeneğini kullanarak arşivi test ederek verilerin bütünlüğünü belirlemenizi sağlar.

    Veri kaybı olasılığını en aza indirmek için, WinRar arşivleri oluştururken Kurtarma Kaydı Koy seçeneğinin kullanılması önerilir (bu onay kutusu, arşiv oluşturma penceresinin Genel sekmesinde bulunabilir).

    Bu yapılmışsa, arşivin hasar görmesi durumunda geri yüklenebilir.

    Ek olarak, WinRar'da, bir RAR arşivini oluştururken geri yüklenecek bilgilerin boyutunu belirterek hasar olasılığını azaltabilirsiniz. Bunun için Winrar penceresinde Commands > Protect Archive From Damage komutunu çalıştırmanız gerekmektedir. Aynı zamanda, Kurtarma Kaydının hacmi, arşivin toplam boyutunun yüzde onunu aşamaz.

    Hasarlı RAR arşivlerini onarmak için WinRar penceresinde gerekli dosyayı seçin ve Tools > Repair komutunu çalıştırın.

    WinRAR, içerik menüsüne yerleştirilebilir ve yalnızca Explorer menüsünü değil, aynı zamanda popüler Total Commander dosya yöneticisi gibi diğer programları da destekler. Bu, varsayılan ayarları kullanarak ve bunun için program penceresini açmadan dosyaları hızlı bir şekilde arşivlemeyi mümkün kılar. Bu arada, arşivlerinize koyduğunuz gereksinimlere göre varsayılan ayarlar değiştirilebilir. Bunu WinRar penceresini açıp Seçenekler > Ayarlar komutunu çalıştırarak yapabilirsiniz. Bu pencerede, Sıkıştırma sekmesine gidin ve Varsayılanı Oluştur düğmesini tıklayın. Bu pencerede belirtilen ayarlar hızlı arşivleme için kullanılacaktır. Arşivleme ayarlarını değiştirmeniz gerekirse, bu aynı zamanda içerik menüsü kullanılarak da yapılabilir. Bunu yapmak için Arşive Ekle… komutunu seçin, burada formatı ve sıkıştırma oranını ayarlayabilir, arşivin adını belirleyebilir ve diğer arşivleme seçeneklerini belirleyebilirsiniz.

    WinRar, kullanıcı tanımlı ayarları Reg uzantılı bir dosyaya kaydetmenizi sağlar. Daha sonra, verilen yapılandırmayı yeniden kullanmak için bu dosya programa alınabilir. Bu dosya, son zamanlarda oluşturulan arşivlerin geçmişi, varsayılan sıkıştırma ayarları vb. gibi bilgileri saklar.

    Bir başka kullanışlı Winrar seçeneği de kendi yer imlerinizi oluşturabilmenizdir - Sık Kullanılanlar. Sabit sürücünüzdeki aynı klasörleri düzenli olarak yedeklemeniz genellikle gereklidir. Bu klasörlerin konumu hakkındaki bilgileri yer imlerine ekleyerek, program penceresinde bunlara hızla gidebilir ve gerekli dosyaları ve alt dizinleri yedekleyebilirsiniz.

    Birinci bölüm - tarihsel.

    giriiş

    Mevcut veri sıkıştırma algoritmaları iki büyük sınıfa ayrılabilir - kayıplı ve kayıpsız. Kayıplı algoritmalar, görüntüleri ve sesi sıkıştırmak için yaygın olarak kullanılır. Bu algoritmalar, seçici kalite kaybı yoluyla yüksek sıkıştırma oranlarının elde edilmesini sağlar. Ancak tanım gereği sıkıştırılmış bir sonuçtan orijinal verileri kurtarmak mümkün değildir.
    Kayıpsız sıkıştırma algoritmaları, veri boyutunu küçültmek için kullanılır ve veriyi tam olarak sıkıştırmadan önceki haline döndürmek mümkün olacak şekilde çalışır. İletişimde, arşivleyicilerde ve ses ve grafik bilgilerini sıkıştırmak için bazı algoritmalarda kullanılırlar. Aşağıda, yalnızca kayıpsız sıkıştırma algoritmalarını ele alacağız.
    Sıkıştırma algoritmalarının temel ilkesi, rastgele olmayan veriler içeren herhangi bir dosyada bilgilerin kısmen tekrarlanması gerçeğine dayanır. İstatistiksel matematiksel modelleri kullanarak, belirli bir karakter kombinasyonunu tekrar etme olasılığını belirleyebilirsiniz. Daha sonra seçilen cümleler için kodlar oluşturabilir ve en sık tekrarlanan cümlelere en kısa kodları atayabilirsiniz. Bunun için çeşitli teknikler kullanılır, örneğin: entropi kodlaması, tekrar kodlaması ve sözlük sıkıştırması. Onların yardımıyla, 8 bitlik bir karakter veya tüm bir dizi yalnızca birkaç bit ile değiştirilebilir, böylece gereksiz bilgiler ortadan kaldırılabilir.

    Hikaye

    Algoritma hiyerarşisi:

    Veri sıkıştırma, İnternet ile ve Lempel ve Ziv (LZ algoritmaları) tarafından algoritmaların icadından sonra yaygınlaşmasına rağmen, daha önceki birkaç sıkıştırma örneğinden alıntı yapılabilir. Kodunu 1838'de icat eden Morse, akıllıca İngilizce'de en sık kullanılan harfleri, en kısa diziler olan "e" ve "t" harflerini (sırasıyla nokta ve çizgi) atadı. 1949'da ana çerçevelerin ortaya çıkmasından kısa bir süre sonra, bir veri bloğundaki karakterlere, blokta bulunma olasılıklarına dayalı olarak kodlar atayan Shannon-Fano algoritması icat edildi. Bir karakterin bir blokta görünme olasılığı, kodun uzunluğuyla ters orantılıydı, bu da verilerin gösterimini sıkıştırmayı mümkün kılıyordu.
    David Huffman, Robert Fano'nun sınıfında bir öğrenciydi ve çalışmasının bir parçası olarak ikili veri kodlama için geliştirilmiş bir yöntem aramayı seçti. Sonuç olarak, Shannon-Fano algoritmasını geliştirmeyi başardı.
    Shannon-Fano ve Huffman algoritmalarının ilk sürümleri önceden tanımlanmış kodlar kullanıyordu. Daha sonra bu, sıkıştırma amaçlı verilere dayalı olarak dinamik olarak oluşturulan kodları kullanmaya başladı. 1977'de Lempel ve Ziv, dinamik olarak oluşturulmuş bir sözlüğün ("kayan pencere" olarak da adlandırılır) kullanımına dayalı LZ77 algoritmalarını yayınladılar. 78'de, önce verileri ayrıştıran ve dinamik olarak oluşturmak yerine bir sözlük oluşturan LZ78 algoritmasını yayınladılar.

    Hak sorunları

    LZ77 ve LZ78 algoritmaları büyük bir popülerlik kazandı ve DEFLATE, LZMA ve LZX'in bugüne kadar hayatta kaldığı bir iyileştirme dalgasına neden oldu. Popüler algoritmaların çoğu LZ77'ye dayanmaktadır, çünkü LZ7'den türetilen LZW algoritmasının patenti 1984'te Unisys tarafından alındı ​​ve ardından GIF görüntüleri dahil herkesi ve herkesi trollemeye başladılar. Şu anda, UNIX'te LZC adlı LZW algoritmasının bir çeşidi kullanılıyordu ve izin sorunları nedeniyle kullanımlarının aşamalı olarak kaldırılması gerekiyordu. DEFLATE algoritması (gzip) ve Burrows-Wheeler dönüşümü BWT (bzip2) tercih edildi. En iyisi buydu, çünkü bu algoritmalar sıkıştırmada neredeyse her zaman LZW'den daha iyi performans gösteriyor.
    2003 yılına gelindiğinde patentin süresi dolmuştu, ancak tren çoktan kalkmıştı ve LZW algoritması belki de yalnızca GIF dosyalarında korunuyordu. LZ77'ye dayalı algoritmalar baskındır.
    1993 yılında Stac Electronics, LZS algoritmasının Microsoft tarafından MS-DOS 6.0 ile birlikte gelen disk sıkıştırma programında kullanıldığını keşfettiğinde başka bir patent savaşı yaşandı. Stac Electronics dava açtı ve davayı kazanarak 100 milyon dolardan fazla para kazandı.

    Deflate'in artan popülaritesi

    Büyük şirketler, sürekli artan miktarda veriyi depolamak için sıkıştırma algoritmaları kullandı, ancak algoritmaların gerçek yayılması, 80'lerin sonunda İnternet'in doğuşuyla geldi. Kanalların bant genişliği son derece dardı. Ağ üzerinden iletilen verileri sıkıştırmak için ZIP, GIF ve PNG biçimleri icat edildi.
    Tom Henderson, ticari olarak başarılı olan ilk ARC arşivleyicisini 1985'te icat etti ve piyasaya sürdü (System Enhancement Associates). ARC, BBS kullanıcıları arasında popüler olmuştur çünkü birkaç dosyayı bir arşive sıkıştırabilen ilk kişilerden biriydi, ayrıca kaynak kodları açıktı. ARC, değiştirilmiş bir LZW algoritması kullandı.
    ARC'nin popülaritesinden ilham alan Phil Katz, sıkıştırma algoritmalarını birleştiricide yeniden yazarak geliştirdiği PKARC paylaşılan yazılım programını yayınladı. Ancak, Henderson tarafından mahkum edildi ve suçlu bulundu. PKARC, ARC'yi o kadar açık bir şekilde kopyaladı ki, bazen kaynak kod yorumlarında yazım hataları bile oldu.
    Ancak Phil Katz kafasını kaybetmedi ve 1989'da arşivleyiciyi büyük ölçüde değiştirdi ve PKZIP'i yayınladı. LZW algoritmasının patentiyle bağlantılı olarak saldırıya uğradıktan sonra, temel algoritmayı da IMPLODE adlı yeni bir algoritmayla değiştirdi. Biçim, 1993 yılında PKZIP 2.0'ın piyasaya sürülmesiyle yeniden değiştirildi ve DEFLATE, yerini aldı. Yeni özellikler arasında arşivi ciltlere bölme işlevi de vardı. Bu sürüm, saygıdeğer yaşına rağmen hala yaygın olarak kullanılmaktadır.
    GIF (Graphics Interchange Format) resim formatı CompuServe tarafından 1987 yılında oluşturulmuştur. Bildiğiniz gibi format kayıpsız resim sıkıştırmayı destekler ve 256 renk paletiyle sınırlıdır. Unisys tüm çabalarına rağmen bu formatın yayılmasını engelleyemedi. Özellikle animasyon desteği nedeniyle günümüzde hala popülerliğini koruyor.
    Patent sorunlarından biraz rahatsız olan CompuServe, 1994 yılında Portable Network Graphics (PNG) formatını piyasaya sürdü. ZIP gibi, süslü yeni DEFLATE algoritmasını kullandı. DEFLATE'in patenti Katz'a ait olmasına rağmen, hiçbir iddiada bulunmadı.
    Şimdi en popüler sıkıştırma algoritmasıdır. PNG ve ZIP'in yanı sıra gzip, HTTP, SSL ve diğer veri aktarım teknolojilerinde kullanılmaktadır.

    Ne yazık ki Phil Katz, DEFLATE'in zaferini görecek kadar yaşamadı, 2000 yılında 37 yaşında alkolizmden öldü. Vatandaşlar - Aşırı alkol tüketimi sağlığınız için tehlikelidir! Zaferinizi görecek kadar yaşayamayabilirsiniz!

    Modern arşivleyiciler

    ZIP, 90'ların ortalarına kadar hüküm sürdü, ancak 1993'te basit bir Rus dehası olan Evgeny Roshal kendi formatını ve RAR algoritmasını buldu. En son sürümleri PPM ve LZSS algoritmalarına dayanmaktadır. Şimdi ZIP, belki de en yaygın biçimlerden biridir, RAR yakın zamana kadar çeşitli yasa dışı içeriği İnternet üzerinden dağıtmak için standarttı (bant genişliğindeki artış nedeniyle, dosyalar arşivlemeden giderek daha fazla dağıtılıyor) ve 7zip, format olarak kullanılmaktadır. kabul edilebilir bir zamanda en iyi sıkıştırma. UNIX dünyasında, bir grup tar + gzip kullanılır (gzip bir arşivleyicidir ve tar, birkaç dosyayı bir dosyada birleştirir, çünkü gzip bunu nasıl yapacağını bilmez).

    Not. çeviriŞahsen, listelenenlere ek olarak, BBS döneminde 90'larda popüler olan ARJ arşivleyicisine (Robert Jung tarafından Arşivlendi) de rastladım. Çok ciltli arşivleri destekledi ve ondan sonraki RAR gibi oyunları ve diğer warez'leri dağıtmak için kullanıldı. Ayrıca, uzun metin dosyalarını sıkıştırmak için iyi bir iş çıkaran HSC sıkıştırmasını kullanan (net bir açıklama bulamadı - yalnızca "sınırlı bağlam modeli ve aritmetik kodlama") Harri Hirvola'nın HA arşivleyicisi de vardı.

    1996 yılında, BWT algoritmasının açık kaynaklı bir versiyonu olan bzip2 ortaya çıktı ve hızla popülerlik kazandı. 1999'da 7-zip programı 7z formatında çıktı. Sıkıştırma açısından RAR ile rekabet eder, avantajı açıklıktır ve ayrıca bzip2, LZMA, LZMA2 ve PPMd algoritmaları arasında seçim yapabilmesidir.
    2002'de başka bir arşivleyici ortaya çıktı, PAQ. Yazar Matt Mahone, içerik harmanlama adı verilen bir teknik kullanarak PPM algoritmasının geliştirilmiş bir sürümünü kullandı. Sembol frekansına göre tahmini iyileştirmek için birden fazla istatistiksel modelin kullanılmasına izin verir.

    Sıkıştırma Algoritmalarının Geleceği

    Elbette, Tanrı bilir, ancak görünüşe göre PAQ algoritması, çok iyi sıkıştırma oranı nedeniyle (çok yavaş çalışmasına rağmen) popülerlik kazanıyor. Ancak bilgisayarların hızının artması nedeniyle iş hızı daha az kritik hale geliyor.
    Öte yandan, Lempel-Ziv-Markov LZMA algoritması, hız ve sıkıştırma oranı arasında bir değiş tokuştur ve birçok ilginç sonuçlara yol açabilir.
    Bir başka ilginç teknoloji de programlarda hala çok az kullanılan "alt dizi numaralandırma" veya CSE'dir.

    Bir sonraki bölümde, bahsedilen algoritmaların teknik yönünü ve çalışma prensiplerini ele alacağız.

    Tüm sıkıştırma algoritmaları, bir tür dönüşüm kullanarak daha kompakt bir çıktı akışı elde etmek için girdi bilgi akışı üzerinde çalışır. Sıkıştırma işlemlerinin ana teknik özellikleri ve çalışmalarının sonuçları şunlardır:

    · sıkıştırma derecesi - ilk ve son akışların hacimlerinin ilişkisi;

    · sıkıştırma oranı - giriş akışındaki belirli bir miktarda bilgiyi, ondan eşdeğer bir çıkış akışı elde edilene kadar sıkıştırmak için harcanan süre;

    · sıkıştırma kalitesi - aynı veya başka bir algoritma kullanılarak yeniden sıkıştırıldığında çıkış akışının ne kadar paketlendiğini gösteren bir değer.

    Veri kaydının fazlalığını ortadan kaldıran algoritmalara veri sıkıştırma algoritmaları veya arşivleme algoritmaları denir. Şu anda, birkaç temel yönteme dayalı çok sayıda veri sıkıştırma programı bulunmaktadır.

    Tüm veri sıkıştırma algoritmaları aşağıdakilere ayrılmıştır:

    ) kullanıldığında alıcı uçtaki verilerin en ufak bir değişiklik olmadan geri yüklendiği kayıpsız sıkıştırma algoritmaları;

    ) verilerin özü üzerinde çok az etkisi olan veya genellikle bir kişi tarafından algılanamayan bilgileri veri akışından kaldıran kayıplı sıkıştırma algoritmaları.

    İki ana kayıpsız arşivleme yöntemi vardır:

    Huffman algoritması (eng. Huffman), birbirine bağlı olmayan bayt dizilerini sıkıştırmaya odaklandı,

    Lempel-Ziv algoritması (İng. Lempel, Ziv), her tür metni sıkıştırmaya, yani "kelimelerin" - bayt dizilerinin tekrar tekrar tekrarlanması gerçeğini kullanmaya odaklandı.

    Neredeyse tüm popüler kayıpsız arşivleme programları (ARJ, RAR, ZIP, vb.) bu iki yöntemin bir kombinasyonunu kullanır - LZH algoritması.

    Huffman algoritması.

    Algoritma, standart 256 karakterlik serbest metin setindeki bazı karakterlerin ortalama tekrar süresinden daha sık, diğerlerinin sırasıyla daha az sıklıkta ortaya çıkabileceği gerçeğine dayanmaktadır. Bu nedenle, $+o, uzunluğu 8'den az olan kısa bit dizilerini ve nadir karakterleri kaydetmek için uzun olanları kullanarak ortak karakterleri kaydederse, toplam dosya boyutu azalır.

    Lempel-Ziv algoritması. Adını yayınlandığı yıldan alan klasik Lempel-Ziv algoritması -LZ77 son derece basittir. Aşağıdaki şekilde formüle edilir: geçmiş çıktı akışında benzer bir bayt dizisiyle zaten karşılaşılmışsa ve uzunluğunun ve mevcut konumdan uzaklığının kaydı bu dizinin kendisinden daha kısaysa, o zaman bağlantı (kaydırma, uzunluk) dizinin kendisine değil, çıktı dosyasına yazılır.

    4. Dosya sıkıştırma oranı

    Arşiv dosyalarındaki bilgilerin sıkıştırılması, fazlalığı çeşitli şekillerde ortadan kaldırarak, örneğin kodları basitleştirerek, bunlardan sabit bitleri ortadan kaldırarak veya yinelenen karakterleri veya yinelenen bir karakter dizisini bir tekrar faktörü ve karşılık gelen karakterler biçiminde temsil ederek gerçekleştirilir. Bu tür bilgi sıkıştırma algoritmaları, özel arşivleme programlarında (en ünlüleri arj / arjfolder, pkzip / pkunzip / winzip, rar / winrar) uygulanır, bazıları kullanılır. sözde arşiv dosyasında veya arşivde sıkıştırılmış bir form.

    Dosya paketlemenin amacı genellikle bir disk üzerinde daha kompakt bir bilgi düzenlemesi sağlamak, zamanı ve buna bağlı olarak bilgisayar ağlarındaki iletişim kanalları üzerinden bilgi aktarma maliyetini azaltmaktır. Bu nedenle, belirli bir arşivleme programının etkinliğinin ana göstergesi, dosya sıkıştırma derecesidir.

    Dosya sıkıştırma derecesi, sıkıştırılmış Vc dosyasının hacminin orijinal dosyanın Vo hacmine oranı olarak tanımlanan Kc katsayısı ile karakterize edilir ve yüzde olarak ifade edilir (bazı kaynaklar ters oranı kullanır):

    Kc=(Vc/Vo)*%100

    Sıkıştırma miktarı kullandığınız programa, sıkıştırma yöntemine ve kaynak dosyanın türüne bağlıdır.

    Grafik görüntülerin, metin dosyalarının ve veri dosyalarının dosyaları en iyi şekilde sıkıştırılır, bunun için sıkıştırma oranı %5 - 40'a ulaşabilir, yürütülebilir programların ve yük modüllerinin dosyaları daha az sıkıştırılır Kc = %60 - 90. Arşiv dosyaları neredeyse sıkıştırılmamıştır. Çoğu arşivleme programının sıkıştırma için LZ77 (Lempel-Ziv) algoritmasının varyantlarını kullandığını biliyorsanız, bunun özü yinelenen bayt dizilerinin (okuma karakterleri) özel bir kodlaması olduğunu biliyorsanız, bunu açıklamak kolaydır. Bu tür tekrarların görülme sıklığı, metinlerde ve dağılım grafiklerinde en yüksektir ve arşivlerde pratik olarak sıfıra düşürülür.

    Ek olarak, arşivleme programları, sıkıştırma derecesini buna göre etkileyen sıkıştırma algoritmalarının uygulamalarında hala farklılık göstermektedir.

    Bazı arşivleme programları ayrıca Kc ​​sıkıştırma oranını düşürmeyi amaçlayan araçlar içerir. Bu nedenle, WinRAR programı, özellikle aynı tür içeriğe sahip çok sayıda küçük dosya paketlendiğinde, geleneksel yöntemlere göre %10 - 50 daha yüksek bir sıkıştırma oranının elde edilebildiği bir sürekli (katı) arşivleme mekanizması uygular.

    Arşivleyicilerin özellikleri ters bağımlı niceliklerdir. Yani, sıkıştırma oranı ne kadar yüksek olursa, sıkıştırma oranı o kadar düşük olur ve bunun tersi de geçerlidir.

    Bilgisayar pazarında pek çok arşivleyici var - her birinin kendi desteklenen formatları, artıları ve eksileri, kullandıkları arşivleyicinin en iyisi olduğuna kesinlikle inanan kendi hayran çevreleri var. Kimseyi veya hiçbir şeyi caydırmayacağız - işlevsellik ve verimlilik açısından en popüler arşivleyicileri tarafsız bir şekilde değerlendirmeye çalışacağız. Bunlar WinZip, WinRAR, WinAce, 7-Zip'i içerir - yazılım sunucularındaki indirme sayısı açısından liderdirler. Diğer arşivleyicileri kullanan kullanıcıların yüzdesi (indirme sayısına bakılırsa) küçük olduğundan, diğer arşivleyicileri dikkate almanız pek tavsiye edilmez.

    3. Dosya sıkıştırma oranı

    Arşiv dosyalarındaki bilgilerin sıkıştırılması, fazlalığı çeşitli şekillerde ortadan kaldırarak, örneğin kodları basitleştirerek, bunlardan sabit bitleri ortadan kaldırarak veya yinelenen karakterleri veya yinelenen bir karakter dizisini bir tekrar faktörü ve karşılık gelen karakterler biçiminde temsil ederek gerçekleştirilir. Bu tür bilgi sıkıştırma algoritmaları, özel arşivleme programlarında (en ünlüleri arj / arjfolder, pkzip / pkunzip / winzip, rar / winrar) uygulanır, bazıları kullanılır. sözde arşiv dosyasında veya arşivde sıkıştırılmış bir form.

    Dosya paketlemenin amacı genellikle bir disk üzerinde daha kompakt bir bilgi düzenlemesi sağlamak, zamanı ve buna bağlı olarak bilgisayar ağlarındaki iletişim kanalları üzerinden bilgi aktarma maliyetini azaltmaktır. Bu nedenle, belirli bir arşivleme programının etkinliğinin ana göstergesi, dosya sıkıştırma derecesidir.

    Dosya sıkıştırma derecesi, sıkıştırılmış Vc dosyasının hacminin orijinal dosyanın Vo hacmine oranı olarak tanımlanan Kc katsayısı ile karakterize edilir ve yüzde olarak ifade edilir (bazı kaynaklar ters oranı kullanır):

    Kc=(Vc/Vo)*%100

    Sıkıştırma miktarı kullandığınız programa, sıkıştırma yöntemine ve kaynak dosyanın türüne bağlıdır.

    Grafik görüntülerin, metin dosyalarının ve veri dosyalarının dosyaları en iyi şekilde sıkıştırılır, bunun için sıkıştırma oranı %5 - 40'a ulaşabilir, yürütülebilir programların ve yük modüllerinin dosyaları daha az sıkıştırılır Kc = %60 - 90. Arşiv dosyaları neredeyse sıkıştırılmamıştır. Çoğu arşivleme programının sıkıştırma için LZ77 (Lempel-Ziv) algoritmasının varyantlarını kullandığını biliyorsanız, bunun özü yinelenen bayt dizilerinin (okuma karakterleri) özel bir kodlaması olduğunu biliyorsanız, bunu açıklamak kolaydır. Bu tür tekrarların görülme sıklığı, metinlerde ve dağılım grafiklerinde en yüksektir ve arşivlerde pratik olarak sıfıra düşürülür.

    Ek olarak, arşivleme programları, sıkıştırma derecesini buna göre etkileyen sıkıştırma algoritmalarının uygulamalarında hala farklılık göstermektedir.

    Bazı arşivleme programları ayrıca Kc ​​sıkıştırma oranını düşürmeyi amaçlayan araçlar içerir. Bu nedenle, WinRAR programı, özellikle aynı tür içeriğe sahip çok sayıda küçük dosya paketlendiğinde, geleneksel yöntemlere göre %10 - 50 daha yüksek bir sıkıştırma oranının elde edilebildiği bir sürekli (katı) arşivleme mekanizması uygular.

    Arşivleyicilerin özellikleri ters bağımlı niceliklerdir. Yani, sıkıştırma oranı ne kadar yüksek olursa, sıkıştırma oranı o kadar düşük olur ve bunun tersi de geçerlidir.

    Bilgisayar pazarında pek çok arşivleyici var - her birinin kendi desteklenen formatları, artıları ve eksileri, kullandıkları arşivleyicinin en iyisi olduğuna kesinlikle inanan kendi hayran çevreleri var. Kimseyi veya hiçbir şeyi caydırmayacağız - işlevsellik ve verimlilik açısından en popüler arşivleyicileri tarafsız bir şekilde değerlendirmeye çalışacağız. Bunlar WinZip, WinRAR, WinAce, 7-Zip'i içerir - yazılım sunucularındaki indirme sayısı açısından liderdirler. Diğer arşivleyicileri kullanan kullanıcıların yüzdesi (indirme sayısına bakılırsa) küçük olduğundan, diğer arşivleyicileri dikkate almanız pek tavsiye edilmez.

    Görevde her değer çifti (,) bir kez gerçekleştiğinden, korelasyon tablosu bir kimlik matrisi şeklini alacaktır. Yani koşullu ortalama değerlerle aynıdır. Korelasyon oranının 1'e eşit olduğu ve dolayısıyla...

    Fonksiyonların en küçük kareler yöntemiyle yaklaştırılması

    Daha sonra, ikinci dereceden bir fonksiyonla fonksiyona yaklaşacağız. Katsayıları belirlemek için (3.2.1) sistemini kullanıyoruz ve B29, C29, D29, E29, F29, G29 ve H29 hücrelerinde bulunan Tablo 3'ün toplamlarını kullanarak sistemi (2.1.4) yazıyoruz. biçim (3.2...

    arşivleyici türleri

    Veri sıkıştırma için çok sayıda çeşitli yöntem, bunların modifikasyonları ve alt türleri geliştirilmiştir. Modern arşivleyiciler, kural olarak, aynı anda birkaç yöntem kullanır. Bazı ana...

    Bilgi sistemleri otomasyon derecesine göre nasıl sınıflandırılabilir?

    Bilgi teknolojisi sınıflandırması

    Bilgi teknolojileri, öncelikle içlerindeki bilgisayarların kullanım kapsamına ve derecesine göre sınıflandırılmalıdır. Bilgi teknolojilerinin bilim, eğitim, kültür, ekonomi gibi uygulama alanları var ...

    Bölge, kuruluş, OID için etkili bir güvenlik sistemi oluşturmanın gerekli adımlarından biri olarak, FitMax kuruluşunun güvenlik açığı analizini gerçekleştireceğiz ...

    "FitMax" Enterprise LLC örneğinde bilgi faaliyeti nesnesinin güvenlik açığı derecesinin matematiksel olarak doğrulanması

    Kanalların her biri için, bilgi güvenliği derecesinin olasılık hesaplamaları yapılır. Akustik kanal: Vibroakustik kanal: İnsan faktörü: Alınan verilere göre...

    Mikroişlemci: amaç, kompozisyon, temel özellikler

    Windows'ta dosyalarla çalışmanın birkaç yolu vardır. İlki, "Bilgisayarım" klasöründeki "disk klasörleri" dir. Onların yardımıyla, herhangi bir klasörde ve herhangi bir diskte istediğiniz herhangi bir dosyaya ulaşabilirsiniz. Ancak, bu yöntem ideal olmaktan uzaktır ...

    Arama sistemi

    1. Manuel bilgi sistemleri, modern teknik bilgi işleme araçlarının olmaması ve tüm işlemlerin bir kişi tarafından gerçekleştirilmesi ile karakterize edilir. Örneğin bilgisayar olmayan bir şirkette yöneticinin faaliyetleri hakkında...

    Kapı satış asistanının etkinliğinin ana göstergesi, sağladığı etkili ziyaretlerin kendisiyle ilgili toplam müşteri trafiği hacmindeki payıdır - satıcının etkin katılımının bir göstergesi ...

    Asenkron enerji tasarruflu elektrik motorunun parametrelerinin hesaplanması

    Elektrikli makinelerin koruma derecelerinin özellikleri, iki Latin harfi IP (Uluslararası Koruma) ve iki sayı ile gösterilir ...

    Otomobil parçaları satışı için e-ticaret ve istatistik sistemi

    Çevrimiçi mağazanıza yalnızca yeni değil, aynı zamanda geri dönen ziyaretçilerin sayısını da analiz etmek önemlidir. Bu, sitenizin hedef kitle için ne kadar ilginç olduğunu değerlendirmenize olanak tanır. Ayrıca ziyaretçileri geri getirmek her zaman daha kolaydır...