• Bilgi niceliklendirme yöntemi: istatistiksel, anlamsal, pragmatik ve yapısal. Bilgi ölçüleri (sözdizimsel, anlamsal, pragmatik)

    Daha önce de belirtildiği gibi, bilgi kavramı, özelliklerine getirilen çeşitli kısıtlamalar altında düşünülebilir; en çeşitli seviyeler düşünce. Temel olarak üç seviye vardır: sözdizimsel, anlamsal ve pragmatik. Buna göre, bilgi miktarını belirlemek için her biri hakkında farklı tahminler kullanılır.

    Açık söz dizimi düzeyi bilgi miktarını değerlendirmek için, yalnızca bilginin olasılıksal özelliklerini dikkate alan ve diğerlerini (anlamsal içerik, kullanışlılık, alaka düzeyi vb.) dikkate almayan olasılıksal yöntemler kullanılır. XX yüzyılın ortalarında geliştirildi. Matematiksel ve özellikle olasılıksal yöntemler, bilginin belirsizliğini azaltmanın bir ölçüsü olarak bilgi miktarını değerlendirmeye yönelik bir yaklaşım oluşturmayı mümkün kılmıştır.

    Olasılıkçı olarak da adlandırılan bu yaklaşım, eğer bir mesaj bilgimizin belirsizliğinde bir azalmaya yol açıyorsa, o zaman böyle bir mesajın bilgi içerdiğinin iddia edilebileceği ilkesini öne sürer. Bu durumda mesajlar, farklı olasılıklarla gerçekleşebilecek her türlü olay hakkında bilgi içerir.

    Farklı olasılıklara sahip ve ayrı bir bilgi kaynağından alınan olaylara ilişkin bilgi miktarını belirleme formülü, 1948'de Amerikalı bilim adamı C. Shannon tarafından önerildi. Bu formüle göre bilgi miktarı şu şekilde belirlenebilir:

    Nerede BEN- Bilgi miktarı; N– olası olayların sayısı (mesajlar); pi– Bireysel olayların (mesajların) olasılığı.

    Formül (2.1) kullanılarak belirlenen bilgi miktarı yalnızca pozitif bir değer alır. Bireysel olayların olasılığı birden az olduğundan log 2 ifadesi negatif bir değerdir ve formül (2.1)'deki bilgi miktarı için pozitif bir değer elde etmek için önünde bir eksi işareti bulunur. toplam işareti.

    Bireysel olayların meydana gelme olasılıkları aynı ise ve bunlar oluşursa tam grup olaylar, yani:

    daha sonra formül (2.1), R. Hartley formülüne dönüştürülür:

    Formül (2.1) ve (2.2)'de bilgi miktarı arasındaki oran BEN ve buna göre bireysel olayların olasılığı (veya sayısı) logaritma kullanılarak ifade edilir.

    (2.1) ve (2.2) formüllerinde logaritmanın kullanımı şu şekilde açıklanabilir. Akıl yürütmenin basitliği için (2.2) ilişkisini kullanıyoruz. Argümana sırayla atayacağız Nörneğin bir dizi sayı arasından seçilen değerler: 1, 2, 4, 8, 16, 32, 64 vb. Hangi olayın olduğunu belirlemek için N Eşit olasılıklı olaylar meydana geldiğinde, serinin her sayısı için iki olası olaydan seçim işlemlerinin sırayla gerçekleştirilmesi gerekir.

    Evet, N= 1 işlem sayısı 0 olacaktır (olayın olasılığı 1'dir), N= 2, işlem sayısı 1'e eşit olacaktır; N= 4 işlem sayısı 2 olacaktır, N= 8, işlem sayısı 3 olacaktır vb. Böylece, fonksiyonun değerlerine karşılık geldiği düşünülebilecek 0, 1, 2, 3, 4, 5, 6 vb. sayı dizisini elde ederiz. BEN(2.2) ile ilgili olarak.

    Argümanın aldığı sayısal değerlerin sırası N, matematikte geometrik bir ilerleme oluşturan bir sayı dizisi ve fonksiyonun aldığı sayıların değer dizisi olarak bilinen bir dizidir BEN, aritmetik ilerleme oluşturan bir dizi olacaktır. Böylece (2.1) ve (2.2) formüllerindeki logaritma, matematikte oldukça iyi bilinen geometrik ve aritmetik ilerlemeleri temsil eden seriler arasındaki ilişkiyi kurar.

    Herhangi bir fiziksel miktarı ölçmek (tahmin etmek) için, ölçüm teorisinde adı verilen ölçüm birimini belirlemek gerekir. miktar .


    Daha önce de belirtildiği gibi, bilgilerin işlenmeden, iletilmeden ve saklanmadan önce kodlanması gerekir.

    Kodlama özel alfabeler (işaret sistemleri) kullanılarak yapılır. Bilgi işlem (bilgisayar) sistemlerini kullanarak bilginin elde edilmesi, işlenmesi, iletilmesi ve saklanması süreçlerini inceleyen bilgisayar biliminde, esas olarak 0 ve 1 karakterlerinden oluşan bir işaret sisteminin kullanıldığı ikili kodlama kullanılır. Bu nedenle, (2.1) ve (2.2) formüllerinde logaritmanın tabanı olarak 2 sayısı kullanılır.

    Temelli olasılıksal yaklaşım Bilgi miktarını belirlemek için ikili işaret sisteminin bu iki sembolü iki farklı olası olay olarak düşünülebilir, bu nedenle bilgi miktarının birimi olarak belirsizliği azaltan bir mesaj içeren bilgi miktarı alınır. bilgi yarı yarıya (olayları almadan önce olasılıkları 0,5'tir, - 1 elde edildikten sonra belirsizlik buna göre azalır: 1 / 0,5 \u003d 2, yani 2 kez). Böyle bir bilgi birimine biraz denir (İngilizce kelimeden) ikili basamakikili basamak). Dolayısıyla, sözdizimsel düzeydeki bilgi miktarının değerlendirilmesine yönelik bir ölçü olarak, sağlanan ikili kodlama, bir bit aldı.

    Bilgi miktarının bir sonraki en büyük ölçüm birimi, sekiz bitlik bir dizi olan bayttır, yani:

    1 bayt = 2 3 bit = 8 bit.

    Bilgisayar bilimlerinde, bir baytın katları olan bilgi miktarının ölçüm birimleri de yaygın olarak kullanılmaktadır, ancak farklı olarak metrik sistemi 10n katsayısının çoklu birimlerin katları olarak kullanıldığı, n = 3, 6, 9 vb. olduğu ölçümlerde, bilgi miktarının çoklu ölçüm birimlerinde 2n katsayısı kullanılır. Bu seçim, bilgisayarın temelde sayılarla ondalık değil, sayılarla çalışmasıyla açıklanmaktadır. İkili sistem hesaplaşma.

    Bilgi miktarını ölçen birimin bayt katları şu şekilde girilir:

    1 kilobayt (KB) = 210 bayt = 1024 bayt;

    1 megabayt (MB) = 210 KB = 1024 KB;

    1 gigabayt (GB) = 210 MB = 1024 MB;

    1 terabayt (TB) = 210 GB = 1024 GB;

    1 petabayt (PB) = 210 TB = 1024 TB;

    1 exabyte (Ebyte) = 210 PB = 1024 PB.

    Adında "kilo", "mega" vb. öneklerin bulunduğu bilgi miktarının ölçüm birimleri, ölçüm teorisi açısından doğru değildir, çünkü bu önekler metrik sistemde kullanılır. Katsayının birden fazla birimin 10 n katları olarak kullanıldığı ölçümlerin sayısı; burada n = 3, 6, 9 vb. Bu yanlışlığın ortadan kaldırılması için uluslararası bir kuruluş Uluslararası Elektroteknik Komisyonu Elektronik teknolojisi endüstrisi için standartlar oluşturan, bilgi miktarının ölçü birimleri için bir dizi yeni ön ek onayladı: kibi (kibi), mebi (mebi), gibi (gibi), tebi (tebi), peti (peti) ), exbi (exbi). Ancak bilgi miktarının ölçü birimleri için eski tanımlamalar hâlâ kullanılmaktadır ve yeni adların yaygın olarak kullanılması zaman alır.

    İşaret sistemleri kullanılarak sunulan bilgi miktarının belirlenmesinde olasılıksal yaklaşım da kullanılır. Alfabenin sembollerini bir dizi olası mesaj N olarak düşünürsek, alfabenin bir karakterinin taşıdığı bilgi miktarı formül (2.1) ile belirlenebilir. Mesaj metninde alfabedeki her karakterin eşit olasılıklı görünümü ile bilgi miktarını belirlemek için formül (2.2) kullanılabilir.

    Alfabedeki bir karakterin taşıdığı bilgi miktarı ne kadar fazla olursa, bu alfabede o kadar çok karakter yer alır. Alfabenin içerdiği karakter sayısına alfabenin önem derecesi denir. İşaret sistemi kullanılarak kodlanan ve belirli sayıda karakter (sembol) içeren bir mesajın içerdiği bilgi miktarı (bilgi hacmi), aşağıdaki formül kullanılarak belirlenir:

    Nerede V– mesajın bilgi hacmi; BEN= günlük 2 N, bir sembolün (işaret) bilgi hacmi; İLE– mesajdaki sembollerin (karakterlerin) sayısı; N– alfabenin gücü (alfabedeki karakter sayısı).

    Bilgi - nedir bu? Neye dayanıyor? Hangi hedefleri takip ediyor ve hangi görevleri yerine getiriyor? Bütün bunları bu yazı çerçevesinde konuşacağız.

    Genel bilgi

    Bilgiyi ölçmenin anlamsal yolu hangi durumlarda kullanılır? Bilginin özü kullanılır, alınan mesajın içerik tarafı ilgi çekicidir - bunlar kullanımının göstergeleridir. Ama önce ne olduğuna dair bir açıklama yapalım. Bilgiyi ölçmenin anlamsal yolunun henüz tam olarak oluşmamış zor, resmileştirilmiş bir yaklaşım olduğu unutulmamalıdır. Alınan verilerdeki anlam miktarını ölçmek için kullanılır. Başka bir deyişle, alınan bilgilerden ne kadar bilginin gerekli olduğu bu durum. Bu yaklaşım alınan bilginin içeriğini belirlemek için kullanılır. Ve bilgiyi ölçmenin anlamsal yolundan bahsediyorsak, söz konusu konuyla ayrılmaz bir şekilde bağlantılı olan eş anlamlılar sözlüğü kavramını kullanırız. Neyi temsil ediyor?

    Eş anlamlılar sözlüğü

    Küçük bir giriş yapmak ve bilgiyi ölçmenin anlamsal yöntemiyle ilgili bir soruyu yanıtlamak istiyorum. Kim girdi? Sibernetiğin kurucusu Norbert Wiener bu yöntemin kullanılmasını önerdi, ancak yurttaşımız A. Yu.Schrader'in etkisi altında önemli ölçüde geliştirildi. Bilgiyi alan kişinin sahip olduğu bilgilerin bütününü ifade etmek için kullanılan ad nedir? Eğer eş anlamlılar sözlüğünü alınan mesajın içeriğiyle ilişkilendirirsek belirsizliği ne kadar azalttığını bulabiliriz. Etkisi altında sıklıkla düşen bir hatayı düzeltmek istiyorum çok sayıda insanların. Dolayısıyla bilgiyi ölçmenin anlamsal yolunun Claude Shannon tarafından ortaya atıldığına inanıyorlar. Bu yanılgının nasıl ortaya çıktığı tam olarak bilinmiyor ancak bu görüş yanlıştır. Claude Shannon, "varisi" anlamsal olarak kabul edilen bilgiyi ölçmenin istatistiksel bir yolunu tanıttı.

    Alınan mesajdaki anlamsal bilgi miktarını belirlemek için grafiksel yaklaşım

    Neden bir şeyler çizmen gerekiyor? Anlamsal ölçüm yöntemi, bu fırsatı kullanarak verilerin kullanışlılığını kolayca anlaşılabilecek şekiller halinde görsel olarak sunar. Bu pratikte ne anlama geliyor? Durumu açıklamak için bir grafik şeklinde bir bağımlılık çizilir. Kullanıcının alınan mesajın özü hakkında hiçbir bilgisi yoksa (sıfıra eşittir), o zaman ses seviyesi anlamsal bilgi aynı değere eşit olacaktır. Optimum değeri bulmak mümkün mü? Evet! Bu, anlamsal bilgi miktarının maksimum olduğu eş anlamlılar sözlüğünün adıdır. Küçük bir örneğe bakalım. Bir kullanıcının bilmediği bir yabancı dilde yazılmış bir mesaj aldığını veya bir kişinin orada yazılanları okuyabildiğini, ancak tüm bunlar bilindiği için bu onun için artık bir haber olmadığını varsayalım. Bu gibi durumlarda mesajın sıfır anlamsal bilgi içerdiği söylenir.

    Tarihsel gelişim

    Muhtemelen bunun biraz daha ayrıntılı tartışılması gerekirdi, ancak yetişmek için henüz çok geç değil. Bilgiyi ölçmenin semantik yöntemi ilk olarak 1928 yılında Ralph Hartley tarafından ortaya atılmıştır. Daha önce Claude Shannon'ın sıklıkla kurucu olarak anıldığı belirtilmişti. Neden bu kadar kafa karışıklığı yaşandı? Gerçek şu ki, bilgiyi ölçmenin anlamsal yolu 1928'de Ralph Hartley tarafından ortaya atılmış olsa da, bunu 1948'de genelleştirenler Claude Shannon ve Warren Weaver'dı. Bundan sonra sibernetiğin kurucusu Norbert Wiener, Yu.I. Schneider tarafından geliştirilen bir ölçü biçiminde en çok tanınan eş anlamlılar sözlüğü yöntemi fikrini oluşturdu. Bunu anlamak için şunu belirtmek gerekir. yüksek seviye bilgi.

    Yeterlik

    Eş anlamlılar sözlüğü yöntemi pratikte bize ne verir? Bilginin görelilik gibi bir özelliğe sahip olduğu tezinin gerçek bir teyididir. Göreceli (veya öznel) bir değere sahip olduğuna dikkat edilmelidir. Bilimsel bilginin objektif olarak değerlendirilebilmesi için evrensel eş anlamlılar sözlüğü kavramı ortaya atılmıştır. Değişimin derecesi, insanlığın aldığı bilginin önemini göstermektedir. Aynı zamanda, bilgilerden tam olarak hangi nihai sonucun (veya ara sonucun) elde edilebileceğini söylemek imkansızdır. Örneğin bilgisayarları ele alalım. Bilgisayar teknolojisi, lamba teknolojisi ve her yapısal elemanın bit durumu temelinde oluşturuldu ve başlangıçta hesaplamalar yapmak için kullanıldı. Artık hemen hemen her insanın bu teknolojiye dayanarak çalışan bir şeyi var: radyo, telefon, bilgisayar, TV, dizüstü bilgisayar. Eşit modern buzdolapları, sobalar ve lavabolar, çalışması bu ev aletlerinin kişinin kullanımını kolaylaştırma bilgilerine dayanan bazı elektronikler içerir.

    Bilimsel yaklaşım

    Bilgiyi ölçmenin anlamsal yolu nerede araştırılıyor? Bilişim bu konunun çeşitli yönleriyle ilgilenen bilimdir. Özellik nedir? Yöntem "doğru/yanlış" sisteminin veya "bir/sıfır" bit sisteminin kullanımına dayanmaktadır. Belirli bilgiler geldiğinde, konuşma birimleri gibi adlandırılan ayrı bloklara bölünür: kelimeler, heceler ve benzeri. Her blok belirli bir değer alır. Küçük bir örneğe bakalım. İki arkadaş yan yana duruyor. Biri ikinciye şu sözlerle dönüyor: "Yarın bir izin günümüz var." Dinlenme günleri ne zaman - herkes bilir. Dolayısıyla bu bilginin değeri sıfırdır. Ama eğer ikincisi yarın çalışacağını söylerse, o zaman birincisi için bu bir sürpriz olacaktır. Nitekim bu durumda, örneğin bowling oynamaya gitmek veya atölyeye gitmek gibi bir kişinin yaptığı planların ihlal edileceği ortaya çıkabilir. Açıklanan örneğin her bir kısmı birler ve sıfırlar kullanılarak açıklanabilir.

    Konseptlerle operasyon

    Peki eş anlamlılar sözlüğü dışında başka ne kullanılıyor? Bilgiyi ölçmenin anlamsal yolunu anlamak için başka ne bilmeniz gerekiyor? Daha fazla çalışılabilecek temel kavramlar işaret sistemleridir. İşaretleri veya bunların kombinasyonlarını yorumlama kuralları gibi, anlamı ifade etme araçları olarak anlaşılırlar. Bilgisayar biliminden başka bir örneğe bakalım. Bilgisayarlar koşullu sıfırlar ve birlerle çalışır. Temel olarak düşük yüksek voltaj ekipmanın bileşenlerine beslenen. Üstelik bu birimleri ve sıfırları ucu ve kenarı olmadan iletirler. Teknoloji bunları nasıl ayırt edebilir? Bunun cevabı bulundu: kesintiler. Aynı bilgiler iletildiğinde kelime, kelime öbeği ve bireysel anlamlar gibi çeşitli bloklar elde edilir. Sözlü insan konuşmasında, verileri ayrı bloklara bölmek için duraklamalar da kullanılır. O kadar görünmezler ki çoğunu "makinede" fark ediyoruz. Bir mektupta noktalar ve virgüller bu amaca hizmet eder.

    Özellikler

    Bilgiyi anlamsal ölçme yönteminin sahip olduğu özellikler konusuna da değinelim. Bunun, bilginin önemini değerlendiren özel bir yaklaşımın adı olduğunu zaten biliyoruz. Bu şekilde değerlendirilecek verilerin objektif olacağını söyleyebilir miyiz? Hayır, bu doğru değil. Bilgi subjektiftir. Bir okul örneğine bakalım. Onaylanan programın ilerisinde giden mükemmel bir öğrenci ve sınıfta sunulanları inceleyen ortalama bir öğrenci vardır. Birincisi, okulda alacağı bilgilerin çoğu, bunu zaten bildiği ve ilk kez duymadığı / okumadığı için pek ilgi çekici olmayacaktır. Dolayısıyla öznel düzeyde onun için pek değerli olmayacaktır (belki de konuyu anlatırken fark ettiği öğretmenin bireysel açıklamalarından dolayı). Orta köylü yeni bilgiler hakkında yalnızca uzaktan bir şeyler duymuşken, bu nedenle onun için derslerde sunulacak verilerin değeri çok daha büyüktür.

    Çözüm

    Bilişimde bilgiyi anlamsal olarak ölçmenin mevcut sorunların çözülebileceği tek seçenek olmadığı unutulmamalıdır. Seçim mevcut hedeflere ve fırsatlara bağlı olmalıdır. Bu nedenle, konu ilgi çekiciyse veya buna ihtiyaç varsa, o zaman konuyu daha ayrıntılı olarak incelemenizi ve anlambilim dışında bilgiyi ölçmenin başka hangi yollarının mevcut olduğunu bulmanızı şiddetle tavsiye edebiliriz.

    Uygularken bilgi süreçleri Bilgi kaynağından alıcıya (alıcıya) uzay ve zamanda her zaman bir bilgi aktarımı vardır. Bu durumda bilgi kullanılarak iletilir. çeşitli işaretler veya mesaj adı verilen bir biçimde ifade edilmesini sağlayan doğal veya yapay (resmi) dil gibi semboller.

    İleti- iletim için kullanılan bir dizi işaret (sembol) biçiminde bilgi temsili biçimi.

    Göstergebilim açısından bir işaretler dizisi olarak mesaj ( Yunancadan setneion - işaret, işaret) - işaretlerin ve işaret sistemlerinin özelliklerini inceleyen bir bilim - üç düzeyde incelenebilir:

    1) sözdizimsel Mesajların iç özelliklerinin, yani belirli bir işaret sisteminin yapısını yansıtan işaretler arasındaki ilişkilerin dikkate alındığı yer. Dış özellikler anlamsal ve pragmatik düzeylerde incelenir. Bu seviyede, medya türü ve bilgiyi sunma yöntemi, iletim ve işleme hızı, bilgi temsil kodlarının boyutları, güvenilirlik dikkate alınarak mesajların alıcıya bir dizi karakter olarak iletilmesindeki sorunlar dikkate alınır. ve bu kodların dönüştürülmesinin doğruluğu vb., mesajların anlamsal içeriğinden ve amaçlanan amaçlarından tamamen soyutlanarak. Bu seviyede, yalnızca sözdizimsel konumlardan ele alınan bilgilere genellikle veri denir, çünkü bu durumda anlamsal taraf önemli değildir.

    Modern bilgi teorisi esas olarak bu seviyedeki sorunları araştırır. İşaretlerin kullanım sıklığının ölçüsü olan ve iletilen mesajların anlamını veya önemini hiçbir şekilde yansıtmayan “bilgi miktarı” kavramına dayanmaktadır. Bu bağlamda bazen modern bilgi teorisinin sözdizimsel düzeyde olduğu söylenir.

    2) anlamsal işaretler ile bunların ifade ettiği nesneler, eylemler, nitelikler arasındaki ilişkiyi, yani mesajın anlamsal içeriğini, bilgi kaynağıyla ilişkisini analiz eder. Anlamsal düzeydeki problemler, biçimlendirme ve iletilen bilginin anlamını dikkate alarak, nesnenin görüntüsü ile nesnenin kendisi arasındaki yazışma derecesinin belirlenmesi ile ilgilidir. Açık verilen seviye bilginin yansıttığı bilgiler analiz edilir, anlamsal bağlantılar dikkate alınır, kavramlar ve temsiller oluşturulur, bilginin anlamı, içeriği ortaya çıkarılır ve genellemesi yapılır.

    3) pragmatik mesaj ile alıcı arasındaki ilişkinin, yani mesajın tüketici içeriğinin, alıcıyla ilişkisinin dikkate alındığı yer.

    Bu düzeyde tüketicinin bu bilgiyi elde etmesi ve kullanmasının sonuçları ilgi çekicidir. Bu seviyedeki problemler, tüketicinin amacına ulaşmaya yönelik bir karar geliştirmesinde bilgiyi kullanmanın değerinin ve kullanışlılığının belirlenmesi ile ilgilidir. Buradaki temel zorluk, bilginin değerinin ve kullanışlılığının farklı alıcılar için tamamen farklı olabilmesi ve buna ek olarak, örneğin teslimatının ve kullanımının zamanında olması gibi bir dizi faktöre bağlı olmasıdır.


    Yukarıdaki bilgi aktarım sorunları seviyelerinin her biri için, bilgi miktarını ve kendi bilgi ölçümlerini ölçmeye yönelik yaklaşımlar vardır. Sırasıyla sözdizimsel seviye, anlamsal seviye ve pragmatik seviyenin bilgi ölçümleri vardır.

    Sözdizimsel düzeydeki bilgilerin ölçüleri. Bu seviyedeki bilginin niceliksel değerlendirmesi, bilginin içeriğiyle ilgili değildir, nesneyle anlamsal bir ilişki ifade etmeyen, kişisel olmayan bilgilerle çalışır. Bu bağlamda, bu tedbir değerlendirmeyi mümkün kılmaktadır. bilgi akışları Doğası gereği iletişim sistemleri kadar çeşitli nesnelerde, bilgi işlem makineleri, kontrol sistemleri, gergin sistem canlı organizma vb.

    Bilgiyi sözdizimsel düzeyde ölçmek için iki parametre tanıtılmıştır: bilgi miktarı (veri) - V d(hacimsel yaklaşım) ve bilgi miktarı - BEN(entropi yaklaşımı).

    Bilgi hacmi V d (hacimsel yaklaşım). Bilgi süreçlerini uygularken bilgi, bir alfabenin karakter kümesi olan bir mesaj biçiminde iletilir. Aynı zamanda her biri yeni karakter mesajda verilen alfabenin karakter dizisiyle temsil edilen bilgi miktarı artar. Şimdi bir karakterlik bir mesajın içerdiği bilgi miktarı bir olarak alınırsa, başka bir mesajdaki bilgi (veri) V d miktarı bu mesajdaki karakter (rakam) sayısına eşit olacaktır. Aynı bilgi birçok kişi tarafından sunulabildiğinden Farklı yollar(farklı alfabeler kullanılarak), bilgi birimi (veri) buna göre değişecektir.

    Evet, içinde ondalık sistem Matematikte bir rakamın ağırlığı 10'a eşittir ve buna göre bilgi birimi şu şekilde olacaktır: aynen (ondalık basamak P Pöyle. Örneğin dört basamaklı bir sayı olan 2009'un veri hacmi V d = 4 dit'tir.

    İkili sayı sisteminde bir rakamın ağırlığı 2'ye eşittir ve buna göre bilgi birimi şu şekilde olacaktır: biraz (bit (ikili rakam)). Bu durumda formdaki bir mesaj N-bit numarası veri miktarına sahiptir V d = P biraz. Örneğin sekiz bitlik ikili kod 11001011'in veri hacmi V d = 8 bittir.

    Modern bilgisayar Bilimi minimum veri birimiyle birlikte biraz yaygın olarak kullanılan toplu ölçü birimi bayt 8 bit'e eşittir. Bilgisayar klavye alfabesindeki 256 karakterden (256=28) herhangi birini kodlamak için gereken sekiz bittir.

    Büyük miktarda bilgiyle çalışırken, miktarını hesaplamak için daha büyük ölçü birimleri kullanılır:

    1 Kilobayt (KB) = 1024 bayt = 2 10 bayt,

    1 Megabayt (MB) = 1024 KB = 220 bayt = 1.048.576 bayt;

    1 Gigabayt (GB) = 1024 MB = 230 bayt = 1.073.741.824 bayt;

    İÇİNDE Son zamanlardaİşlenen bilgi hacmindeki artışla bağlantılı olarak türetilmiş birimler:

    1 Terabayt (TB) = 1024 GB = 240 bayt = 1.099.511.627.776 bayt;

    1 Petabayt (PB) = 1024 TB = 250 bayt = 1,125,899,906,842,624 bayt.

    İkili (bilgisayar) bilgi ölçüm sisteminde, metrik sistemin aksine, "kilo", "mega" vb. ön eklere sahip birimlerin, ana birimin 10 3 \u003d 1000 ile çarpılmasıyla elde edildiğine dikkat edilmelidir. , 10 6 \u003d 1.000.000 vb. ve 2 10 = 1024, 2 20 = 1.048.576 vb.

    Bilgi miktarı I (entropi yaklaşımı). Bilgi ve kodlama teorisinde bilginin ölçümünde entropi yaklaşımı benimsenmektedir. Bu yaklaşım, bilgi edinme gerçeğinin her zaman sistemin çeşitliliğinin veya belirsizliğinin (entropisinin) azalmasıyla ilişkili olduğu gerçeğine dayanmaktadır. Buna dayanarak, Bir mesajdaki bilgi miktarı, belirli bir sistemin mesajı aldıktan sonraki durumunun belirsizliğini azaltmaya yönelik bir önlem olarak tanımlanır. Belirsizlik, bir gözlemcinin belirli bir sistem hakkında ne kadar az şey bildiği şeklinde yorumlanabilir. Gözlemci fiziksel sistemde bir şey tespit ettiği anda sistemin entropisi azaldı ve sistem gözlemci için daha düzenli hale geldi.

    Böylece entropi yaklaşımıyla bilgi, herhangi bir süreç (testler, ölçümler vb.) sırasında ortadan kaybolan belirsizliğin niceliksel değeri olarak anlaşılmaktadır. Bu durumda entropi belirsizliğin bir ölçüsü olarak tanıtılır. H ve bilgi miktarı:

    I = H nis – H apr

    burada, H apr - incelenen sistemin veya sürecin durumuna ilişkin a priori entropi;

    H aps a posteriori entropidir.

    Bir posteriori (enlemden itibaren a posteriori - aşağıdakilerden) - deneyimden kaynaklanan (testler, ölçümler).

    Önsel (enlemden itibaren a priori - öncekinden) deneyimden (testten) önce gelen ve ondan bağımsız olan bilgiyi karakterize eden bir kavramdır.

    Test sırasında mevcut belirsizliğin ortadan kaldırılması durumunda (belirli bir sonuç elde edildi, yani H = 0), alınan bilgi miktarı başlangıçtaki entropi ile çakışır

    İncelenen sistem olarak ayrı bir bilgi kaynağını (ayrı mesajların kaynağı) ele alalım; bununla sınırlı sayıda olası durumlara sahip bir fiziksel sistemi kastediyoruz ( bir ben}, Ben = .

    Her şey hazır A \u003d (a 1, a 2, ... ve n) Bilgi teorisinde sistemin durumlarına soyut alfabe veya mesaj kaynağının alfabesi denir.

    Ayrı Eyaletler a 1 , a 2 ,..., a n alfabenin harfleri veya simgeleri denir.

    Böyle bir sistem, zamanın her anında olası durumların sonlu kümelerinden birini rastgele alabilir. bir ben. Kaynağın kendi tercihi sonucu farklı hallerin gerçekleştiği söylenmektedir.

    Bilginin (mesajın) alıcısı, belirli olayların olası oluşumu hakkında belirli bir fikre sahiptir. Bu temsiller genellikle güvenilmezdir ve şu veya bu olayı beklediği olasılıklarla ifade edilir. Genel ölçü belirsizlik (entropi), bu olasılıklara bazı matematiksel bağımlılıklarla karakterize edilir, mesajdaki bilgi miktarı, mesajın alınmasından sonra belirsizlik ölçüsünün ne kadar azaldığına göre belirlenir.

    Bu fikri bir örnekle açıklayalım.

    32 farklı kartımız olduğunu varsayalım. Desteden bir kart seçme olasılığı 32'dir. Bir seçim yapmadan önce, belirli bir kartı seçme şansının tüm kartlar için aynı olduğunu varsaymak doğaldır. Seçim yaparak bu belirsizliği ortadan kaldırıyoruz. Bu durumda belirsizlik, olası eş olasılıklı seçimlerin sayısıyla karakterize edilebilir. Şimdi bilgi miktarını belirsizliğin ortadan kaldırılmasının bir ölçüsü olarak tanımlarsak, seçim sonucunda elde edilen bilgi 32 sayısı ile karakterize edilebilir. Ancak bu sayının kendisini değil, 32 sayısını kullanmak daha uygundur. Yukarıda 2 tabanında elde edilen tahminin logaritması:

    burada m olası eşit olasılıklı seçimlerin sayısıdır (m=2 olduğunda bilgiyi bir bitte alırız). Yani bizim durumumuzda

    H = log 2 32 = 5.

    Belirtilen yaklaşım İngiliz matematikçi R. Hartley'e (1928) aittir. İlginç bir yorumu var. Kişinin hangi kartı seçtiğini belirlemenize olanak tanıyan "evet" veya "hayır" yanıtlı soruların sayısıyla karakterize edilir. 5 soru yeterli.

    Bir kart seçerken, her kartın ortaya çıkma olasılığı aynı değilse (çok olasılıklı), o zaman C. Shannon (1948) tarafından önerilen bilgilerin ölçümüne yönelik istatistiksel bir yaklaşım elde ederiz. Bu durumda bilginin ölçüsü şu formülle ölçülür:

    Nerede pi- seçim olasılığı Ben alfabenin inci karakteri.

    Olasılıklar varsa bunu görmek kolaydır p1, ..., pn eşitse her biri 1/H ve Shannon'ın formülü Hartley'nin formülüne dönüşür.

    Anlamsal düzeyde bilgi ölçüleri. Bilginin anlamsal içeriğini, yani kişi başına miktarını ölçmek için anlam düzeyi En yaygın olanı, bilginin anlamsal özelliklerini kullanıcının gelen bir mesajı alma yeteneği ile birleştiren eş anlamlılar ölçüsüdür. Aslında alınan bilginin anlaşılabilmesi ve kullanılabilmesi için alıcının belli bir bilgiye sahip olması gerekmektedir. Konunun tamamen cehaleti, alınan mesajdan bu konuyla ilgili yararlı bilgilerin çıkarılmasına izin vermez. Bir konu hakkında bilgi arttıkça bilgi sahibi olanların sayısı da artar. kullanışlı bilgi Mesajdan alıntıdır.

    Alıcının belirli bir konu hakkındaki bilgisine eş anlamlılar sözlüğü (yani anlamsal ilişkilerle birbirine bağlanan belirli bir dizi kelime, kavram, nesne adı) dersek, belirli bir mesajın içerdiği bilgi miktarı, değişimin derecesine göre tahmin edilebilir. bu mesajın etkisi altındaki bireysel eş anlamlılar sözlüğünde.

    Eş anlamlılar sözlüğü- Bir kullanıcının veya sistemin sahip olduğu bir dizi bilgi.

    Başka bir deyişle, alıcının gelen mesajlardan çıkardığı anlamsal bilginin miktarı, eş anlamlılar sözlüğünün bu tür bilgilerin algılanmasına hazırlık derecesine bağlıdır.

    Bilginin anlamsal içeriği arasındaki ilişkiye bağlı olarak S ve kullanıcının eş anlamlılar sözlüğü Sp anlamsal bilgi miktarı değişir Dır-dir, kullanıcı tarafından algılanır ve gelecekte onun tarafından eş anlamlılar sözlüğüne dahil edilir. Bu bağımlılığın doğası Şekil 2'de gösterilmektedir. 2.1. Anlamsal bilgi miktarının (Ic) 0'a eşit olduğu iki sınırlayıcı durumu düşünün:

    a) Sp = 0 olduğunda kullanıcı gelen bilgiyi algılamaz (anlamaz);

    b) S -> ∞ için kullanıcı “her şeyi bilir” ve gelen bilgiye ihtiyacı yoktur.

    Pirinç. 1.2. Anlamsal bilgi miktarının bağımlılığı,

    tüketici tarafından eş anlamlılar sözlüğünden algılandı ben c \u003d f (S p)

    Tüketici, anlamsal içeriğini S, eş anlamlılar sözlüğü S p (S = S p opt) ile koordine ederken, gelen bilgiler kullanıcı için anlaşılabilir olduğunda ve ona daha önce bilinmeyen (eş anlamlılar sözlüğünde eksik olan) bilgileri getirdiğinde maksimum miktarda anlamsal bilgi elde eder.

    Dolayısıyla mesajdaki anlamsal bilgi miktarı, yani kullanıcının aldığı yeni bilgi miktarı göreceli bir değerdir. Aynı mesaj yetkin bir kullanıcı için anlamlı olabilirken, beceriksiz bir kullanıcı için anlamsız olabilir.

    Bilginin semantik (anlamlı) yönünü değerlendirirken S ve Sp değerlerinin uyumlaştırılması için çabalamak gerekir.

    Anlamsal bilgi miktarının göreceli bir ölçüsü, anlamsal bilgi miktarının hacmine oranı olarak tanımlanan içerik faktörü C olabilir:

    C \u003d I s / V d

    Pragmatik düzeyde bilgi ölçümleri. Bu ölçüm, bilginin kullanıcının hedefine ulaşmadaki kullanışlılığını belirler. Bu ölçü aynı zamanda bu bilginin belirli bir sistemde kullanılmasının özelliklerinden dolayı göreceli bir değerdir.

    İlk Rus bilim adamlarından biri olan A.A. Bilginin değerinin bir ölçüsü olarak hedefe ulaşmak için gerekli bilgi miktarını almayı, yani hedefe ulaşma olasılığındaki artışı hesaplamayı öneren Kharkevich. Dolayısıyla, bilgi almadan önce hedefe ulaşma olasılığı p 0'a eşitse ve aldıktan sonra - p 1 ise, bilginin değeri p 1 / p 0 oranının logaritması olarak belirlenir:

    I \u003d günlük 2 p 1 - günlük 2 p 0 \u003d günlük 2 (p 1 / p 0)

    Böylece bilginin değeri bilgi birimleriyle, bu durumda bitlerle ölçülür.

    BİLGİ İLETİM SORUNLARININ DÜZEYLERİ

    Bilgi süreçlerini gerçekleştirirken, bilgi kaynağından alıcıya (alıcıya) her zaman uzay ve zamanda bir bilgi aktarımı söz konusudur. Aynı zamanda, bilgiyi iletmek için, örneğin doğal veya yapay (resmi) dil gibi çeşitli işaretler veya semboller kullanılır ve bunun mesaj adı verilen bir biçimde ifade edilmesine olanak tanır.

    İleti- iletim için kullanılan bir dizi işaret (sembol) biçimindeki bilgi temsili biçimi.

    Göstergebilim açısından bir dizi işaret olarak mesaj (Yunancadan. semiion- işaret, işaret) - işaretlerin ve işaret sistemlerinin özelliklerini inceleyen bir bilim - üç düzeyde incelenebilir:

    1) sözdizimsel, mesajların iç özelliklerinin, yani belirli bir işaret sisteminin yapısını yansıtan işaretler arasındaki ilişkilerin dikkate alındığı yer. Dış özellikler anlamsal ve pragmatik düzeylerde incelenir;

    2) anlamsal, işaretlerin işaret ettiği nesneler, eylemler, nitelikler arasındaki ilişkinin, yani mesajın anlamsal içeriğinin, bilgi kaynağıyla ilişkisinin analiz edildiği yer;

    3) pragmatik, mesaj ile alıcı arasındaki ilişkinin, yani mesajın tüketici içeriğinin, alıcıyla ilişkisinin dikkate alındığı yer.

    Böylece, bilgi aktarımı sorunları ile işaret sistemlerinin çalışma düzeyleri arasındaki belirli bir ilişki dikkate alınarak bunlar üç düzeye ayrılır: sözdizimsel, anlamsal ve pragmatik.

    Sorunlar söz dizimi düzeyi inşaat için teorik temellerin oluşturulmasıyla ilgili bilgi sistemi Ana performans göstergeleri mümkün olan maksimum seviyeye yakın olacak ve aynı zamanda iyileştirmeler yapacaktır. mevcut sistemler kullanım verimliliğini artırmak amacıyla. Bu saf teknik problemlerİletişim yöntemlerinin iyileştirilmesi ve bunların malzeme taşıyıcıları- sinyaller. Bu seviyede, medya türü ve bilgiyi sunma yöntemi, iletim ve işleme hızı, bilgi temsil kodlarının boyutları, güvenilirlik dikkate alınarak mesajların alıcıya bir dizi karakter olarak iletilmesindeki sorunlar dikkate alınır. ve bu kodların dönüştürülmesinin doğruluğu vb., mesajların anlamsal içeriğinden ve amaçlanan amaçlarından tamamen soyutlanarak. Bu seviyede, yalnızca sözdizimsel konumlardan ele alınan bilgilere genellikle veri denir, çünkü bu durumda anlamsal taraf önemli değildir.

    Modern bilgi teorisi esas olarak bu seviyedeki sorunları araştırır. İşaretlerin kullanım sıklığının ölçüsü olan ve iletilen mesajların anlamını veya önemini hiçbir şekilde yansıtmayan “bilgi miktarı” kavramına dayanmaktadır. Bu bağlamda bazen modern bilgi teorisinin sözdizimsel düzeyde olduğu söylenir.

    Sorunlar anlam düzeyi resmileştirme ile bağlantılıdır ve iletilen bilginin anlamı dikkate alınarak, nesnenin görüntüsü ile nesnenin kendisi arasındaki yazışma derecesi belirlenir. Bu düzeyde bilginin yansıttığı bilgiler analiz edilir, anlamsal bağlantılar dikkate alınır, kavram ve fikirler oluşturulur, bilginin anlamı ve içeriği ortaya çıkarılır ve genelleştirilmesi gerçekleştirilir.

    Bilginin semantik içeriği herhangi bir dilde sunulan mesajın semantiğinden ziyade alıcıya bağlı olduğundan, bu seviyedeki problemler son derece karmaşıktır.

    Pragmatik düzeyde, bu bilginin tüketici tarafından elde edilmesinin ve kullanılmasının sonuçları ilgi çekicidir. Bu seviyedeki problemler, tüketicinin amacına ulaşmaya yönelik bir karar geliştirmesinde bilgiyi kullanmanın değerinin ve kullanışlılığının belirlenmesi ile ilgilidir. Buradaki temel zorluk, bilginin değerinin ve kullanışlılığının farklı alıcılar için tamamen farklı olabilmesi ve buna ek olarak, örneğin teslimatının ve kullanımının zamanında olması gibi bir dizi faktöre bağlı olmasıdır. Bilgi dağıtım hızına yönelik yüksek gereksinimler, genellikle kontrol eylemlerinin gerçek zamanlı olarak, yani kontrol edilen nesnelerin veya süreçlerin durumundaki değişim hızında gerçekleştirilmesi gerektiği gerçeğiyle belirlenir. Bilgilerin iletilmesi veya kullanılmasındaki gecikmeler felaketle sonuçlanabilir.

    Konu 2. Bilgisayarda bilgilerin temsili ve işlenmesinin temelleri

    Edebiyat

    1. İktisatta Bilişim: Ders Kitabı / Ed. OLMAK. Odintsova, A.N. Romanova. - M .: Vuzovsky ders kitabı, 2008.

    2. Bilişim: Temel ders: Ders Kitabı / Ed. S.V. Simonoviç. - St.Petersburg: Peter, 2009.

    3. Bilgisayar bilimi. Genel kurs: Ders Kitabı / Ortak yazar: A.N. Guda, M.A. Butakova, N.M. Nechitailo, A.V. Çernov; Toplamın altında ed. VE. Kolesnikov. – M.: Dashkov i K, 2009.

    4. İktisatçılar için bilişim: Ders Kitabı / Ed. Matyushka V.M. - M .: Infra-M, 2006.

    5. Ekonomik bilişim: Bilgi sistemlerinin ekonomik analizine giriş - M.: INFRA-M, 2005.

    Bilgi ölçüleri (sözdizimsel, anlamsal, pragmatik)

    Bilgiyi ölçmek için kullanılabilir Farklı yaklaşımlar ama en yaygın olanı istatistiksel(olasılıksal), anlamsal ve n ragmatik yöntemler.

    İstatistiksel Bilgiyi ölçmenin (olasılıksal) yöntemi, 1948'de bilgi miktarını, bilgi edinmenin bir sonucu olarak kaldırılan sistemin durumunun belirsizliğinin bir ölçüsü olarak düşünmeyi öneren K. Shannon tarafından geliştirilmiştir. Ölçülmüş belirsizliğe entropi denir. Eğer gözlemci bir mesaj aldıktan sonra bunu anlarsa Ek Bilgiler sistem hakkında X, belirsizlik azalır. Alınan ek bilgi miktarı şu şekilde tanımlanır:

    sistem hakkında ek bilgi nerede X mesaj şeklinde alındı;

    Sistemin başlangıç ​​belirsizliği (entropisi) X;

    Sistemin sonlu belirsizliği (entropisi) X, mesajın alınmasından sonra.

    Eğer sistem X sayısı ayrık durumlardan birinde olabilir N ve her birinde sistemi bulma olasılığı eşittir ve tüm durumların olasılıklarının toplamı bire eşittir, bu durumda entropi Shannon formülü ile hesaplanır:

    X sisteminin entropisi nerede;

    A- bilginin ölçüm birimini belirleyen logaritmanın tabanı;

    N– sistemin yerleştirilebileceği durumların (değerlerin) sayısı.

    Entropi pozitif bir değerdir ve olasılıklar her zaman birden küçük olduğundan ve logaritmaları negatif olduğundan, K. Shannon formülündeki eksi işareti entropiyi pozitif yapar. Böylece aynı entropi, fakat zıt işaretle, bilgi miktarının ölçüsü olarak alınır.

    Bilgi ile entropi arasındaki ilişki şu şekilde anlaşılabilir: Bilginin elde edilmesi (artması) aynı anda cehaletin veya bilgi belirsizliğinin (entropi) azalması anlamına gelir.

    Dolayısıyla istatistiksel yaklaşım, mesajların ortaya çıkma olasılığını hesaba katar: daha az olası olan mesaj daha bilgilendirici olarak kabul edilir; en az beklenen. Bilgi miktarına ulaşıldı maksimum değer eğer olaylar eşit derecede muhtemelse.

    R. Hartley bilgiyi ölçmek için aşağıdaki formülü önerdi:

    ben=log2n ,

    Nerede N- eşit olasılıklı olayların sayısı;

    BEN- aşağıdakilerden birinin meydana gelmesiyle ilgili mesajdaki bilginin ölçüsü N olaylar

    Bilginin ölçümü hacmiyle ifade edilir. Çoğu zaman hacimle ilgilidir bilgisayar hafızası ve iletişim kanalları üzerinden iletilen veri miktarı. Bir birim, belirsizliğin yarıya indirildiği miktardaki bilgi olarak alınır; böyle bir bilgi birimine denir. biraz .

    Hartley formülünde logaritmanın tabanı olarak doğal logaritma () kullanılıyorsa, bilgi birimi şu şekildedir: nat ( 1 bit = ln2 ≈ 0,693 nat). Logaritmanın tabanı olarak 3 sayısı kullanılırsa, o zaman - basmakalıp 10 ise o zaman - aynen (hartley).

    Uygulamada daha büyük bir birim daha sık kullanılır - bayt(bayt) sekiz bittir. Bu birim, bilgisayar klavye alfabesindeki 256 karakterden (256=28) herhangi birini kodlamak için kullanılabildiği için seçilmiştir.

    Baytlara ek olarak bilgiler yarım kelimeler (2 bayt), kelimeler (4 bayt) ve çift kelimeler (8 bayt) olarak ölçülür. Daha büyük bilgi birimleri de yaygın olarak kullanılmaktadır:

    1 Kilobayt (KB - kilobayt) = 1024 bayt = 2 10 bayt,

    1 megabayt (MB - megabayt) = 1024 KB = 2 20 bayt,

    1 Gigabayt (GB - gigabayt) = 1024 MB = 2 30 bayt.

    1 Terabayt (TB - terabayt) = 1024 GB = 2 40 bayt,

    1 Petabayt (PB - petabayt) = 1024 TB = 2 50 bayt.

    1980 yılında Rus matematikçi Yu.Manin, inşa etme fikrini önerdi. kuantum bilgisayarı, bununla bağlantılı olarak böyle bir bilgi birimi vardı kübit ( kuantum biti, kübit ) - "kuantum biti" - örneğin elektronların dönüşleri gibi kuantum taşıyıcıları kullanan bir bilgisayarın teorik olarak mümkün olan biçimindeki bellek miktarının ölçüsü. Bir kübit iki farklı değeri ("0" ve "1") değil, iki temel dönüş durumunun normalleştirilmiş kombinasyonlarına karşılık gelen birkaç değeri alabilir; Daha olası kombinasyonlar. Böylece 32 kübit yaklaşık 4 milyar durumu kodlayabiliyor.

    anlamsal yaklaşım. Veri miktarını değil de mesajda ihtiyaç duyulan bilgi miktarını belirlemek istiyorsanız sözdizimsel bir ölçü yeterli değildir. Bu durumda, bilginin içeriğini belirlemeye olanak tanıyan anlamsal yön dikkate alınır.

    Bilginin anlamsal içeriğini ölçmek için alıcının (tüketici) eş anlamlılar sözlüğünü kullanabilirsiniz. Eş anlamlılar sözlüğü yöntemi fikri N. Wiener tarafından önerildi ve yerli bilim adamımız A.Yu tarafından geliştirildi. Schrader.

    eş anlamlılar sözlüğü isminde bilgi gövdesi bilginin alıcısı tarafından tutulur. Eş anlamlılar sözlüğünü alınan mesajın içeriğiyle ilişkilendirmek, belirsizliği ne kadar azalttığını bulmanızı sağlar.

    Mesajın anlamsal bilgi miktarının alıcının eş anlamlılar sözlüğüne bağımlılığı

    Grafikte gösterilen bağımlılığa göre, kullanıcının herhangi bir eş anlamlılar sözlüğüne sahip olmaması (gelen mesajın özüne ilişkin bilgisi yani = 0) veya bu eş anlamlılar sözlüğünün varlığı sonucunda değişmemiş olması mesaj (), o zaman içindeki anlamsal bilgi miktarı sıfıra eşittir. En uygun eş anlamlılar sözlüğü (), anlamsal bilgi miktarının maksimum () olacağı şekilde olacaktır. Örneğin, gelen bir mesajdaki anlamsal bilgiler bilmediğiniz yabancı dil sıfır olacak ama durum aynı olacak mesaj artık haber değilse,çünkü kullanıcı zaten her şeyi biliyor.

    pragmatik ölçü bilgi kullanışlılığını belirler Tüketicinin hedeflerine ulaşmasında. Bunun için mesajı almadan önce ve aldıktan sonra hedefe ulaşma olasılığını belirleyip bunları karşılaştırmak yeterlidir. Bilginin değeri (A.A. Kharkevich'e göre) aşağıdaki formülle hesaplanır:

    mesajı almadan hedefe ulaşma olasılığı nerede;

    Mesajın alınması hedef alanına ulaşma olasılığı;