• Úrovně a struktura ekonomických informací. Syntaktická, sémantická a pragmatická rovina ekonomických informací. Sémantický způsob měření informace: podstata, základní pojmy a vlastnosti

    za stát v průměru tzv entropie diskrétního zdroje informací

    spojení.

    H p i logp i

    já 1 N

    Pokud se opět zaměříme na měření nejistoty v binárních jednotkách, pak by měl být základ logaritmu brán rovný dvěma.

    H p ilog 2 p i

    já 1 N

    Ve stejně pravděpodobných volbách všichni

    plogovat

    a vzorec (5) se transformuje na vzorec (2) R. Hartleyho:

    1 log2

    Nlog2

    Navrhované opatření se ne náhodou nazývalo entropie. Jde o to, že formální struktura výrazu (4) se shoduje s entropií fyzikálního systému, již dříve definoval Boltzmann. Podle druhého termodynamického zákona je entropie uzavřeného prostoru určena výrazem

    P i 1

    pak růst

    lze napsat jako

    soubor

    já 1 N

    Tento vzorec se zcela shoduje s (4)

    V obou případech hodnota charakterizuje míru diverzity systému.

    Pomocí vzorců (3) a (5) je možné určit redundanci abecedy zdroje zprávy

    Což ukazuje, jak racionálně se používají symboly této abecedy:

    ) je maximální možná entropie určená vzorcem (3);

    () - entropie

    zdroj, určený vzorcem (5).

    Podstatou tohoto opatření je, že při stejně pravděpodobné volbě lze zajistit stejnou informační zátěž na znak pomocí abecedy menšího objemu než v případě neekvipravděpodobné volby.

    Míry informace na sémantické úrovni

    K měření sémantického obsahu informace, tzn. jeho množství za sémantickou úroveň, nejrozšířenější je míra tezauru, která spojuje sémantické vlastnosti informace se schopností uživatele přijímat příchozí zprávu. Aby příjemce porozuměl a použil přijaté informace, musí mít určité znalosti. Úplná neznalost předmětu neumožňuje extrahovat užitečné informace z přijaté zprávy o tomto předmětu. S rostoucími znalostmi o předmětu roste i jejich počet užitečné informace Vytažené ze zprávy.

    Nazveme-li znalosti příjemce o tomto předmětu „tezaurus“ (tj. určitý soubor slov, pojmů, názvů objektů spojených sémantickými vztahy), pak lze množství informací obsažených v určitém sdělení odhadnout podle stupně změna v individuálním tezauru pod vlivem tohoto sdělení .

    Tezaurus je soubor informací, které má uživatel nebo systém.

    Jinými slovy, množství sémantických informací extrahovaných příjemcem z příchozích zpráv závisí na stupni připravenosti jeho tezauru na vnímání takové informace.

    V závislosti na vztahu mezi sémantickým obsahem informace a tezaurem uživatele se mění množství sémantických informací vnímaných uživatelem a následně zahrnutých do jeho tezauru. Povaha této závislosti je znázorněna na obrázku 3. Uvažujme dva omezující případy, kdy se množství sémantické informace rovná

    Obrázek 3 - Závislost množství sémantické informace vnímané spotřebitelem na jeho tezauru ()

    Spotřebitel získává maximální množství sémantických informací se souhlasem

    koordinace jeho sémantického obsahu s jeho tezaurem (), kdy jsou příchozí informace pro uživatele srozumitelné a přinášejí mu dříve neznámé (v jeho tezauru chybí) informace.

    Proto je množství sémantických informací ve zprávě, množství nových znalostí přijatých uživatelem, relativní hodnotou. Stejná zpráva může mít význam pro kompetentního uživatele a být bezvýznamná pro nekompetentního uživatele.

    Při hodnocení sémantického (obsahového) aspektu informace je nutné usilovat o harmonizaci hodnot a.

    Relativní mírou množství sémantické informace může být obsahový faktor, který je definován jako poměr množství sémantické informace k jejímu objemu:

    Jiný přístup k sémantická hodnocení informace vyvinuté v rámci vědy spočívají v tom, že počet odkazů na ně v jiných dokumentech je brán jako hlavní ukazatel sémantické hodnoty informace obsažené v analyzovaném dokumentu (vzkazu, publikaci). Specifické ukazatele jsou tvořeny na základě statistického zpracování počtu odkazů v různých vzorcích.

    Informační opatření na pragmatické úrovni

    Toto měřítko určuje užitečnost informace (hodnoty) pro dosažení cíle uživatele. Je to také relativní hodnota, vzhledem ke zvláštnostem použití těchto informací v konkrétním systému.

    Tímto problémem se zabýval A. A. Charkevich, jeden z prvních domácích vědců, který navrhl vzít jako měřítko hodnoty informace množství informací nutné k dosažení cíle, tzn. vypočítat přírůstek pravděpodobnosti dosažení cíle. Takže když

    Hodnota informace se tedy měří v jednotkách informace, v tento případ v bitech.

    Výraz (7) lze považovat za výsledek normalizace počtu výsledků. Vysvětlení na obrázku 4 ukazuje tři schémata, ve kterých stejné hodnoty počet výsledků je 2 a 6 pro body 0 a 1, resp. Počáteční pozice- bod 0. Na základě přijatých informací se přejde do bodu 1. Cíl je označen křížkem. Příznivé výsledky jsou znázorněny jako čáry vedoucí k cíli. Pojďme určit hodnotu přijatých informací ve všech třech případech:

    a) počet příznivých výsledků je tři:

    a tudíž

    b) existuje jeden příznivý výsledek:

    c) počet příznivých výsledků je čtyři:

    V příkladu b) se získá záporná hodnota informace (negativní informace). Takové informace, které zvyšují počáteční nejistotu a snižují pravděpodobnost dosažení cíle, se nazývají dezinformace. V příkladu b) jsme tedy dostali dezinformaci 1,58 binárních jednotek.

    Tato míra množství informací operuje s neosobní informací, která nevyjadřuje sémantický vztah k objektu. Na syntaktické úrovni se zohledňuje typ média a způsob prezentace informace, rychlost přenosu a zpracování a velikosti kódů pro prezentaci informace.

    Objem dat(V D) se rozumí v technickém smyslu slova jako informační objem zprávy nebo jako velikost paměti potřebná k uložení zprávy bez jakýchkoli změn.

    Objem informací zprávy se měří v bitů a rovná se číslu binární číslice(„0“ a „1“), které kódovaly zprávu.

    V počítačová praxe slovo „bit“ se také používá jako měrná jednotka pro množství paměti. 1bitová paměťová buňka může být ve dvou stavech („zapnuto“ a „vypnuto“) a lze do ní zapsat jednu binární číslici (0 nebo 1). Je jasné, že bit je příliš malá jednotka informace, proto se používají její násobky. Základní jednotkou měření informace je byte. 1 bajt se rovná 8 bitům. Do buňky o velikosti 1 bajtu můžete vložit 8 binárních číslic, to znamená, že do jednoho bajtu můžete uložit 256 = 2 8 různých čísel. Pro měření ještě většího množství informací se používají následující veličiny:

    Příklad 1Je důležité mít představu o tom, kolik informací pojme kilobajt, megabajt nebo gigabajt.

    · Na binární kódování text každé písmeno, interpunkční znaménko, mezera zabírají 1 bajt.

    · Na stránce knihy středního formátu je asi 50 řádků, každý řádek má přibližně 60 znaků, takže zcela vyplněná stránka má objem 50 x 60 = 3000 bajtů ≈3 kilobajty.

    · Celá kniha středního formátu zabírá ≈ 0,5 MB. Jedno číslo čtyřstránkových novin - 150 kilobajtů. Pokud člověk mluví 8 hodin denně bez přestávky, tak si za 70 let řekne asi 10 gigabajtů informací.

    · Jeden černobílý rámeček (při 32 gradacích jasu každého bodu) obsahuje přibližně 300 Kb informací, barevný rámeček již obsahuje asi 1 Mb informací.

    · Televizní film v délce 1,5 hodiny při 25 snímcích za sekundu – 135 GB.

    Množství informací na syntaktické úrovni je definována prostřednictvím konceptu entropie systému.

    Nechte spotřebitele mít nějaké předběžné (a priori) informace o systému α, než tyto informace obdrží. Mírou jeho neznalosti o systému je funkce H(α), tzv entropie systému, který zároveň slouží jako měřítko nejistoty stavu systému.

    Po obdržení nějaké zprávy β příjemce nějakou získal Dodatečné informace I β (α), čímž se snížila jeho apriorní neznalost tak, že nejistota stavu systému po přijetí zprávy β se stala H β (α).

    Potom je množství informace I β (α) ξ do systému přijaté ve zprávě β definováno jako

    Ip(a)=H(a)-Hp(a).

    těch. množství informace se měří změnou (poklesem) nejistoty stavu systému. Pokud konečná nejistota H β (α) zmizí, pak původní neúplná znalost bude nahrazena znalostí úplnou a množstvím informace I β (α)=H(α). Jinými slovy, systémovou entropii H(a) lze považovat za míru chybějící informace.

    Entropie H(α) systému α, který má N možných stavů podle Shannonova vzorce, je rovna:

    kde P i je pravděpodobnost, že se systém nachází i-tý stát. Pro případ, kdy jsou všechny stavy systému stejně pravděpodobné, tzn. jejich pravděpodobnosti jsou rovny P i =, jeho entropie je určena vztahem

    Příklad 2. Informace jsou často kódovány číselnými kódy v té či oné číselné soustavě, to platí zejména při prezentaci informací v počítači. Přirozeně stejný počet číslic různé systémy zúčtování může zprostředkovat jiné číslo stavy zobrazeného objektu, které lze znázornit jako poměr

    kde N je počet možných zobrazených stavů;
    m - základ číselné soustavy (různé symboly používané v abecedě);
    n je počet bitů (znaků) ve zprávě.

    Předpokládejme, že komunikačním kanálem je přenášena n-bitová zpráva používající m různých symbolů. Protože počet možných kombinací kódů bude N = m", pak se stejnou pravděpodobností výskytu kterékoli z nich bude množství informací získaných předplatitelem v důsledku přijetí zprávy

    I = log N = n log m - Hartleyův vzorec.

    Pokud vezmeme m jako základ logaritmu, pak I = n. V tomto případě se množství informací (za předpokladu úplné a priori neznalosti obsahu zprávy účastníkem) bude rovnat množství dat I=VD přijatých přes komunikační kanál.

    Nejčastěji používané jsou binární a dekadické logaritmy. Jednotky měření v těchto případech budou resp bit A dit.

    Součinitel(stupeň) informativní (stručnost) zprávy je dána poměrem množství informací k množství dat, tzn.

    S nárůstem Y klesá objem práce na transformaci informací (dat) v systému. Usilují proto o zvyšování informačního obsahu, k čemuž se vyvíjejí speciální metody optimálního kódování informací.

    Konec práce -

    Toto téma patří:

    Přednáška 1. Úvod. Pojem informatiky

    Struktura informatiky.. Informatika v širokém slova smyslu je jednotou různorodých.. Informatika v užším slova smyslu může být reprezentována jako složená ze tří vzájemně souvisejících částí technických prostředků.

    Pokud potřebujete další materiál k tomuto tématu nebo jste nenašli to, co jste hledali, doporučujeme použít vyhledávání v naší databázi prací:

    Co uděláme s přijatým materiálem:

    Pokud se tento materiál ukázal být pro vás užitečný, můžete jej uložit na svou stránku na sociálních sítích:

    Všechna témata v této sekci:

    Pojem informatiky
    Pojem informatika vznikl v 60. letech 20. století. ve Francii za název oboru automatizovaného zpracování informací pomocí elektronických počítačů. francouzština

    Informační společnost
    informační kultura- schopnost cílevědomě pracovat s informacemi a využívat je k příjmu, zpracování a přenosu počítačem informační technologie, moderní

    Historie vývoje trhu informačních služeb
    Od poloviny 50. let. začalo vytváření stabilního trhu informační služby. Hlavními poskytovateli informačních služeb byli: informační služby akademické, odborné a vědecké

    Informace, zprávy, signály
    Informace jsou spolu s hmotou a energií primárním pojmem našeho světa, a proto je nelze definovat v přísném smyslu. Můžeme uvést pouze jeho hlavní vlastnosti, například:

    Sémantická míra informace
    K měření sémantického obsahu informace, tzn. její kvantita na sémantické úrovni, tezaurická míra, která spojuje sémantické vlastnosti informace se sp.

    Pragmatická míra informací
    Toto opatření určuje užitečnost informace (hodnoty) pro uživatele k dosažení dodávaného řetězce. Tato míra je také relativní hodnotou vzhledem ke zvláštnostem použití těchto informací.

    Kvalitativní charakteristiky informací
    Možnost a efektivitu využití informací určují jejich hlavní spotřebitelské kvalitativní ukazatele, jako je reprezentativnost, obsah, dostatečná

    Kódování textových informací
    V současné době většina uživatelů používá ke zpracování počítač textové informace, který se skládá ze symbolů: písmen, číslic, interpunkčních znamének atd. Tradičně pro

    Kódování grafických informací
    Grafické informace mohou být reprezentovány ve dvou formách: analogové nebo diskrétní. Obraz, jehož barva se neustále mění, je

    Bitmapa
    Pomocí lupy vidíte, že černobílý grafický obrázek, například z novin, se skládá z drobných teček, které tvoří určitý vzor - rastr. Ve Francii v 19. stol

    Model CMYK
    Tento model je založen na subtraktivní reprodukci barev (charakteristické pro reflexní předměty). Každá z primárních barev je spojena s další barvou (doplňuje primární barvu

    Grafické režimy
    Existuje několik režimů znázornění barevné grafiky: Plně barevná (True Color) - pro zakódování jasu každé ze složek se používá 256 hodnot (osm binárních číslic

    Vektorové a fraktální obrázky
    vektorový obrázek je grafický objekt skládající se z elementárních segmentů a oblouků. Základním prvkem obrázku je čára. Jako každý předmět má

    Kódování zvuku
    Uchem člověk vnímá elastické vlny s frekvencí někde v rozsahu od 16 Hz do 20 kHz (1 Hz - 1 kmit za sekundu). V souladu s tím elastické vlny v jakémkoli prostředí, jehož frekvence jsou l

    Digitálně-analogový a analogově-digitální převod zvukových informací
    Zvukové vlny jsou pomocí mikrofonu převedeny na analogovou proměnnou. elektrický signál. Vstupuje do analogově-digitálního převodníku (ADC) - zařízení, které převádí signál na digitální

    Parametry vzorkování
    Frekvence - počet měření amplitudy analogový signál za sekundu. Pokud vzorkovací frekvence není větší než dvojnásobek frekvence horní hrany

    Komprese informací
    Kódování je rozděleno do tří velké skupiny- komprese (efektivní kódy), kódování opravující chyby a kryptografie. Kódy určené ke kompresi informací jsou rozděleny podle pořadí na

    Bezeztrátová komprese
    Jeden z nejvíce jednoduchými způsoby komprese informací - skupinové kódování. V souladu s tímto schématem je řada opakujících se hodnot (například číslo) nahrazena jednou hodnotou

    Ztrátová komprese
    používá se k balení grafické obrázky. Tato metoda je založena na zvláštnostech lidského vnímání obrazů. Pro lidské oko je jas důležitější než informace o barvě.

    Informační revoluce
    V historii vývoje civilizace jich bylo několik informační revoluce- proměny společenských vztahů v důsledku zásadních změn v oblasti zpracování informací. V důsledku těchto transformací

    Pojem informačního systému
    Systémem se rozumí jakýkoli objekt, který je současně považován za jeden celek i za soubor heterogenních prvků spojených v zájmu dosažení stanovených cílů. Systémy

    Etapy vývoje informačních systémů
    Historii vývoje informačních systémů a účel jejich využití pro různá období uvádí Tabulka 1: Tabulka 1. Změna přístupu k využívání informačních systémů

    Procesy v IS
    Procesy, které zajišťují provoz IS libovolné hodnoty, lze podmíněně znázornit formou diagramu. IS se skládá z bloků: vstup informací z externích nebo interních zdrojů;

    Struktura informačního systému
    Obecná struktura IS lze bez ohledu na rozsah považovat za soubor subsystémů. Strukturu libovolného IS lze tedy znázornit následovně.

    IT zastaralost
    Pro IT je zcela přirozené, že zastarávají a jsou nahrazovány novými. Příklad. Ke změně technologie dávkové zpracování programy na hlavním počítači ve výpočetním středisku přišlo technolo

    Metodika využití IT
    Centralizované zpracování informací na počítačích výpočetních středisek bylo první historicky vyvinutou technologií. Velký výpočetní střediska(VC) kolektivní použití

    Příkazový systém počítače je soubor příkazů, které může daný počítač provádět.
    Posloupnost příkazů nabízených počítačem k provedení se nazývá program. Navzdory rozmanitosti moderní počítače jejich struktura je založena na společné logice

    Hlavní bloky PC a jejich význam
    Rýže. Strukturální schéma osobní počítač Mikroprocesor (MP). Je to centrální

    Expanzní autobusy
    ISA (Industry Standard Architecture) sběrnice - 16bitová datová sběrnice a 24bitová adresová sběrnice, pracovní frekvence 16 MHz, ale může

    Místní autobusy
    Místní autobusy jsou připojeny přímo ke sběrnici MP, pracují na hodinové frekvenci MP a zajišťují komunikaci s některými vysokorychlostními externími zařízeními ve vztahu k MP: hlavní a externí paměť

    Účel a druhy MP
    MP vystupuje následující funkce: Čtení a dešifrování příkazů z OP; Čtení dat z OP a registrů VU adaptérů; Příjem a zpracování požadavků a příkazů z adaptérů na

    struktura MP
    Mikroprocesory se skládají ze dvou částí: operační sál, obsahující řídící jednotku, ALU a MPPS, s výjimkou několika adresních registrů; rozhraní obsahující registry adres MPP,

    Mezipaměti
    Mezipaměť je vysokorychlostní paměť, která je vyrovnávací pamětí mezi RAM a MP a umožňuje zvýšit rychlost operací. Registry mezipaměti nejsou přístupné uživateli; odtud název "cache"

    Fyzická struktura OP
    OP obsahuje RAM a ROM, tedy RAM a ROM. RAM je určena k ukládání informací (programů a dat), které se přímo podílejí na aktuální fázi provozu PC.

    Logická struktura OP
    Rozložení oblasti jednoho megabajtu RAM je znázorněno na Obr. 3.4. Logická struktura celého OP je znázorněna na Obr. 3.5. Každá paměťová buňka má svou jedinečnou (odlišnou od všech ostatních) adresu.

    Externí paměťové disky
    Disková úložná zařízení jsou klasifikována jako zařízení s přímým přístupem. Rychlý přístup do jakékoli části disku je zajištěna: rychlá rotace disku (flexibilní - cca 300 ot./min., tvrdý - cca.

    Video koncová zařízení
    Video terminál se skládá z video monitoru (displeje) a video ovladače (adaptér). Video ovladače jsou součástí dodávky systémový blok PC (umístěný na grafické kartě nainstalované v konektoru základní desky

    Tiskárny
    Tiskárny (tisková zařízení) jsou zařízení pro výstup dat z počítače, která převádějí informační kódy ASCII na odpovídající grafické symboly(písmena, čísla, znaky atd.) a upevnění e

    Skenery
    Skener je zařízení pro zadávání informací do počítače přímo z papírového dokumentu. Můžete zadávat texty, diagramy, kresby, grafy, fotografie a další grafické informace. Hmotnost skenerů

    superpočítač
    Superpočítače jsou výkonné multiprocesorové počítacích strojů s rychlostí stovek milionů – desítek miliard operací za sekundu. Typický model superpočítače z roku 2000 má

    Přenosné počítače
    Přenosné počítače- rychle se rozvíjející podtřída osobních počítačů. Podle odborníků bude v roce 1998 více než 50 % uživatelů používat přenosné stroje a

    Proces přenosu informací
    Žádný komunikační síť musí obsahovat tyto součásti: vysílač, prostředek přenosu, přijímač. Vysílač je zařízení, které je zdrojem dat.

    Formy interakce mezi předplatitelskými počítači
    Mezi předplatitelskými počítači existují následující hlavní formy interakce. 1. Terminálově vzdálený proces - poskytuje přístup z terminálu jednoho z účastnických počítačů k procesu

    Model interakce otevřených systémů
    Rozmanitost výrobců sítí VS a síťového softwaru vyvolala problém kombinování sítí různých architektur. Za tímto účelem byl vyvinut model architektury otevřené systémy. OTEVŘENO

    Protokoly počítačových sítí
    Při výměně informací v síti každá úroveň modelu interakce otevřených systémů reaguje na svou vlastní hlavičku, to znamená, že existuje interakce mezi jednořádkovými úrovněmi modelu v různých

    Místní sítě
    Hlavním účelem jakéhokoli počítačová síť- prezentace informací a výpočetních zdrojů uživatelům k nim připojeným. Z tohoto pohledu lze LAN považovat za lopatku

    Základní topologie LAN
    Topologie LAN je průměrný geometrický diagram spojení síťových uzlů. VS lze považovat za soubor uzlů - zařízení přímo připojených k přední straně

    Fyzické přenosové médium LAN
    Fyzické přenosové médium LAN může být reprezentováno třemi typy. 1. kroucený pár. Skládá se ze dvou izolovaných vodičů stočených dohromady. Kroucení drátů snižuje vliv vnějších

    Metody přístupu k médiím
    Metoda přístupu k médiím je metoda, která zajišťuje implementaci sady pravidel, podle kterých síťové uzly získávají přístup k síťovému zdroji. Existují dvě hlavní třídy

    Způsoby připojení k síti LAN
    Důvody použití různé cesty Přidružení LAN jsou následující: vyčerpáno technické možnosti LAN, musíte vytvořit další LAN připojením nových uživatelů a zkombinováním se stávající LAN

    Internet globální síť
    Internet je síť, která propojuje jednotlivé sítě. Logická struktura internetu je jakousi virtuální asociací, která má svůj virtuální prostor. Základní buňka

    Systémový software
    Systémový software je soubor programů a softwarových systémů pro zajištění provozu počítače a počítačových sítí. Systémový software je zaměřen na: vytvoření operačního prostředí f

    Sada nástrojů programovací technologie
    Sada nástrojů programovací technologie poskytuje proces vývoje programů a zahrnuje specializovaný software, což je vývojový nástroj. Software této třídy

    Aplikační balíčky
    Aplikační software slouží jako softwarový nástroj pro řešení funkčních problémů a je nejpočetnější třídou softwaru. V daná třída zahrnuje softwarové produkty, které zpracovávají informace

    Ochrana softwaru
    Ochrana softwaru sleduje následující cíle: · omezení neoprávněného přístupu k programům nebo jejich záměrné zničení a krádeže; vyloučení neoprávněného kopírování

    Množství a kvalita informací

    Úrovně komunikačních problémů

    Při realizaci informační procesy vždy dochází k přenosu informace v prostoru a čase od zdroje informace k přijímači (přijímači) pomocí signálů. Signál - fyzikální proces(jev), nesoucí zprávu (informaci) o události nebo stavu objektu pozorování.

    Zpráva- forma reprezentace informace ve formě souboru znaků (symbolov) používaných k přenosu.

    Sdělení jako soubor znaků z pohledu sémiotiky - vědy, která studuje vlastnosti znaků a znakových systémů - lze studovat na třech úrovních:

    1) syntaktický, kde jsou uvažovány vnitřní vlastnosti zpráv, tj. vztahy mezi znaky, které odrážejí strukturu daného znakového systému.

    2) sémantický, kde se analyzuje vztah mezi znaky a předměty, akcemi, kvalitami, které označují, tj. sémantický obsah sdělení, jeho vztah ke zdroji informace;

    3) pragmatický, kde je uvažován vztah mezi zprávou a příjemcem, tedy spotřebitelský obsah zprávy, její vztah k příjemci.

    Problémy syntaktická úroveň se týkají provozovny teoretické základy budování informačních systémů. Na této úrovni jsou zvažovány problémy doručování zpráv příjemci jako množiny znaků s ohledem na typ média a způsob prezentace informace, rychlost přenosu a zpracování, velikosti kódů reprezentace informací, spolehlivost a přesnost převodu těchto kódů atd., zcela abstrahující od sémantického obsahu zpráv a jejich zamýšleného účelu. Na této úrovni se informace uvažované pouze ze syntaktických pozic obvykle nazývají data, protože na sémantické stránce v tomto případě nezáleží.

    Problémy sémantickou úroveň jsou spojeny s formalizací a zohledněním významu přenášených informací, určujících míru korespondence mezi obrazem předmětu a předmětem samotným. Na danou úroveň informace, které informace odrážejí, se analyzují, zvažují se sémantické souvislosti, tvoří se pojmy a reprezentace, odhaluje se význam, obsah informace a provádí se její zobecnění.



    V pragmatické rovině zajímají se o důsledky získání a použití těchto informací spotřebitelem. Problémy na této úrovni souvisí s určením hodnoty a užitečnosti použití informací při vývoji rozhodnutí spotřebitele k dosažení jeho cíle. Hlavní problém je v tom, že hodnota, užitečnost informace může být pro různé příjemce zcela odlišná a navíc závisí na řadě faktorů, jako je například včasnost jejího doručení a využití.

    Informační opatření

    Míry informace na syntaktické úrovni

    Pro měření informací na syntaktické úrovni jsou zavedeny dva parametry: množství informace (dat) - V D(volumetrický přístup) a množství informací - (entropický přístup).

    Množství informací V D. Při zavádění informačních procesů se informace přenášejí ve formě zprávy, což je soubor znaků nějaké abecedy. Pokud se množství informací obsažených ve zprávě o jednom znaku bere jako jeden, pak množství informací (dat) V D v jakékoli jiné zprávě se bude rovnat počtu znaků (číslic) v této zprávě.

    Ano, v desítková soustava kalkulu, jedna číslice má váhu rovnou 10, a jednotka informace tedy bude dit (desetinné místo). V tomto případě zpráva ve formuláři n V D= P dit. Například čtyřmístné číslo 2003 má datovou velikost V D = 4 dit.

    V binární systém jedna číslice má váhu rovnou 2, a jednotka informace tedy bude bit (bit (binární číslice)- binární číslice). V tomto případě zpráva ve formuláři n-bitové číslo má objem dat V D \u003d n bit. Například osmibitový binární kód 11001011 má datovou velikost V D= 8 bitů.

    V moderní počítačové technice se spolu s minimální datovou jednotkou bitů široce používá zvětšená jednotka bajtu, která se rovná 8 bitům. Při práci s velkým množstvím informací se k výpočtu jejich množství používají větší jednotky měření, jako jsou kilobajty (kbajty), megabajty (MB), gigabajty (GB), terabajty (TB):

    1 kbyte = 1024 bajtů = 2 10 bajtů;

    1 MB = 1024 kB = 220 bajtů = 1048576 bajtů;

    1 GB = 1024 MB = 230 bajtů = 1 073 741 824 bajtů; .

    1 TB = 1024 GB = 240 bajtů = 1 099 511 627 776 bajtů.

    Množství informací I (entropický přístup). V teorii informace a kódování je přijat entropický přístup k měření informace. Tento přístup je založen na skutečnosti, že skutečnost získání informace je vždy spojena s poklesem diverzity nebo neurčitosti (entropie) systému. Na základě toho je množství informací ve zprávě definováno jako opatření ke snížení nejistoty stavu daného systému po přijetí zprávy. Jakmile pozorovatel ve fyzickém systému něco identifikoval, entropie systému se snížila, protože systém se stal pro pozorovatele uspořádanějším.

    Při entropickém přístupu je tedy informace chápána jako kvantitativní hodnota nejistoty, která zmizela v průběhu jakéhokoli procesu (testů, měření atd.). V tomto případě je entropie zavedena jako míra nejistoty H, a množství informací je:

    Kde H dub - apriorní entropie o stavu studovaného systému;

    Hodně štěstí- aposteriorní entropie.

    A posteriori- vychází ze zkušeností (zkoušky, měření).

    A priori- pojem, který charakterizuje znalost, která předchází zkušenosti (testu), a je na ní nezávislá.

    V případě, kdy se během zkoušky odstraní existující nejistota (získá se konkrétní výsledek, tzn. Hodně štěstí = 0), množství přijaté informace se shoduje s počáteční entropií

    Za zkoumaný systém uvažujme diskrétní zdroj informací (zdroj diskrétních zpráv), čímž máme na mysli fyzický systém, který má konečnou množinu možných stavů. Tato sada A= (A 1, A 2 , ..., a p) stavy systému v teorii informace se nazývá abstraktní abeceda nebo abeceda zdroje zprávy.

    Samostatné státy a 1, a 2,..., a „ se nazývají písmena nebo symboly abecedy.

    Takový systém může v každém časovém okamžiku náhodně zaujmout jednu z konečných množin možných stavů a já

    Protože některé stavy jsou vybírány zdrojem častěji, zatímco jiné jsou méně časté, je v obecném případě charakterizován souborem A, tj. úplný soubor stavů s pravděpodobnostmi jejich výskytu, které dávají dohromady jednu:

    a (2.2)

    Zaveďme míru nejistoty při volbě stavu zdroje. Lze ji také považovat za míru množství získaných informací s úplným vyloučením nejistoty o ekvipravděpodobných stavech zdroje.

    Potom v N=1 dostaneme NA)= 0.

    Tuto míru navrhl americký vědec R. Hartley v roce 1928. Základ logaritmu ve vzorci (2.3) nemá zásadní význam a určuje pouze měřítko nebo jednotku měření. měření se používají.

    1. Bity - zatímco základ logaritmu je 2:

    (2.4)

    2. Nits - zatímco základ logaritmu je E:

    3. Dita - zatímco základ logaritmu je 10:

    V informatice se jako míra nejistoty obvykle používá vzorec (2.4). V tomto případě se jednotka nejistoty nazývá binární jednotka nebo bit a představuje nejistotu výběru ze dvou stejně pravděpodobných událostí.

    Vzorec (2.4) lze získat empiricky: k odstranění nejistoty v situaci dvou stejně pravděpodobných událostí je potřeba jedna zkušenost a podle toho jeden bit informace, při nejistotě sestávající ze čtyř stejně pravděpodobných událostí stačí 2 bity informace uhodnout požadovanou skutečnost. K určení karty z balíčku 32 karet stačí 5 bitů informací, to znamená, že k určení požadované karty stačí položit pět otázek ano nebo ne.

    Navržené opatření umožňuje řešit určité praktické problémy, kdy všechny možné stavy informačního zdroje mají stejnou pravděpodobnost.

    V obecném případě míra nejistoty v implementaci stavu informačního zdroje závisí nejen na počtu stavů, ale také na pravděpodobností těchto stavů. Pokud má zdroj informace například dva možné stavy s pravděpodobnostmi 0,99 a 0,01, pak je nejistota volby mnohem menší než u zdroje, který má dva stejně pravděpodobné stavy, protože v tomto případě je výsledek prakticky ušlý. závěr (implementace stavu, pravděpodobnost, která je rovna 0,99).

    Americký vědec K. Shannon zobecnil koncept míry nejistoty výběru H v případě kdy H závisí nejen na počtu stavů, ale také na pravděpodobností těchto stavů (pravděpodobnosti p i výběr postavy a i, abeceda A). Tato míra, což je nejistota na stát v průměru, se nazývá entropie diskrétního zdroje informací:

    (2.5)

    Pokud se znovu zaměříme na měření nejistoty v binárních jednotkách, pak by měl být základ logaritmu považován za rovný dvěma:

    (2.6)

    Ve stejně pravděpodobných volbách pravděpodobnost pj = 1/N vzorec (2.6) se transformuje na vzorec R. Hartleyho (2.3):

    Navrhované opatření se ne náhodou nazývalo entropie. Jde o to, že formální struktura výrazu (2.5) se shoduje s entropií fyzikálního systému, definovanou dříve Boltzmannem.

    Pomocí vzorců (2.4) a (2.6) můžeme určit redundanci D zdrojová abeceda zpráv A, který ukazuje, jak racionálně se používají symboly dané abecedy:

    Kde H max (A) - maximální možná entropie určená vzorcem (2.4);

    NA) - entropie zdroje, určená vzorcem (2.6).

    Podstatou tohoto opatření je, že při ekvipravděpodobné volbě lze zajistit stejnou informační zátěž na znaku pomocí abecedy menšího objemu než v případě neekvipravděpodobné volby.

    Syntaktická míra informace

    Tak jako syntaktická míra množství informací představuje množství dat.

    O objem dat V d ve zprávě "in" se měří počtem znaků (číslic) v této zprávě. Jak jsme zmínili, ve dvojkové soustavě je měrnou jednotkou bit. V praxi se spolu s touto "nejmenší" jednotkou měření dat častěji používá větší jednotka - byte rovný 8 bitům. Pro usnadnění se jako měřiče používají kilo- (10 3), mega- (10 6), giga- (10 9) a tera- (10 12) bajtů atd. Ve známých bajtech je objem krátkých psaných zpráv, tlustých knih, hudebních děl, obrázků a také softwarových produktů. Je jasné, že toto opatření nemůže nijak charakterizovat, co a proč tyto jednotky informace nesou. Změřte v kilobajtech román L.N. Tolstého „Válka a mír“ je užitečné například k tomu, abychom pochopili, zda se dokáže přizpůsobit volný prostor pevný disk. To je stejně užitečné jako měření velikosti knihy – její výšky, tloušťky a šířky – abyste zjistili, zda se vejde na poličku, nebo ji zvážíte, abyste zjistili, zda aktovka unese celkovou hmotnost.

    Tak. jedna syntaktická míra informace k charakterizaci zprávy zjevně nestačí: v našem příkladu počasí ve druhém případě obsahovala zpráva přítele nenulové množství dat, ale neobsahovala informace, které jsme potřebovali. Závěr o užitečnosti informace vyplývá ze zvážení obsahu sdělení. K měření sémantického obsahu informace, tzn. jeho kvantitu na sémantické úrovni zavádíme pojem „tezaurus příjemce informace“.

    Tezaurus je souhrn informací a vazeb mezi nimi, které má příjemce informací. Můžeme říci, že tezaurus jsou nashromážděné znalosti příjemce.

    Ve velmi jednoduchém případě, kdy příjemcem je technické zařízení - Osobní počítač, tezaurus je tvořen „výzbrojí“ počítače – v něm zabudovanými programy a zařízeními, která umožňují přijímat, zpracovávat a prezentovat textové zprávy na různé jazyky pomocí různých abeced, písem a také zvukových a obrazových informací z místní nebo celosvětové sítě. Pokud počítač není vybaven síťová karta, nemůžete očekávat, že na něm budete přijímat zprávy od ostatních uživatelů sítě v jakékoli podobě. Nedostatek ovladačů s ruskými fonty vám neumožní pracovat se zprávami v ruštině atd.

    Je-li příjemcem člověk, je jeho tezaurus zároveň jakousi intelektuální výzbrojí člověka, arzenálem jeho znalostí. Tvoří také jakýsi filtr pro příchozí zprávy. Příchozí zpráva je zpracována s využitím existujících znalostí za účelem získání informací. Pokud je tezaurus velmi bohatý, pak je arzenál znalostí hluboký a rozmanitý, umožní vám extrahovat informace z téměř jakékoli zprávy. Malý tezaurus obsahující mizivé množství znalostí se může stát překážkou pro pochopení sdělení, která vyžadují lepší přípravu.


    Všimněte si však, že samotné pochopení sdělení k ovlivnění rozhodování nestačí – musí obsahovat k tomu potřebné informace, které v našem tezauru nejsou a které do něj chceme zahrnout. V případě počasí náš tezaurus neměl nejnovější, „aktuální“ informace o počasí v areálu univerzity. Pokud přijatá zpráva změní náš tezaurus, může se změnit i volba řešení. Taková změna v tezauru slouží sémantická míra množství informací je jakýmsi měřítkem užitečnosti přijaté zprávy.

    Formálně množství sémantických informací Je , dále zařazený do tezauru je určen poměrem tezauru příjemce S i a obsah informací přenášených ve zprávě „v“ S. Grafický pohled na tuto závislost je na obr.1.

    Zvažte případy, kdy množství sémantických informací Je rovna nebo blízko nule:

    Pro S i= 0 příjemce nevnímá příchozí informace;

    V 0< Si< S 0 получатель воспринимает, но не понимает поступившую в сообщении информацию;

    Pro S i-» ∞ Příjemce má vyčerpávající znalosti a příchozí informace nemohou dokončit jeho tezaurus.

    Rýže. Závislost množství sémantické informace na tezauru příjemce

    S tezaurem S i>S0 množství sémantických informací Je Přijaté z vložené zprávy β informace Szpočátku rychle roste s růstem vlastního tezauru příjemce a pak - počínaje nějakou hodnotou S i - padá . Pokles množství informací užitečných pro příjemce je způsoben tím, že znalostní báze příjemce se stala poměrně solidní a je stále obtížnější ho překvapit něčím novým.

    To lze ilustrovat na příkladu studentů, kteří studují ekonomickou informatiku a čtou materiály z firemních IP webových stránek. . Na začátku, při utváření prvních poznatků o informační systémyčtení dává málo - hodně nesrozumitelných termínů, zkratek, dokonce ani nadpisy nejsou všechny jasné. Vytrvalost při čtení knih, návštěva přednášek a seminářů, komunikace s odborníky pomáhá doplňovat tezaurus. Postupem času se čtení materiálů na webu stává příjemným a užitečným a na konci vaší profesionální kariéry - po napsání mnoha článků a knih - bude získávání nových užitečných informací z oblíbeného webu mnohem méně časté.

    Můžeme mluvit o optimální pro tyto informace S tezaurus příjemce, ve kterém obdrží maximum informací Je, stejně jako optimální informace ve zprávě "in" pro daný tezaurus sj. V našem příkladu, kdy je příjemcem počítač, optimální tezaurus znamená, že jeho hardware a nainstalován software vnímat a správně interpretovat pro uživatele všechny symboly obsažené ve zprávě „in“, které vyjadřují význam informace S. Pokud zpráva obsahuje znaky, které neodpovídají obsahu tezauru, některé informace budou ztraceny a hodnota Je pokles.

    Na druhou stranu, pokud víme, že příjemce není schopen přijímat texty v ruštině (jeho počítač ne správné ovladače), a cizí jazyky, ve kterých lze naši zprávu poslat, ani on, ani my jsme nestudovali, abychom přenesli potřebné informace, můžeme se uchýlit k transliteraci - psaní ruských textů pomocí písmen cizí abecedy, které počítač příjemce dobře vnímá . Tímto způsobem porovnáme naše informace s počítačovým tezaurem příjemce. Zpráva bude vypadat ošklivě, ale celá nezbytné informace příjemce bude moci číst.

    Maximální množství sémantické informace tedy pochází ze zprávy β příjemce nabývá dohodou jeho sémantického obsahu S c tezaurus si,(na Si = Sjopt). Informace ze stejné zprávy mohou být pro kompetentního uživatele smysluplné a pro nekompetentního uživatele nesmyslné. Množství sémantických informací ve zprávě přijaté uživatelem je individuální, personalizovaná hodnota, na rozdíl od syntaktických informací. Sémantické informace se však měří stejně jako syntaktické informace – v bitech a bytech.

    Relativní mírou množství sémantické informace je obsahový faktor C, který je definován jako poměr množství sémantické informace k jejímu objemu dat. V d, obsažené ve zprávě β:

    C \u003d Is / Vd

    2. přednáška z oboru "Informatika a ICT"

    Informace – co to je? Na čem je založena? Jaké cíle sleduje a jaké úkoly plní? O tom všem budeme hovořit v rámci tohoto článku.

    obecná informace

    V jakých případech se používá sémantický způsob měření informací? Využívá se podstata informace, zajímavá je obsahová stránka přijaté zprávy – to jsou indicie pro její použití. Nejprve si ale vysvětlíme, co to je. Je třeba poznamenat, že sémantický způsob měření informací je obtížný formalizovaný přístup, který ještě není plně zformován. Používá se k měření množství významu v datech, která byla přijata. Jinými slovy, jaké množství přijatých informací je v tomto případě nezbytné. Tento přístup se používá k určení obsahu přijatých informací. A pokud mluvíme o sémantickém způsobu měření informací, používáme pojem tezaurus, který je s uvažovaným tématem nerozlučně spjat. co to představuje?

    tezaurus

    Rád bych uvedl malý úvod a odpověděl na jednu otázku ohledně sémantického způsobu měření informací. Kdo do něj vstoupil? Tuto metodu navrhl zakladatel kybernetiky Norbert Wiener, která se však výrazně rozvinula pod vlivem našeho krajana A. Yu.Schradera. Jaký je název používaný k označení souhrnu informací, které má příjemce informací. Pokud tezaurus korelujeme s obsahem zprávy, která byla přijata, pak můžeme zjistit, jak moc to snížilo nejistotu. Rád bych napravil jednu chybu, pod jejímž vlivem často padá velký počet lidí. Věří tedy, že sémantický způsob měření informací zavedl Claude Shannon. Není přesně známo, jak tato mylná představa vznikla, ale tento názor je nesprávný. Claude Shannon představil statistický způsob měření informací, jehož „dědic“ je považován za sémantický.

    Grafický přístup k určení množství sémantické informace v přijaté zprávě

    Proč potřebuješ něco kreslit? Metoda sémantického měření využívá této příležitosti k vizuální prezentaci dat užitečnosti dat ve formě snadno srozumitelných obrázků. Co to v praxi znamená? Pro vysvětlení stavu věcí je vykreslena závislost ve formě grafu. Pokud uživatel nemá žádné znalosti o podstatě zprávy, která byla přijata (rovná se nule), pak se množství sémantické informace bude rovnat stejné hodnotě. Je možné najít optimální hodnotu? Ano! Toto je název tezauru, kde je množství sémantických informací maximální. Podívejme se na malý příklad. Předpokládejme, že uživatel obdržel zprávu napsanou v neznámém cizím jazyce nebo si člověk může přečíst, co je tam napsáno, ale to už pro něj není novinka, protože to všechno je známo. V takových případech se říká, že zpráva neobsahuje žádné sémantické informace.

    Historický vývoj

    Pravděpodobně se o tom mělo diskutovat trochu výše, ale ještě není pozdě to dohnat. Zpočátku sémantický způsob měření informací představil Ralph Hartley v roce 1928. Dříve bylo zmíněno, že jako zakladatel je často zmiňován Claude Shannon. Proč nastal takový zmatek? Faktem je, že ačkoliv sémantický způsob měření informací zavedl Ralph Hartley v roce 1928, byli to Claude Shannon a Warren Weaver, kteří jej v roce 1948 zobecnili. Poté zakladatel kybernetiky Norbert Wiener vytvořil myšlenku metody tezauru, která získala největší uznání v podobě opatření vyvinutého Yu. I. Schneiderem. Je třeba poznamenat, že abychom tomu porozuměli, je nutné vysoká úroveň znalost.

    Účinnost

    Co nám metoda tezauru dává v praxi? Je skutečným potvrzením teze, že informace má takovou vlastnost, jako je relativita. Je třeba poznamenat, že má relativní (nebo subjektivní) hodnotu. Aby bylo možné objektivně hodnotit vědecké informace, byl zaveden koncept univerzálního tezauru. Míra jeho změny ukazuje význam znalostí, které lidstvo dostává. Zároveň nelze přesně říci, jaký konečný výsledek (nebo meziprodukt) lze z informací získat. Vezměme si například počítače. Počítačové inženýrství byl vytvořen na základě technologie lamp a bitového stavu každého konstrukčního prvku a původně sloužil k provádění výpočtů. Nyní má téměř každý člověk něco, co funguje na základě této technologie: rádio, telefon, počítač, TV, notebook. I moderní ledničky, sporáky a umyvadla obsahují nějakou elektroniku, která vychází z informací o usnadnění používání těchto domácích zařízení člověkem.

    Vědecký přístup

    Kde se studuje sémantický způsob měření informací? Informatika je věda, která se zabývá různými aspekty této problematiky. Jaká je funkce? Metoda je založena na použití systému "pravda/nepravda" nebo bitového systému "jedna/nula". Když dorazí určitá informace, je rozdělena do samostatných bloků, které jsou pojmenovány jako jednotky řeči: slova, slabiky a podobně. Každý blok má určitou hodnotu. Podívejme se na malý příklad. Dva přátelé stojí vedle sebe. Jeden se otočí na druhého se slovy: "Zítra máme volno." Když dny na odpočinek - každý ví. Proto je hodnota této informace nulová. Ale když druhý řekne, že zítra pracuje, tak pro prvního to bude překvapení. V tomto případě se skutečně může ukázat, že plány, které postavil jeden člověk, například jít na bowling nebo se ponořit do dílny, budou porušeny. Každá část popisovaného příkladu může být popsána pomocí jedniček a nul.

    Operace s koncepty

    Ale co jiného se používá kromě tezauru? Co dalšího potřebujete vědět, abyste pochopili sémantický způsob měření informací? Základními pojmy, které lze dále studovat, jsou znakové systémy. Jsou chápány jako prostředky k vyjádření významu, jako jsou pravidla pro výklad znaků nebo jejich kombinací. Podívejme se na další příklad z informatiky. Počítače pracují s podmíněnými nulami a jedničkami. V zásadě je nízká vysokého napětí, který je přiváděn do součástí zařízení. Navíc přenášejí tyto jednotky a nuly bez konce a hrany. Jak je dokáže technologie rozlišit? Na to byla nalezena odpověď – přerušení. Když jsou stejné informace přenášeny, dostáváme různé bloky jako slova, fráze a jednotlivé významy. V ústní lidské řeči se pauzy také používají k rozdělení dat do samostatných bloků. Jsou tak neviditelné, že si jich většinou všimneme na „stroji“. V dopise k tomu slouží tečky a čárky.

    Zvláštnosti

    Dotkněme se také tématu vlastností, které má sémantický způsob měření informace. Už víme, že se tak nazývá speciální přístup, který hodnotí důležitost informací. Dá se říci, že data, která budou takto vyhodnocována, budou objektivní? Ne, to není pravda. Informace jsou subjektivní. Podívejme se na příklad školy. Existuje vynikající student, který předčí schválený program, a průměrný průměrný student, který studuje to, co je prezentováno ve třídě. Za prvé, většina informací, které dostane ve škole, bude málo zajímavá, protože to už ví a neslyší / nečte poprvé. V subjektivní rovině to pro něj tedy nebude příliš cenné (možná kvůli individuálním poznámkám učitele, kterých si všiml při prezentaci svého předmětu). Zatímco průměrný student o nových informacích slyšel něco jen vzdáleně, proto je pro něj hodnota dat, která budou v hodinách prezentována, řádově větší.

    Závěr

    Je třeba poznamenat, že v informatice není sémantický způsob měření informace jedinou možností, v rámci které lze řešit existující problémy. Výběr by měl záviset na současných cílech a příležitostech. Pokud je tedy téma zajímavé nebo je o něj potřeba, pak lze jen důrazně doporučit jeho podrobnější prostudování a zjištění, jaké další způsoby měření informací kromě sémantiky existují.