• Co znamená typ souboru. Jak určit typ souboru bez přípony

    Představte si, že dostanete poštu od svých přátel nebo kolegů a oni vám jako přílohu poslali nějaký dokument ve formě souboru připojeného k dopisu, který obsahuje potřebné informace. Uložíte tento soubor do svého počítače, ale uvidíte, že místo obvyklých ikon jakéhokoli programu (Word, Excel, PDF atd.) není žádná ikona a systém Windows si myslí, že se jedná o nějaký druh souboru s neznámým formátem . Často se to děje kvůli skutečnosti, že soubor v procesu připojování k dopisu odesílatelem (nebo když je soubor uložen do počítače příjemce) ztratí svou příponu a operační systém Windows přestane chápat, jaký typ souboru je před ním, a proto neví, který program potřebujete k otevření tohoto souboru. Co je přípona souboru a jak je zobrazit a skrýt různé verze Windows, můžete číst v .

    Druhý nejvíce běžná příčina ztráta přípony souboru je neopatrné přejmenování souboru, když máte ve Windows nastaveno zobrazování přípon všech známých typů souborů a při pokusu o přejmenování souboru omylem smažete příponu souboru a skončíte s dokumentem neznámého původu že již nelze otevřít dvojitým kliknutím myši. Váš soubor se například jmenoval „Letter.doc“, který se dříve snadno otevíral Word programy, a po přejmenování se stal známým jako "Dopis v práci". Všimněte si, že soubor již nemá příponu „.doc“, která byla omylem smazána při změně názvu souboru, a nyní se tento soubor neotevře dvojitým kliknutím, ale pokusí se vás zeptat, který program tento soubor otevřít.

    Je dobré, když přesně víte, jaký typ souboru máte před sebou, a můžete ho jen přidat požadované prodloužení, jako je doc nebo xls, takže se automaticky otevře s dvojklik myši na to. O tom si můžete přečíst v samostatném článku. Co když ale máte před sebou soubor, jehož typ neznáte? Existují minimálně dva způsoby, jak zjistit, jaký typ souboru máte před sebou, a dát mu správnou příponu.

    V tomto článku provedeme experiment - vezmeme několik hotových souborů různých formátů, které byly zvažovány ve výše uvedeném článku, vymažeme jejich přípony, jako by byly ztraceny nebo omylem smazány, a pokusíme se zjistit, jaký typ každého souboru má a co je třeba přidat rozšíření pro snadné otevření.

    Nášho experimentu se zúčastní několik souborů:

    1. Bonnie Tyler - Turn around.mp3 - píseň ve formátu mp3
    2. bonus.mp4 - krátké video ve formátu mp4
    3. KeePass-2.28.exe - instalační soubor programu KeePass (o tomto úžasném programu vám povím v jednom z následujících článků)
    4. math.zip - archiv zip
    5. Point Break.avi - krátké avi video
    6. Tulips.jpg - obrázek s tulipány
    7. Report.ppt - prezentace vytvořená v MS PowerPoint 2003
    8. Materiály pro jednání.pptx - prezentace vytvořená v MS PowerPoint 2007
    9. Letter.doc je textový soubor vytvořený v MS Word 2003
    10. Order.docx - textový soubor vytvořený v MS Word 2007
    11. Aplikace 4.rar - archiv rar
    12. rozlišení.pdf - soubor ve formátu pdf
    13. Korespondenční tabulka.xlsx - datový soubor vytvořený v tabulkovém editoru MS Excel 2007
    14. Tabular data.xls - datový soubor vytvořený v tabulkovém editoru MS Excel 2003

    Na obrázku níže mají všechny soubory své vlastní přípony (zvýrazněné rámečky s červenými okraji):

    Smažeme všechny přípony souborů a poté zmizí všechny ikony programů, pomocí kterých můžete tyto soubory otevřít. Ve Windows XP to vypadá takto:

    Ve Windows 7 to vypadá trochu jinak, ale význam je stejný – operační systém neví, který program má tyto soubory otevřít.

    Nyní při pokusu o otevření jakéhokoli souboru nás systém Windows vyzve, abychom nejprve vybrali program, který potřebuje tento soubor otevřít:

    A zde musíte být opatrní, protože nesprávná volba programu pro tento typ souboru povede k tomu, že se soubor neotevře a program vydá chybu a nesprávné přiřazení programu pro jeho otevření být přiřazen k tomuto souboru.

    Někdy můžete podle názvu souboru hádat, jaký typ souboru máme a jakou příponu bychom měli mít. Ale vezmeme případ, kdy to není možné.

    Takže máme spoustu souborů s neznámými formáty a příponami a musíme pochopit, co tyto soubory jsou.

    První způsob, jak zjistit, jaký typ souboru je před námi, je zobrazit obsah těchto souborů pomocí jednoduchých textových editorů, jako je Poznámkový blok, nebo lépe pomocí vestavěných prohlížečů. různé soubory manažerů, jako je Total Commander nebo Far, nebo pomocí bezplatného pokročilého textového editoru Notepad++. Doporučuji si jej stáhnout a nainstalovat, protože oproti běžnému poznámkovému bloku má mnoho výhod.

    Vezmeme první soubor „Bonnie Tyler - Turn around“, v seznamu programů k otevření vyberte Notepad ++ (pokud jej nemáte nainstalovaný, použijte běžný Poznámkový blok, ale Notepad ++ je lepší, protože Poznámkový blok při otevírání prostě zamrzne velké soubory) a vidíme nějaké krakozyabry:

    To by nemělo být trapné, protože k určení typu souboru se stačí podívat na první řádek obsahu souboru. Zde vidíte, že soubor začíná písmeny „ID3“.

    Pamatujte si, že pokud uvnitř souboru začíná jeho obsah " ID3“, tedy hudební soubor mp3 a právě toto rozšíření je potřeba do něj zaregistrovat. Po zadání přípony bude soubor systémem rozpoznán jako hudební soubor a můžete jej poslouchat.

    Otevřete druhý „bonusový“ soubor se stejným programem Notepad++ a podívejte se na jeho obsah:

    Jak můžete vidět na prvním řádku obsahu souboru, opakovaně se uvádí, že se jedná o soubor videa mp4 (na snímku výše zvýrazněný červeně). A obecně, pokud v souboru vidíte text jako " ftypmp42“, pak se zpravidla jedná o video soubor mp4.

    Provedením stejné operace pro zobrazení obsahu se všemi ostatními soubory získáme následující informace:

    1. Když otevřete obsah souboru KeePass-2.28, můžete vidět, že soubor začíná písmeny MZ - to je znamení, že máme před sebou soubor exe.
    2. Když otevřete obsah souboru math.zip, můžete vidět, že soubor začíná písmeny PK - to nám říká, že daný soubor je archiv. Vzhledem k tomu, že archivy Rar mají jiný záznam v obsahu souboru, jedná se s největší pravděpodobností o archiv Zip, ale buďte opatrní a věnujte pozornost bodu 6 níže.
    3. Při otevření obsahu souboru Point Break hned na prvním řádku vidíme nápovědu, že před sebou máme avi video soubor.

    1. Při otevření obsahu souboru Tulips vidíme dvě slova, která určují formát souboru - na začátku řádku "yash" a poté - "Exif". Tato slova definují grafický formát souboru, konkrétně jpg, a v tomto případě máme jistotu, že máme před sebou soubor obrázku.

    1. Pokud jde o soubory MS Office 2003 „Report“, „Dopis“ a „Data tabulky“ - všechny začínají ve svém interním obsahu na „RP“, takže je poměrně obtížné okamžitě určit, který z nich byl vytvořen ve Wordu, Excelu nebo PowerPointu. . Jediné, čím si můžete být jisti, je, že tyto soubory patří některé z MS aplikací Kancelářské verze 2003 a níže. Proto k otevření těchto typů souborů můžete použít výčet tří přípon, počínaje „doc“, poté „xls“ a poté „ppt“. Obvykle to udělá jeden z nich.
    2. Se soubory "Materiály k jednání", "Objednávka", "Tabulka korespondence" je to trochu složitější - jelikož jsou vyrobeny v aplikacích MS Office 2007, jedná se v podstatě o archivy, a proto na začátku jejich obsahu uvidíte stejná písmena jako v archivu Zip, jedná se o písmena "PK". Nicméně dále ve stejném řádku můžete vidět řádek .xml, je to ona, kdo nám řekne, že nemáme jen archiv, ale dokument z řady MS Office ", pak "xlsx", pak "pptx". Jeden z nich by se měl hodit.
    1. Když otevřete obsah souboru "Příloha 4", vidíme, že začíná slovem "Rar" - to je nejjednodušší označení, že máme před sebou archiv rar.
    2. Když otevřete obsah souboru "resolution", hned od začátku uvidíte, o jaký druh souboru se jedná, protože začíná řádkem "%PDF-1.3". Čísla se mohou lišit, ale obvykle je přítomna zkratka pdf a označuje formát souboru.

    Druhý způsob určení typu souboru vyžaduje připojení k internetu a je také žádoucí, aby velikost souboru byla malá, protože k určení formátu souboru použijeme internetovou službu.

    Klikneme na tlačítko „vybrat soubor“, specifikujeme náš soubor k analýze (pokusím se analyzovat jeden ze složitých souborů „Meeting Materials“, abych zjistil, zda si tento analyzátor poradí a pochopí, že tento soubor byl vytvořen v MS PowerPoint 2007 (v měl příponu pptx a během našeho experimentu jsme ji odstranili.) Po výběru souboru stiskněte tlačítko "Analyzovat" a získáte následující výsledek:

    Jak vidíte, služba s 97% pravděpodobností určila, že se jedná o soubor PowerPoint s příponou pptx. A protože tento soubor je také kontejnerový archiv obsahující další soubory uvnitř, analyzátor také ukázal 3% šanci, že by to mohl být archiv zip.

    Zkusme si také ověřit, zda tato služba dokáže určit typ našeho „rozlišovacího“ souboru, ve kterém jsme smazali příponu pdf. Nahrajeme soubor do služby, stiskneme tlačítko "Analyzovat" a uvidíme, že služba dokonale zvládla úkol:

    Jak jsem řekl, nevýhodou této služby může být to, že k analýze souboru jej potřebuje kompletně stáhnout, a pokud máte velký soubor, může tento proces trvat dlouho, nebo dokonce nedojde ke konci v Všechno. Proto, když velké velikosti nerozpoznané soubory, zkuste nejprve použít první způsob, jak určit jeho typ, a to zobrazením obsahu souboru správce souborů nebo editor Notepad++.

    Samozřejmě můžete k určení typu souboru použít speciální programy, například File Type Verificator, ale podle mého názoru bude mnohem jednodušší a rychlejší použít jednu ze dvou výše navržených metod.

    Takže, milí návštěvníci webu, dnes jsme diskutovali o tom, jak můžete určit formát (typ) souboru, pokud byla jeho přípona ztracena. Pokud máte nějaké dotazy, zeptejte se je v komentářích k tomuto článku.

    Navigace příspěvku

    Formát – specifikace struktury dat zaznamenaných v počítačovém souboru. Formát souboru je někdy v názvu označen jako část oddělená tečkou (obvykle se tato část nazývá přípona souboru, i když to není striktně řečeno). Například koncovka názvu (přípona) ".txt" se obvykle používá k označení souborů obsahujících pouze textové informace a ".doc" - obsahující textové informace strukturované v souladu se standardy programu Microsoft Word. Soubory, jejichž obsah odpovídá jednomu formátu (méně běžně jedné rodině formátů), se někdy nazývají soubory stejného formátu typ. Protože běžným konceptem souboru ve výpočetní technice je nestrukturovaná sekvence bajtů, počítačové programy, které ukládají strukturovaná data do souborů, je musí nějak převést na sekvenci bajtů a naopak (v OOP se tyto operace nazývají „serializace“ a „deserializace"; pro textové informace se posledně jmenovaná také nazývá „analýza" nebo „analýza"). Algoritmus pro tuto transformaci, stejně jako konvence pro uspořádání různých částí informací v souboru, tvoří jeho „formát“. Různé formáty souborů se mohou lišit v úrovni detailů, jeden formát může být "doplňkem" jiného nebo používat prvky jiných formátů. Například textový formát ukládá pouze nejobecnější omezení datové struktury. Formát HTML nastavuje další pravidla pro vnitřní strukturu souboru, ale každý soubor HTML je zároveň textovým souborem.

    Specifikace

    Pro mnoho formátů souborů jsou zveřejněny specifikace, které podrobně popisují strukturu souborů. tento formát, jak by programy měly kódovat data pro zápis do tohoto formátu a jak je dekódovat při čtení. Většina těchto specifikací je volně dostupná, některé jsou distribuovány za poplatek. Někdy mohou společnosti považovat určité formáty souborů za své obchodní tajemství a nezveřejnit je. Známým příkladem jsou formáty souborů balíku Microsoft Office. V některých případech společnost, která aplikaci vydala, jednoduše necítí potřebu věnovat čas sepsání podrobné specifikace. Pokud specifikace formátu není k dispozici, je nutné provést reverzní inženýrství, aby byl program kompatibilní s tímto formátem. Ve většině nebo ve všech zemích nejsou formáty souborů chráněny zákony o autorských právech. V některých zemích však mohou být algoritmy používané ke kódování dat do formátu chráněny patenty. Například rozšířený formát GIF používal proprietární algoritmus (patenty vypršely v různých zemích v letech 2003-2004), což vedlo k vývoji alternativního formátu PNG.

    Určení typu souboru

    Typ souboru je informace pro rychlou identifikaci obsahu souboru operačním systémem a uživatelem, aniž by bylo nutné číst celý obsah souboru. Díky těmto informacím uživatel přibližně zná typ informací obsažených v souboru a operační systém může být spojen s programem pro zpracování souborů tohoto typu. Aby programy mohly správně pracovat se soubory, musí být schopny určit jejich typ. Z historických důvodů různé operační systémy používají různé přístupy k tomuto úkolu.

    Přípona názvu souboru

    Nějaký OS, například CP/M, DOS a Microsoft Windows používají k určení typu souboru část svého názvu, tj. „příponu názvu souboru“. Ve starších operačních systémech se jednalo o tři znaky oddělené od názvu souboru tečkou (v souborových systémech rodiny FAT se název a přípona ukládaly samostatně, tečka byla přidána již na úrovni OS); na novějších systémech může být přípona jednoduše součástí jména, v takovém případě je její délka omezena pouze nevyužitou délkou jména (která může být např. 255 znaků). Soubory HTML mohou mít například příponu „.htm“ nebo „.html“. Uživatel může libovolně měnit příponu souboru. Protože mnoho uživatelských shellů používá příponu k určení, kterým programem se má soubor otevřít, může to způsobit, že soubor nebude použitelný nebo se dokonce „ztratí“, pokud uživatel původní příponu zapomene. Průzkumník Windows proto ve výchozím nastavení skrývá rozšíření. Tato praxe má opačná strana: Vzhledem k tomu, že přípona souboru není vidět, je možné uživatele oklamat, aby si myslel, že například soubor s příponou .exe je obrázek s jinou příponou. Pokročilý uživatel může zároveň využít možnost změnit typ přiřazený souboru jednoduchou změnou přípony, aby jej mohl otevřít v jiném programu, aniž by jej přímo specifikoval. To může být užitečné, pokud program neumožňuje otevírání souborů s nějakou příponou a uživatel ví, že jejich formát je vhodný pro zpracování v tomto programu.

    magická čísla

    Další metodou, hojně používanou v operačních systémech podobných UNIXu, je uložit do samotného souboru jakési "magické číslo" (podpis) - posloupnost znaků, podle kterých lze identifikovat formát souboru. Termín byl původně používán pro speciální sadu 2bajtových identifikátorů uložených na začátku souboru (tato praxe migrovala do jiných operačních systémů, jako je MZ v MS-DOS), nicméně jakákoli sekvence znaků specifická pro tento formát lze použít jako „ magické číslo. Chcete-li určit formát souboru, použijte příkaz file, který používá soubor /usr/share/misc/magic

    metadata

    Některé systémy souborů umožňují ukládat pro každý soubor další atributy, tedy „metadata“. Tato metadata lze použít k uložení informací o typu souboru. Tento přístup se používá v počítačích Apple Macintosh. Metadata podporují takové moderní systémy souborů jako HPFS, NTFS, ext2, ext3 a další. Nevýhodou této metody je špatná přenositelnost – při kopírování souborů mezi souborovými systémy různých typů může dojít ke ztrátě metadat.

    Datové typy definované standardem MIME jsou široce používány v různých síťových protokolech, ale v souborových systémech se stále používají jen zřídka.

    Níže uvedená tabulka uvádí nejběžněji používané formáty souborů v současnosti.

    Přípony souborů

    Formáty

    • Deb (archiv správce balíčků Debian)

      Zmrazit/roztavit (.F) Formát archivu QNX4

      IMG, ISO (virtuální disk)

      RPM (Red Hat Package Manager-Archive)

      Formát konzoly pro správu systému SMC

    Formáty archivních souborů

    instalační soubor

      deb Správce balíčků Debian

      MSI Windows Installer (dříve Microsoft Installer)

      balík BeOS Software Valet

      RPM se používá v Red Hat

      sis, sisx se používá v OS Symbian

      APK se používá v OS Android

      CAB se používá ve Windows Mobile

    Spustitelné formáty (formáty programové soubory)

      textový soubor (.txt)

      Amiga Guide (.guide)

      Rich Text Format (.rtf) (formát akceptovaný společností Microsoft pro ukládání formátovaného textu)

      OpenDocument Text (.odt) (varianta formátu otevřeného textu)

      OpenOffice.org/StarOffice Writer (.sxw) (také otevřený textový formát)

    • Word Perfect (.wpd)

      Microsoft Word (.doc, .docx, .docm) (chráněný formát Microsoft)

      Lotus Word Pro (.lwp) (nedokumentovaný textový formát pro Lotus SmartSuite)

      DjVu (formát pro ukládání naskenovaných knih - vhodný, když je rozpoznání nepřijatelné z důvodu složitého rozvržení nebo pokud potřebujete zachovat vlastnosti dokumentu)

      FictionBook (plně otevřený formát)

      Mobipocket (pro kapesní počítače)

      PDF (knihy jsou často po rozložení „vytištěny“ v PDF)

      RB (formát elektronické knihy Rocket)

      Tab (tabulátor, ASCII kód ​​09)

      Microsoft Excel (.xls, .xlsx, .xlsm) (běžný formát Microsoft, kvazistandardní)

      OpenDocument Spreadsheet (.ods) (formát používaný open tabulkový procesor od OASIS, univerzálního standardu využívajícího XML a Zip)

      dif (pro výměnu tabulek mezi tabulkami)

      Microsoft Excel 2007 (.xlsx) (nový formát Microsoft)

      123, WK? - Lotus 1-2-3

      AWS - Tabulka schopností

      CLF - Think Free Calc

      OpenOffice.org/StarOffice Calc (.sxc) [otevřený formát v (XML, ZIP) používaný programy Calc ze StarOffice a spravovaný OpenOffice.org

      WKS - Microsoft Works

      gnumeric - GNU gnumeric

    Textové formáty

      BMP (bitmapa Windows nebo OS/2)

      kpt(Bitmapa Corel PHOTO-PAINT)

      GIF (Graphics Interchange Format)

      HDR (vysoký dynamický rozsah)

      JPEG, JPG, JPE (Joint Photographic Experts Group)

      JPEG2000 (.jp2)

      PCX (ZSoft PaintBrush)

      PDN (Obrázek Paint.NET)

      PNG (Portable Network Graphics)

      PSD (dokument z Photoshopu)

      TGA (Truevision Targa) (.TGA, .tpic)

      TIFF, TIF (formát tagovaného obrázku)

      WDP, HDP (Windows Media Photo)

    • APNG (animovaný PNG)

      Animace Autodesk(.fli/.flc)

    • Adobe Flash (.swf), vektorová grafika

      SMIL, prezentace (otevřený analog Flashe)

      MNG (vícenásobná síťová grafika)

      SVG (Scalable Vector Graphics, .svg) - prezentační formát zaměřený na vektorovou grafiku

      Animovaný kurzor Windows (.ani)

      WLMP (Windows filmový tvůrce)

    Grafické formáty

      AA - Audible Audio Book File

      AAC - Advanced Audio Coding

      AMR - Adaptive Multi-Rate

      APE - Opičí zvuk

      CDA - CD Digital Audio

      FLAC - Flat C Audio

      MT9 - Hudba 2.0

      Ogg-Vorbiti

      VOC – Creative SoundBlaster

      WAV - Windows PCM/ADPCM

      WMA - Windows Multimedia

    Soundtracky, audio nahrávky

      ASF (pokročilý formát streamování)

      AVI (Audio Video Interleave)

      Bink Video (.bik)

      FLV (Video Flash)

    • MXF (Formát výměny materiálů)

      Ogg (pro Tarkine a Theora)

      QuickTime (.mov, .qt)

    • SWF (soubor ShockWave)

      VOB (DVD video soubor)

      WMV - Windows film

    Video formáty

      Statický

      • HTML - (.html, .htm) - HyperText Markup Language

        XML – (.xml) – rozšiřitelný značkovací jazyk (eXtensible Markup Language)

        XHTML - (.xhtml, .xht) - rozšiřitelný hypertextový značkovací jazyk (eXtensible HyperText Markup Language)

        MAF - (.maff) - archivovaný HTML (webový archiv) obsahující jednu nebo více webových stránek s obrázky a dalším stažitelným obsahem, komprimovaný podle standardu ZIP

        MHTML - (.mht, .mhtml) - archivovaný HTML (webový archiv), ukládá všechna data webových stránek (text, obrázky atd.) do jednoho velkého souboru zabaleného podle standardu MIME (MIME HTML)

      dynamicky generované

      • ASP - (.asp) - stránky aktivního serveru od společnosti Microsoft (Active Server Page)

        ASPX - (.aspx) - Active Server Pages založené na .NET od společnosti Microsoft (Active Server Page .NET)

        ADP - Dynamická stránka AOLserveru

        BML – (.bml) – Better Markup Language (šablony)

        CFM - (.cfm) - ColdFusion interpretoval skriptovací programovací jazyk

        CGI - (.cgi) - Common Gateway Interface - "common gateway interface"

        iHTML – (.ihtml) – Inline HTML

        JSP - (.jsp) - JavaServer Pages

        Lasso – (.las, .lasso, .lassoapp)

        PL - (.pl) - programovací jazyk Perl

        PHP - (.php, .phtml) - zkratka pro PHP: Hypertextový preprocesor, byla původně zkratka pro Osobní domovská stránka

        SSI – (.shtml, .stm, .shtm) – HTML spolu s zahrnutím na straně serveru

    Internet

    Bibliografie.

      Ústava Ruské federace. Komentář. M.: Právní literatura, 1994

      Komentář k Ústavě Ruské federace. "Právní literatura". M.: 1994

      Federální ústavní zákon „O rozhodčích soudech v Ruské federaci“, Řád rozhodčího řízení Ruské federace. M.: "Os-89", 1995

    Na pevných discích moderního počítače, stejně jako na jiných discích a paměťových médiích, je obvykle současně uloženo mnoho různých dat a tato data jsou reprezentována binárním kódem. Abyste měli přístup k té či oné informaci (například ke čtení textu zaznamenaného v elektronické podobě nebo ke spuštění programu, který je zaznamenán na médiu), musíte určit, ze kterého konkrétního místa na disku se mají data číst . Jinými slovy, aby počítač „věděl“, kde se na disku nacházejí informace, které v tuto chvíli potřebuje, musí zadat svou přesnou „adresu“ - například u diskové jednotky je to sektor disku. číslo, číslo stopy atd.

    Souhlaste s tím, že zapamatování umístění dat v této podobě, zvláště když je dat hodně, je velmi nepohodlné. Při zápisu na disk se tedy data spojují do pojmenovaných sekvencí. Tyto sekvence se nazývají soubory. Soubor může být program, který lze spustit, text zadaný uživatelem, digitalizovaný zvukový klip nebo jakákoli jiná datová sekvence. V tomto případě jsou v prvních sektorech každého disku uloženy informace o shodě názvu souboru s adresou jeho fyzického umístění na disku.

    (adsbygoogle = window.adsbygoogle || ).push(());

    Nyní, místo abychom si například pamatovali, že program textového editoru je napsán na stopě 10, sektorech 12 a 13 a pro jeho spuštění potřebujeme k těmto sektorům přístup, dáme souboru tohoto programu jméno kwriter. Tento název je spojen s daty sektoru na disku, která jsou zaznamenána na začátku disku. Nyní, při přístupu k tomuto souboru podle názvu, bude počítač hledat tento název ve svém seznamu. Po nalezení se automaticky obrátí na potřebné sektory, aby z nich načetl data. Pro usnadnění je žádoucí, aby název souboru odrážel jeho obsah. Například soubor standardního programu textového editoru Notepad z operačních systémů rodiny Windows se nazývá notepad (notepad). Pro uživatele je tak snadná navigace v datech zaznamenaných na disku.
    Uživatel tedy zadá pouze jméno souboru a konkrétní umístění na disku je určeno operačním systémem (operační systémy viz kapitola 5). V některých starších operačních systémech, jako je DOS, byl název souboru omezen na osm znaků a mohl se skládat pouze z latinských písmen a některých speciálních znaků (jako je podtržítko nebo vykřičník).

    V moderní systémy název souboru může být velmi dlouhý – například až 255 znaků v moderních verzích Windows. V tomto případě lze nejvíce použít název souboru různé postavy, včetně mezer a dokonce i ruských písmen. Nedoporučujeme však nadměrné používání ruských písmen v názvech souborů. Faktem je, že za prvé takové „ruské“ soubory nemusí být v některých systémech čitelné (a nikdy nevíte, co může být potřeba!), a za druhé, v některých nouzových situacích může být extrahování nebo ukládání takových souborů mnohem obtížnější. , než soubory, jejichž názvy používají pouze písmena. Někdy to není vůbec možné.

    No, říkáte si, příběh o ukládání dat do souborů právě začal, jak už autor straší nouzovými situacemi... Autor samozřejmě nechce nikoho děsit. Nepředvídané mimořádné události však mohou nastat v jakékoli oblasti, včetně počítačový systém. Proto je vždy lepší přijmout opatření předem, zejména proto, že v tomto případě to není vůbec obtížné.
    Má se za to, že v celé jméno soubor také obsahuje cestu k němu (cesta) a příponu (příponu). O tom se bude dále diskutovat.

    Jaké jsou soubory

    Když uživatel začne pracovat se souborem, systém musí „vědět“, pomocí kterého programu lze tento soubor otevřít a v jakém formátu je zaznamenán. Pokud například soubor obsahuje prostý text, lze jej číst v libovolném textový program("Poznámkový blok", WordPad, kwriter atd.). Pokud je soubor zvukovým fragmentem, lze jej otevřít v přehrávači (Winamp, XMMS atd.) nebo v některém zvukovém editoru (Sound Forge, Adobe Audition, Samplitude atd.).

    Program, který soubor otevře, tedy musí „rozumět“ formátu, ve kterém je tento soubor zapsán. Pokud se například pokusíte otevřít textový soubor ve zvukovém editoru, tento s největší pravděpodobností zobrazí chybovou zprávu („nesprávný formát souboru“), a pokud otevřete zvukový soubor ve formě textu uvidíte na obrazovce úplné nesmysly.

    Přípona názvu souboru. Aby programy a operační systémy mohly „na první pohled“ určit typ souboru, přidává se k názvu souboru tzv. přípona. Obvykle se skládá z malého počtu znaků. Ve starších systémech, jako je DOS, byla omezena na tři znaky. V moderních systémech, včetně Windows XP nebo Linuxu, žádné takové omezení neexistuje, ale většina souborů stále končí třípísmennými příponami. Přípona je oddělena od názvu souboru tečkou.

    Mnoho moderních systémů a internet přijalo řadu standardních přípon souborů. Některé z nich jsou uvedeny v tabulce. 3.1.

    Standardní přípony souborů

    Komprimovaný hudební hudební soubor mp4
    .aas
    Archivní soubor

    Formát vektorového kreslení populární program Adobe Illustrator
    .ai
    Zvukový soubor (obvykle na počítačích Macintosh)

    Aiff
    Animovaný ukazatel myši

    Ani
    Archivní soubor

    Arj

    Streamování audio nebo video souboru
    .asx
    Zvukový soubor (formát Sun Audio)

    Standardní video soubor Windows
    .avi

    Stará (předchozí) kopie souboru
    .bak

    "Dávkový soubor" - obsahuje řadu příkazů z operačních systémů DOS nebo Windows, které budou spouštěny postupně
    .netopýr

    Binární
    .zásobník
    Rastrová kresba

    bmp
    Archivní soubor

    B z
    Archivní soubor

    Programový kód v C nebo C++
    .C

    Nastavení pro jakýkoli program
    .cfg

    Program (applet) napsaný v Javě
    .třída

    Spustitelný soubor (program, který lze spustit přímo)
    .com
    Konfigurační soubor pro program (obvykle na Linuxu)

    Conf
    Hudební projekt oblíbeného programu Cubase

    Soubor stylu pro webové stránky
    .ess

    Ukazatel myši
    .voříšek

    Videoklip
    .dat

    Soubor databáze
    .db

    Knihovna dynamických odkazů (obvykle součást nějakého programu)
    .dll

    Dokument, obvykle ve formátu Microsoft Word
    .doc


    .eps

    Spustitelný soubor (program, který lze spustit přímo)
    .exe

    Výkres (komprimovaný soubor)
    .gif

    Soubor nápovědy
    .sp


    .htm

    Hypertextový soubor, obvykle pro webové stránky
    .html

    Ikona
    Lev

    Informace pro instalaci programu
    .inf

    Soubor nastavení programu (obvykle ve Windows nebo DOS)
    .ini

    obrazový soubor CD
    .iso

    Soubor písma
    .fon

    Archivní soubor
    .gz

    Archivní soubor
    .gzip

    Java spustitelný program
    .sklenice

    Výkres (komprimovaný soubor)
    .jpeg

    Výkres (komprimovaný soubor)
    jpg

    javascriptový skript
    .js

    Hudební soubor s textem (pro karaoke)
    .kar

    Archivní soubor
    .zip

    "Protokol" akcí prováděných programem (obvykle během instalace)
    .log

    Výpis
    .1st


    .m3u

    MIDI soubor (hudební soubor přehrávaný přes syntezátor zvukové karty)
    .střední


    .mov

    komprimovaný hudební soubor mp3
    .tr3

    Komprimovaný video soubor mpeg
    .mpg

    Instalační soubor programu pro Windows
    .msi

    Formát hudebního souboru populárního programu Finale
    .mus

    Systémový soubor ActiveX
    .osx

    Komprimovaný hudební soubor Ogg Vorbis
    .ogg

    Stará kopie souboru
    .starý

    Formátovat dokument Adobe Acrobat
    .pdf

    PHP skript
    .php

    PHP skript
    .phtml

    Skript PERL
    .pi

    Standardní seznam skladeb
    .pis

    Soubor rozvržení ve formátu Adobe Pagemaker
    .pmd

    Komprimovaný obrázek
    png

    Grafický soubor tiskový formát PostScript
    .ps

    Populární kresba v rastrovém formátu software Adobe photoshop
    .psd

    Šifrované heslo a další informace o uživateli
    .pwl

    Video nebo audio soubor ve formátu Apple Quick Time
    qt

    Skutečný zvukový soubor
    .ra

    Archivní soubor
    .rar

    Informace pro vstup do registru Windows
    .reg

    Instalační soubor programu pro Linux
    .ot./min

    Textový soubor s označením písma
    .rtf

    Formát hudebních souborů oblíbeného programu Sibelius
    .sib

    Instalační soubor programu pro mobilní telefon
    .sis

    Populární Shockwave Flash Movie File
    .swf

    Dokument ve formátu OpenOffice.org
    .sxw

    Systémový soubor
    sys

    Archivní soubor
    .dehet

    Výkres
    .tif

    Soubor písma TrueType
    .ttf

    Textový soubor
    .txt

    Ovladač virtuálního zařízení - jedna ze součástí systému Windows
    .vxd

    Standardní zvukový soubor ve Windows
    .wav

    Formát komprimovaného hudebního souboru Windows Media
    .wma

    Obrázek (standardní formát Windows)
    .wmf

    Soubor komprimovaného videa ve formátu Windows Media
    .wmv

    Textový dokument ve formátu Write nebo WordPad
    .wri

    Dokument označený podle standardu XML
    .xml

    Samozřejmě zde nejsou uvedeny všechny přípony a typy souborů, je jich příliš mnoho Faktem je, že každý nově vytvořený program může pro své pracovní soubory použít stávající standardní typ, nebo může mít svůj vlastní. Například, grafický editor Adobe Photoshop umí pracovat se standardními formáty obrázků (bmp, jpg, tif atd.), ale zároveň má vlastní formát souboru(psd). Hudební program Cubase umí pracovat se standardními MIDI soubory (mid) nebo zvukovými soubory (wav), ale častěji se používá původní formát (srg).

    Navíc, protože existuje tolik programů, může se snadno stát, že se dva nebo více programů "pokusí" použít stejnou příponu pro soubory svého formátu. Například přípona mus se tradičně používá pro hudební soubory ve formátu Finale, ale stejnou příponu mus mají i hudební soubory zcela jiného formátu MusicTime.

    Obecně řečeno, na některých systémech je typ souboru určen více než jen příponou, v takovém případě soubory nemusí mít přípony vůbec. Například spustitelné soubory v Linuxu nejsou identifikovány podle jejich přípony (exe nebo com), ale podle speciálního atributu souboru. Kvůli kompatibilitě s tradiční situací však většina programů na těchto systémech dnes také pracuje se soubory s příponami.

    Otevírání souborů. Na moderních systémech, jako jsou Windows XP nebo Linux s grafickým prostředím, se to obvykle provádí dvojitým kliknutím na název souboru nebo ikonu. Po přijetí příkazu „Otevřít soubor“ systém nejprve určí typ souboru podle jeho přípony. Pokud se soubor ukáže jako spustitelný (program), jeho obsah se načte do paměti a přenese do procesoru ke spuštění. Pokud má soubor jiný známý typ, systém nejprve otevře program, který pracuje s tímto typem souborů, a poté bude soubor otevřen z tohoto programu. Pokud systém nezná typ souboru, bude uživatel vyzván, aby si sám vybral pracovní program. Tato situace v operačních systémech Windows je znázorněna na Obr. 3.1.

    Katalogy

    Nyní tedy víte, co je soubor. Pokud by na disku nebylo více než jeden nebo dva tucty souborů, nebylo by těžké si zapamatovat, co jejich názvy znamenají, a porozumět jim. Na novém disku je jich však již hodně a do budoucna jejich počet roste hurikánovou rychlostí. Například na pevných discích mého počítače je asi třicet tisíc různých souborů. Odkud vůbec pocházejí a jak jim rozumět?
    Rýže. 3.1 Výběr programu pro otevření souboru (ve Windows a Linuxu)

    Nejprve ve složení moderní programy(až na vzácné výjimky) obsahuje několik desítek až stovek pomocných souborů. Například systém Windows XP se skládá z téměř 10 000 souborů. Abychom si usnadnili život, rozhodli jsme se sloučit všechny soubory související s jedním programem do skupiny. V důsledku toho bude na disku několik takových skupin.

    Užitečné je také oddělení souborů podle typu a účelu (pro práci, pro zábavu, pro děti atd.). Pokud počítač používá několik lidí, měly by být soubory jednoho uživatele sloučeny do jedné skupiny.

    Takové skupiny souborů se obvykle nazývají adresáře, nebo v nové terminologii složky. Všechny adresáře, stejně jako soubory, mají své vlastní názvy. Externě se názvy adresářů neliší od názvů souborů, ale obvykle nemají přípony (ačkoli je mohou mít).

    Soubory (všechny nebo jejich části) byly tedy distribuovány do adresářů (složek). Ale proces pokračuje a nyní může být v jednom adresáři umístěn další adresář, v něm je další a tak dále, jako v ruské hnízdící panence.

    Nyní, abyste mohli určit přesné umístění souboru, musíte kromě názvu a přípony souboru zadat také cestu k souboru. Cesta (cesta) se skládá z názvů všech adresářů, ve kterých se soubor nachází. V systémy DOS a Windows, vypadá to takto: na začátek cesty k souboru se vloží písmeno název disku (logického oddílu), za kterým se vždy vloží dvojtečka a poté názvy adresářů, ve kterých daný soubor se nachází následovně. Názvy adresářů jsou odděleny zpětným lomítkem (\). Pokud jste například nahráli zvukový soubor a pojmenovali jej MySound.wav a poté jej umístili do adresáře Sounds, který je zase vnořen do adresáře MyFiles na vašem pevném disku D:, pak celý název souboru (včetně cesty ) bude vypadat takto:

    D:\MyFiles\Sounds\MySound.wav

    V Linuxový systém a další s podobnou organizací názvů souborů jsou názvy adresářů odděleny normálním lomítkem (/). Označuje také kořenový oddíl. Pokud jste například umístili zvukový soubor MySound.wav do svého domovského adresáře Ivanov, který se nachází v domovském adresáři, bude úplná cesta k souboru vypadat takto:

    /home/Ivanov/MySound.wav

    souborové systémy. Někdy nastane situace, kdy soubory (nebo spíše celé logické disky), které jsou dokonale „viditelné“ z jednoho operačního systému, zmizí beze stopy v jiném. K tomu obvykle dochází, když operační systémy používají různé systémy souborů. Souborový systém je formát, ve kterém jsou zaznamenány informace o umístění souborů na disku. Na PC existuje univerzální souborový systém s názvem FAT nebo FAT16. Pracovat s ním umí DOS, Windows, OS / 2, Linux, BeOS atd. Univerzální je i souborový systém FAT32, ale umožňuje použití i velkých pevné disky. Se systémem souborů FAT16 by velikost oddílu neměla přesáhnout 2 GB. Téměř všechny operační systémy kromě DOSu umí pracovat s FAT32.

    Existují i ​​jiné souborové systémy, ale nejsou tak univerzální. Například HPFS mohl být srozumitelný pouze pro OS/2 a starší verze Windows NT. Systém souborů NTFS používaný ve Windows NT/2000/XP Windows 95/98/ME „nerozumí“ a v Linuxu je lepší jej používat pouze pro čtení, nikoli pro zápis. Charakteristické pro Linuxový soubor systém ext3 většinou není čitelný z Windows Pokud na počítači z různých důvodů běží více operačních systémů, doporučuje autor použít nejuniverzálnější souborový systém FAT32.

    Softwarové balíčky

    Moderní programy se zpravidla skládají z více než jednoho spustitelný soubor, ale ze sady nebo součástí balíčku. Aby programy fungovaly, může být nutné systém připravit, to znamená provést určitá nastavení a dát systému vědět o existenci programů. Za tímto účelem jsou softwarové balíčky dodávány „zabalené“ a dodávají se s malým programem, obvykle nazývaným Setup nebo Install. Tento program rozbalí soubory programových komponent, umístí je do potřebných adresářů, zapíše nebo změní nastavení systému atd. Tento proces se nazývá instalace programu a balík softwaru s instalačním programem se nazývá distribuce.

    Například distribuční balíček pro notační a grafický program Finale 2004 obsahuje soubor Setup.exe. Při spuštění vytvoří speciální adresář pro program Finale 2004, dá deset potřebné soubory, vytvoří v něm dalších deset adresářů (pro instalační knihovny, šablony, tréninkové soubory, zásuvné moduly atd.) a naplní je obsahem. Kromě toho do systému instaluje "hudební" fonty (Maestro, Petrucci, atd.) a několik PostScriptových fontů (speciální fonty pro tiskaře).

    Někdy místo instalačního souboru nebo skriptu, který provádí tento druh práce, distribuce programu obsahuje několik příkazů pro standardní instalační program systému. Tyto pokyny lze zabalit spolu s daty nezbytnými pro práci programu do jednoho souboru se standardní příponou msi (pro Windows) nebo rpm (pro Linux). Chcete-li nainstalovat takový program, stačí otevřít tento soubor a systém se postará o zbytek.




    PŘEDNÁŠKA 19. SOUSTAVY SOUBORŮ

    Soubor koncept

    Soubor (soubor) - je to souvislá oblast prostoru logických adres. Soubory se zpravidla ukládají do externí paměti.

    Něco málo o terminologii. Slovo soubor již je po několik desetiletí se používá jako ruština - jeden z mnoha příkladů programátorských neologismů. Zpočátku, když se tento anglický termín objevil asi před 50 lety, odborníci se pokusili zavést jinou terminologii v ruskojazyčné literatuře - slovo soubor přeloženo jako fond a dokonce theca(Ve smyslu úložný prostor). Historicky však existovalo jiné řešení - slovo soubor se stal ruským. V anglický jazyk slovo soubor má mnoho dalších významů: např. vázaný papírový dokument a dokonce stádo(např. sloni) - v druhém případě, jak byste mohli očekávat, může být velikost "souboru" velmi velká. Každý si pamatuje název legendární série " X souborů"(ve volném ruském překladu - "Akta X").

    IBM v dokumentaci Podle jeho systém IBM 360 v 60. letech 20. století použil jiný termín datový soubor - pro označení stejného konceptu však nepřežil operační systém, ve kterém byl použit.

    Každý soubor má vlastní typ který určuje který informace uloženy v souboru. Hlavní typy souborů − program (kód) nebo data. Data jsou rozdělena na číslice, znak (text) A binární ( libovolný informace).

    Struktura souboru

    V různých systémy přijaty různé pohledy na strukturu souborů. V řadě systémů byla struktura souborů vázána na typ zařízení, na kterém se nachází. Na některých jiných systémech byla struktura souborů uměle komplikovaná. Nejjednodušší a nejjednotnější pohled z nich však navrhli autoři systému UNIX: soubor je posloupnost slov nebo bajtů. Zdálo by se to samozřejmé, ale výhodou tohoto přístupu k souborům je, že základní výkon soubor a základní operace přes to ( číst, napsat) nezávisí na typu zařízení. Svého času byl pro programátory naší generace tento přístup k souborům zjevením po složitosti souborového systému IBM 360 a pak - "Elbrus". Můžeme říci, že soubory ve vývoji prošly cesta, podobně jako voj počítačové architektury- nejprve ve směru významných komplikací, poté - zjednodušení a unifikace.

    Soubory lze podmíněně rozdělit na soubory jednoduché a složité struktury (i když pohled na strukturu souboru závisí na programu, který jej zpracovává).

    Soubory jednoduchý struktury se skládají ze sekvence záznamy (záznamy) - elementárních jednotek, z hlediska kterých operace výměna souborů. Záznamy mohou být:

    · linky, Pokud tohle textový soubor ;

    binární data pevná délka ;

    binární data variabilní délka.

    Soubory složitá struktura může být nejvíce jiný druh, Například:

    · formátovaný dokument Microsoft Office (takový soubor kromě vlastního textu obsahuje řídicí znaky pro přepínání fontů, barev apod.);

    · zaváděcí modul skutečné nebo virtuální binární kód, Například, přenosný spustitelný soubor (PE)-soubor pro platformu .NET; soubor třídy pro platformu Java; takové soubory se skládají z několika sekcí, obsahují interní odkazy a tabulky a tak dále.

    Složitou strukturu souborů lze modelovat pomocí záznamů přidáním vhodných řídicí znaky.

    Soubory jsou interpretovány operačním systémem nebo programy pro zpracování.

    Atributy souboru

    To můžeme předpokládat v téměř každém souborovém systému soubor skládá se z záhlaví A Paměť.Záhlaví souboru ukládá jeho atributy– obecné vlastnosti, které popisují obsah souboru, Paměť soubor jsou jeho záznamy, řádky, oddíly atd. obsahující informace v něm skutečně uložené.

    Existují následující hlavní atributy souboru:

    název– název souboru v symbolické podobě, vnímaný uživatelem.

    Typ– typ informací uložených v souboru. Samostatný atribut typ potřebné pro systémy, které podporují Různé typy soubory. Například v systému Elbrus hodnota atributu typ souboru je číslo kódující typ: 0 - data, 2 - kód, 3 - text atd. Častějším přístupem je však přístup používaný v systémech MS. DOS, Okna, UNIX: typ souboru zakódované přípona jména, Například, book.txt- text soubor(.txt) obsahující text knihy.

    Umístěníukazatel na ubytování soubor v zařízení.

    Velikost- aktuální velikost souboru.

    Ochrana- manažer informace A, které určuje oprávnění ke čtení, úpravě a spouštění souboru.

    Čas a datum. Například všechny systémy ukládají datum vytvoření soubor a datum poslední úpravy soubor. Ten hraje důležitou roli při sestavování (stavbě) velkých softwarových projektů, protože nástroje pro stavební projekty (např. udělat) určit Podle poměr dat poslední úpravy souborů zdrojového kódu a binárního kódu, zda má být zdrojový kód překompilován soubor.

    OS UNIX datum úpravy souboru lze změnit příkazem touch f, kde f je název souboru. Dotek doslova znamená dotek. Kromě změny času změny nejsou se souborem prováděny žádné další akce.

    Identifikace uživatele.V každém systému je tento koncept podporován vlastník (tvůrce) souboru (vlastník).Je to vlastník, kdo má právo udělovat ostatním uživatelům oprávnění k práci se souborem.

    Informace o souborech je uloženo ve struktuře adresáře ( nebo adresáře- adresáře), někdy například v systému Okna také zvaný složky– struktury v externí paměti obsahující symbolické názvy souborů a odkazy na ně. Základní koncept adresáře je podrobně popsán dále v této kapitole.

    Operace se soubory

    Přestože se soubor operací se soubory a zejména jejich označení systém od systému liší, lze rozlišit tyto hlavní: operace přes soubory.

    · Stvoření soubor ( Vytvořit). Vytvoří se hlavička souboru; zpočátku je jeho obsah (paměť) prázdný.

    · Záznam do souboru ( Napsat). Obvykle se to stává evidence nebo bloky- větší logické jednotky informací, které kombinují několik záznamů za účelem optimalizace I/O operace.

    · Čtení ze souboru ( číst). Obvykle se také provádí v deskách nebo blocích.

    · Nalezení pozice v souboru (umístění)(Hledat). Pozice je určena číslem záznamu nebo bloku, případně speciálními názvy označujícími začátek souboru (pozice před prvním záznamem) popř. konec souboru(pozice po posledním vstupu).

    · Odstranění soubor ( Vymazat). V závislosti na implementaci souborového systému, chybné smazání souboru může být fatální (UNIX) nebo náprava (MS DOS).

    · Redukce soubor ( Zkrátit).

    · Otevírací soubor ( OTEVŘENO) – vyhledání souboru v adresářové struktuře podle jeho symbolického názvu (cesty) a načtení jeho záhlaví a jednoho nebo více sousedních bloků do vyrovnávací paměť v hlavní paměti.

    · uzavření soubor ( zavřít) – zápis obsahu vyrovnávací paměti do bloků souborů; aktualizace souboru v externí paměti v souladu s jeho aktuálním stavem; uvolnění všech struktur v hlavní paměti spojené se souborem.

    Chcete-li provádět operace výměny se souborem ( číst psát), obvykle, soubor je potřeba otevřít. Zavření souboru je zodpovědnost uživatelský proces; pokud však on Podle z nějakého důvodu tak neučiní, pak zavře všechny soubory otevřené procesem, operační systém po dokončení nebo ukončení procesu.

    Typy souborů - názvy a přípony

    Tabulka 19.1 uvádí některé z nejběžnějších typů souborů a jejich odpovídající přípony názvů.

    Tabulka 19.1. Typy souborů - názvy a přípony
    typ souboru přípona jména funkčnost
    spustitelný kód(načíst modul) exe, com, bin nebo chybí program připravený ke spuštění v binárním strojovém kódu
    objektový modul obj, O zkompilovaný program v binárním kódu, ale nepropojený
    zdroj v programovacím jazyce ss, ss, java, pas, asm, A zdrojový kód v různých jazycích (C, Pascal atd.)
    dávkový soubor netopýr, sh příkazový soubor pro příkazový interpret
    text txt, doc textová data, dokumenty
    dokument pro textový procesor wp, tex, rtf doc dokument v libovolném formátu textový procesor
    knihovna lib, a, so, dll, mpeg, mov, rm knihovny modulů pro programování
    soubor pro tisk nebo vizualizaci oblouk, zip, dehet ASCII nebo binární soubor ve formátu pro tisk nebo vizualizaci
    archiv oblouk, zip, dehet více souborů seskupených do jednoho souboru pro archivace nebo skladování
    multimédia mpeg, mov, rm binární soubor obsahující audio nebo video informace

    Jejich význam je zřejmý z tabulky níže. Je třeba poznamenat, že v různých operačních systémech je akceptováno velmi málo jednotných přípon názvu - Podle zřejmě jen .txt(text) a rozšíření pro zdrojové kódy v programovacích jazycích, např. .C-Xi, .p nebo. pas-Pascal atd. Jsou volány objektové moduly Podle jinak (v Okna.obj, V UNIX - ), knihovny - také: staticky propojeny Okna - .lib, V UNIX - .A; dynamicky propojeno s Okna - .dll, V UNIX -.tak.Je zajímavé poznamenat, že pro spustitelný kód v Okna existuje standardní rozšíření -.exe a v UNIX- ne, ale existuje velmi exotický úplný standardní název: a.out (výstup sestavy).Sjednocené přípony názvů pro různé textové procesory: . doc-Microsoft Slovo, .pdf– Adobe Acrobat atd.

    Metody přístupu k souborům

    Tradičně se rozlišují soubory sekvenční přístup A přímý přístup.Sériový soubor- Tento soubor, přístup k čemuž je možné pouze umístěním na začátek a konec a poté výměnnými operacemi formuláře počet nebo aktualizovat další(předchozí) záznam. Soubor přímý přístup je soubor, pro které je přímý přístup pomocíčíslo záznamu a operace výměny s výslovným uvedením čísla záznamu. V každém případě při provádění výměny se souborem vždy nějaká je Aktuální pozicePodle soubor ukazující na některé záznam, na pozici před nebo po konci souboru. V operacích se soubory sekvenční přístup libovolná instalace pozice nejsou povoleny, ale pouze operace, automatický přesun aktuální pozice na další (předchozí) záznam.

    Podobná funkce je spojena s rozdílem v zařízeních, na kterých jsou soubory umístěny (například magnetická páska - Podle v podstatě sériové zařízení), ale potřeba organizovat sekvenční nebo přímé soubory může souviset s podstatou problému.

    Podle podle všeho sériový přístup používá se častěji: takto se zadávají údaje, závěr výsledky na těsnění nebo na obrazovce.

    Typický :

    reset - nastaví se na začátek čteného souboru

    přepsat– nastavte na začátek souboru, který se má zapsat.

    Typický operace přímý přístup:

    pozice k n polohování na záznam s číslem n

    přepsat n, kde n je relativní číslo bloku (záznamu).

    Popsaný výklad sekvenční soubory a operace na nich je znázorněna na Obr. 19.1.

    Rýže. 19.1. Soubor sériového přístupu.

    V případě potřeby můžete simulovat operace sekvenčního přístupu pro soubor s přímým přístupem. Simulační metoda je uvedena v tabulce 19.2.

    Ukazatel do aktuální polohy, charakteristické pro sekvenční přístup, pro soubor s přímým přístupem je modelován proměnnou cp, A operace sekvenčního přístupu– indikace operací přímého přístupu cp jako číslo bloku.

    Pro urychlení přístupu k velkému souboru můžete použít indexový soubor, obsahující odkazy na položky hlavního ( relativní) soubor. rýže. 19.2 ukazuje příklad hlavního souboru obsahujícího objednané Podle příjmení osobní údaje osob. index soubor protože tento hlavní soubor obsahuje odkazy na první logické záznamy dotazníků s daným příjmením, například Smith.


    Rýže. 19.2. Indexový soubor a hlavní soubor.

    Adresáře

    Adresář (adresář, složka)- uzel obsahující informace o souborech - jejich názvy a odkazy na soubory a další adresáře v externí paměti. Je tak možné uspořádat hierarchii adresářů nebo jejich složitějších vztahů až po libovolné grafy. Jak adresářová struktura, tak soubory jsou uloženy na disku. Adresáře podporují pojmenování souborů pomocí cesty– víceslabičná jména skládající se z názvu kořenového adresáře (nebo logické jednotky) a posloupnosti názvů adresářů následujících úrovní. Například v systému Okna c:\doc\plan.txtpřístupová cesta k souboru s uvedením jeho umístění - na logické jednotce C:,v adresáři doc(dokumenty) a název souboruplan.txt.Name obsahuje příponu označující typ souboru.

    Záloha(záloha) soubory a adresáře se spouští na speciálních médiích k tomu určených – například na pásce ( stuha), blesk- Paměť, externí přenosný pevný disk, kompaktní disk (CD, DVD). Důrazně se doporučuje pravidelně kopírovat nejdůležitější adresáře na externí média (nebo několik externích médií).

    Vlastnosti souborového systému v "Elbrus"

    Když už mluvíme o adresářové struktuře a pojmenování souborů, nelze nezmínit tak exotický souborový systém, jako je v Elbrus International Exhibition Complex. Čtenářům pomůže porovnat a lépe ocenit rozmanitost přístupů k souborovým systémům.

    Hlavními koncepty souborového systému Elbrus MVK jsou soubory, kontejnery, referenční knihy. pojem kontejner v Elbrusu má blízko k modernímu pojetí objemu a kontejneru v systémech Okna a solaris: kontejner je úložiště souborů na jednom nebo více discích. Pojem adresář je blízký pojmu adresář v tradičních souborových systémech.

    Soubor v "Elbrus" se skládá z hlavičky a paměti. Záhlaví ukládá atributy souboru, jejichž počet je asi 100 (!).

    Podstatný rozdíl v souborovém systému Elbrus je v tom, že je to možné vytvoření souboru a řízení bez dávat mu název, tj. bez jeho zobrazení v adresářích (adresářích). Tak dočasné soubor vytvořené v programu odkaz na soubor uloženy v globální nebo lokální proměnné a Podle konec provádění programu soubor je zničen, pokud nebyl zachráněn odkaz v návodu na disku. Soubory se také mohou navzájem propojovat ( v přímce„fyzický“ odkaz na soubor spíše než pomocí symbolických cest) přes externí referenční adresáře (SHS) Každý soubor má .CBC. Jeho prvky jsou řešeny Podlečísla, ne Podle jména. Typický příklad: soubor objektového kódu (FOC) odkazuje prostřednictvím své CBC na soubor přípony souborů objektového kódu (DFOC), obsahující v jednotné podobě tabulky pojmenovaných entit definovaných v programu a jeho procedurách. Mluvení moderní jazyk, DFOC obsahuje metadata. Tento vztah se používá při diagnostice chyb za běhu ak mnoha dalším účelům.

    Mezi nevýhody souborového systému Elbrus patří komplikovaná struktura souborů, velké množství atributů, závislost logická struktura soubor a sadu operací s ním z typu externí zařízení na kterém se nachází. Podle ve srovnání se souborovým systémem Elbrus je souborový systém v UNIX mnohem jednodušší a pohodlnější, ale v žádném případě ne horší Podle funkčnost.

    Typická organizace souborového systému je znázorněna na Obr. 19.3.


    Rýže. 19.3. Organizace souborového systému.

    Souborové systémy jsou organizovány do disky. Každý disk rozdělen na oddíly - sousední oblasti diskové paměti, které mají své vlastní logické názvy (obvykle ve formě prvních písmen latinské abecedy). Je však také možné uspořádat oddíl, který zahrnuje více disků. K rozdělení disku na sekce utilitu doporučujeme Partition Magic. Oddíly ukládají adresáře a soubory. Každá sekce má kořenový adresář, které lze v případě potřeby zorganizovat podadresáře na kterou se odvolává.

    Mějte na paměti, že různé oddíly mohou mít různé operační systémy nainstalované pomocí různých formátování a různé systémy souborů pro jejich práci. I když je na počítači nainstalován pouze jeden OS, jiný sekce mohou používat různé typy souborových systémů, například v Okna oddíl A může používat souborový systém FAT32 a oddíl B je systém souborů NTFS. Linux lze nainstalovat na oddíl C pomocí vlastního souborového systému. Ext2Fs.


    ©2015-2019 web
    Všechna práva náleží jejich autorům. Tato stránka si nečiní nárok na autorství, ale poskytuje bezplatné použití.
    Datum vytvoření stránky: 2016-04-11

    Předmět: Souborový systém OS.

    Část operačního systému, která pracuje se soubory, se nazývásouborový systém (FS)

    Aspekty FS(z pohledu uživatele) je její vnější reprezentace, tzn.

      pojmenování a ochrana souborů;

      operace se soubory;

    Pojmenování souboru :

    Když je soubor vytvořen, proces mu dá název. Když proces skončí, soubor nadále existuje a ostatní procesy mohou k souboru přistupovat pod jeho názvem.

    Všechny moderní operační systémy Jako názvy souborů se používají 8místné textové řetězce.Rovněž je povoleno použití čísel a speciálních znaků v názvech souborů. Mnoho souborových systémů podporuje názvy souborů až do 255 znaků.

    Některé souborové systémy rozlišují mezi velkými a malými písmeny (např. Unix). V systému MS-DOS takový rozdíl neexistuje.

    Mnoho operačních systémů jako napřOkna 95 , Okna 98 použít FSOS SLEČNA - DOS a zdědí mnoho jeho vlastností, včetně pojmenování souborů.OS Okna NT , Okna 2000 podporuje také FSSLEČNA - DOS a zdědit jeho vlastnosti. Poslední dva operační systémy však mají vlastní FS( NTFS ) , který má své vlastní vlastnosti (například názvy souborů v kódováníUnicode).

    V mnoha operačních systémech se názvy souborů mohou skládat ze 2 částí oddělených tečkou

    (název souboru. přípona souboru) a obvykle znamená typ souboru.

    VSLEČNA - DOS název souboru obsahuje8 znaků + 3 znaky přiřazené příponě souboru. Na některých operačních systémech (např.Unix ) jsou přípony souborůjen dohody kterých se uživatelé mohou držet.

    Způsoby, jak strukturovat soubory:

      Nestrukturovaná sekvence bajtů.

    V tomto případěOS se nezajímá o obsah souboru . Jediné, co vidí, jsou bajty. Těmto bajtům jsou přiřazeny hodnoty programy na uživatelské úrovni.Tento přístup se používá v OSOkna, Unix. Tento přístup poskytujemaximální flexibilita .

      Posloupnost záznamů

    první krok ke strukturování souborů. V tomto modelu je soubor posloupností záznamů pevné délky, z nichž každý má svou vlastní vnitřní strukturu. V tomto přístupu je důležité, že operace čtení vrátí jeden záznam a operace zápisu přepíše nebo připojí jeden záznam.

      Třetí možností jesoubor je strom záznamů, nemusí mít nutně stejnou délku.

    Každý záznam pevné pozice obsahuje klíčové pole. Strom je řazen podle pole klíče, které umožňuje rychlé vyhledání daného klíče. Tento typ reprezentace souborových systémů je široce používán na velkých sálových počítačích, které se používají pro komerční zpracování dat.

    Typy souborů:

      Běžné soubory– zahrnují všechny soubory obsahující informace o uživateli.

      Katalogy– systémové soubory, které poskytují podporu pro strukturu FS.

      Speciální soubory postav- souvisí se vstupem a výstupem a používají se k modelování sériových vstupně výstupních zařízení, jako jsou terminály, tiskárny, sítě.

      Blokovat speciální soubory- slouží k simulaci disků.

    Běžné soubory jsou většinou buď soubory ASCII nebo binární soubory. Soubory ASCII se skládají z textových řádků. Na některých operačních systémech každý řádek končí na znak návratu vozíku. Některé (unix) použití znak nového řádku. V systému MS-DOS se používají oba znaky. Řetězce nemusí být stejně dlouhé.

    Zbytek souborů se nazývá binární soubory, tzn. nejsou soubory ASCII. Obvykle mají nějakou vnitřní strukturu známou programu, který je používá (obrázek 6.2).

    Přístup k souboru:

    Ve starších operačních systémech byl poskytován pouze jeden přístup k souborům - konzistentní. Při sekvenčním přístupu k souboru může proces číst pouze bajty nebo zápisy souboru sekvenčně.

    Soubory, jejichž bajty lze číst v náhodném pořadí, se nazývají náhodné soubory ( Přímo) přístup. Používá se například pro databázové aplikace.

    Atributy souboru:

    Další informace o souboru (datum, čas vytvoření) se nazývají atributy souboru. Seznam atributů se může lišit v závislosti na OS.

    Hodnota atributu

    Ochrana Kdo a jak má k souboru přístup

    Heslo Heslo pro přístup k souboru

    Tvůrce ID uživatele, který soubor vytvořil

    Majitel Současný majitel

    Příznak pouze pro čtení 0 - pro čtení / zápis; 1 - pouze pro čtení

    Vlajka "Skrytá" 0 - normální, 1 - nezobrazovat v seznamu souborů katalogu

    Příznak "Systém" 0 - normální; 1- systémový

    Vlajka "Archiv" 0 - archivováno; 1 - nutná archivace

    ASCII příznak/binární 0 – ASCII; 1- binární

    Příznak náhodného přístupu 0 - pouze sekvenční přístup; 1 - náhodný přístup

    Vlajka "dočasná" 0 - normální, 1 - pro smazání souboru na konci procesu

    Blokovat příznaky 0 - neblokováno; nenulová pro blokované

    Délka záznamu Počet bajtů na položku

    Doba stvoření Datum a čas vytvoření souboru

    Naposledy

    přístup datum a čas poslední změna soubor

    aktuální velikost Počet bajtů v souboru

    Maximální velikost Počet bajtů, na které lze zvětšit velikost souboru

    Operace se soubory

    Pro práci se soubory lze v OS použít následující systémové funkce:

      Vytvořit(Stvoření). Soubor je vytvořen bez dat. Toto systémové volání oznámí nový soubor a umožní vám nastavit některé jeho atributy.

      Vymazat(vymazání). Mazání souboru.

      OTEVŘENO(Otevření) - před prací se souborem jej musíte otevřít. Toto systémové volání umožňuje systému číst RAM atributy souboru a seznam adres disku pro rychlý přístup k obsahu souboru při dalších voláních.

      zavřít(zavírání).

      číst(čtení). Čtení dat ze souboru.

      Napsat(záznam). Pokud je aktuální pozice na konci souboru, velikost souboru se automaticky zvětší. V opačném případě se zápis provede přes existující data, která jsou navždy ztracena.

      Připojit(dodatek). Zkrácená forma zápisu. Data lze připojit pouze na konec souboru.

      Hledat(Vyhledávání). Pro soubory s náhodným přístupem. Nastaví ukazatel souboru na konkrétní pozici v souboru. Po provedení tohoto systémového volání lze data z této pozice číst nebo do ní zapisovat.

      Dostatatributy(získávání atributů).

      souboratributy(Nastavení atributů)

      Přejmenovat(přejmenovat) - změna názvu souboru.

    Typy souborového systému (adresářová forma):

      jednoúrovňový FS. Mít kořenový adresář.

      Dvouúrovňový adresářový systém. Přítomnost kořenového adresáře - uživatelské adresáře.

      Hierarchický (víceúrovňový) katalogový systém - soubor adresářů a podadresářů.

    Systémová volání pracovat s adresáři:

      Create - vytvoření adresáře.

      Smazat - smazání adresáře.

      opendir - otevření adresáře.

      Closedir Zavře adresář.

      Readdir Přečtěte si další položku v otevřeném adresáři.

      Přejmenovat – přejmenuje adresář.

      Link - Navazování odkazů.

    Struktura souborového systému (vývojář)

    Souborové systémy jsou uloženy na discích. Většinu disků lze rozdělit do více oddílů s nezávislým souborovým systémem na každém oddílu.

    Sektor 0 disku se nazývá hlavní spouštěcí záznam (MBR, MistrBotazáznam) a používá se ke spuštění počítače.

    Na konci hlavního spouštěcího záznamu je tabulka oddílů. Tato tabulka ukládá počáteční a koncové adresy (čísla bloků) každého oddílu. Jeden z oddílů je v tabulce označen jako aktivní.

    Když je počítač spuštěn, BIOS načte a spustí záznam MBR, poté bootloader určí aktivní oddíl disku v záznamu MBR, přečte jeho první blok, nazývaný spouštěcí blok, a provede jej.

    Program v zaváděcím bloku načte OS v tomto oddílu.

    Každý diskový oddíl začíná spouštěcím blokem, i když neobsahuje zaváděcí OS.

    FS často obsahují některé z prvků znázorněných na Obr. 6.8. Jeden z těchto prvků se nazývá superblok , obsahuje klíčové parametry FS a je načten do paměti při spuštění počítače nebo při prvním přístupu k FS. Typické informace uložené v superbloku zahrnují magické číslo pro rozlišení mezi systémovými soubory, počtem bloků v systému souborů a klíčovými administrativními informacemi.

    Dále jsou informace o volné bloky souborový systém, například ve formě bitmapa nebo seznam ukazatelů. Po těchto informacích mohou následovat informace o i-uzly, což je pole datových struktur, jedna struktura na soubor, obsahující všechny informace o souborech.

    Může být následováno kořenový adresář, obsahující vrchol stromu FS. Zbytek místa na diskovém oddílu zabírají všechny ostatní soubory a adresáře.

    Struktura FSSLEČNA- DOS

    Pevné disky jsou určeny pro trvalé ukládání informací.

    Disk má jednotné pokrytí, ve kterém jsou uložena data. DOS uspořádává data v sekvencích 512 bajtů, které se nazývají sektory, ale v zásadě si operační systém může organizovat data na disku, jak se mu zlíbí.