• OLAP veri küpleri. OLAP-CUBE (dinamik yönetim raporlaması)

    Dipnot: Bu ders, OLAP veri ambarları için veri küpü tasarlamanın temellerini kapsar. Örnek, CASE aracını kullanarak bir veri küpünün nasıl oluşturulacağını gösterir.

    dersin amacı

    Bu dersin materyalini inceledikten sonra şunları bileceksiniz:

    • veri küpü nedir OLAP veri ambarı ;
    • için bir veri küpü nasıl tasarlanır? OLAP veri ambarları ;
    • veri küpü boyutu nedir;
    • gerçeğin veri küpü ile nasıl ilişkili olduğu;
    • boyut nitelikleri nelerdir;
    • hiyerarşi nedir;
    • veri küpü metriği nedir;

    ve öğren:

    • inşa etmek çok boyutlu çizelgeler ;
    • basit tasarım çok boyutlu çizelgeler.

    giriiş

    OLAP teknolojisi tek başına değildir yazılım, Olumsuz Programlama dili. OLAP'ı tüm tezahürleriyle ele almaya çalışırsanız, bu, altında yatan bir dizi kavram, ilke ve gerekliliktir. yazılım ürünleri, analistlerin verilere erişmesini kolaylaştırıyor.

    Analistler, kurumsal bilgilerin ana tüketicileridir. Bir analistin görevi, büyük veri kümelerinde kalıplar bulmaktır. Bu nedenle analist, belirli bir günde alıcı Ivanov'a bir toplu tükenmez kalem satıldığı gerçeğine dikkat etmeyecek - yüzlerce ve binlerce benzer olay hakkında bilgiye ihtiyacı var. Veri ambarındaki tek gerçekler, örneğin, yetkinliği belirli bir sözleşmeyi desteklemek olan bir muhasebeci veya satış departmanı başkanı için ilgi çekici olabilir. Bir analist için bir kayıt yeterli değildir - örneğin, bir aylık, üç aylık veya yıllık tüm satış noktası sözleşmeleri hakkında bilgiye ihtiyacı olabilir. Analytics, alıcının VKN'si veya telefon numarasıyla ilgilenmeyebilir - profesyonel faaliyetinin özü olan belirli sayısal verilerle çalışır.

    Merkezileştirme ve uygun yapılanma, bir analistin ihtiyaç duyduğu her şeyden uzaktır. Bilgileri görüntülemek, görselleştirmek için bir araca ihtiyacı var. Bununla birlikte, tek bir veri ambarı temelinde oluşturulan geleneksel raporlar bile belirli bir esneklikten yoksundur. Verilerin istenen görünümünü elde etmek için "bükülemez", "genişletilemez" veya "daraltılamaz". Bir analist ne kadar çok "dilim" ve "dilim" keşfedebilirse, o kadar çok fikre sahip olur ve bu da doğrulama için giderek daha fazla "dilim" gerektirir. Veri keşfi için böyle bir araç olarak, analist OLAP'tır.

    OLAP, bir veri ambarının gerekli bir özelliği olmamasına rağmen, bu veri ambarında biriken bilgileri analiz etmek için giderek daha fazla kullanılmaktadır.

    Operasyonel veriler çeşitli kaynaklardan toplanır, temizlenir, entegre edilir ve veri ambarına eklenir. Aynı zamanda, çeşitli raporlama araçları kullanılarak analiz için hazırdırlar. Daha sonra veriler (tamamen veya kısmen) OLAP analizi için hazırlanır. Özel bir OLAP veritabanına yüklenebilir veya ilişkisel bir veri ambarında bırakılabilirler. en önemli unsur OLAP'ın kullanımları meta verilerdir, yani yapı, düzen ve veri dönüşümü. Onlar sayesinde çeşitli depolama bileşenlerinin etkin etkileşimi sağlanır.

    Böylece, OLAP, bir veri ambarında biriken verilerin çok boyutlu analizi için bir dizi araç olarak tanımlanabilir.. Teorik olarak, OLAP araçları doğrudan operasyonel verilere veya bunların tam kopyalarına uygulanabilir. Ancak bu analize uygun olmayan verilerin analize tabi tutulma riski vardır.

    İstemci ve sunucuda OLAP

    OLAP'ın merkezinde çok boyutlu veri analizi vardır. Koşullu olarak istemci ve sunucu OLAP araçlarına bölünebilen çeşitli araçlar kullanılarak üretilebilir.

    İstemci tarafı OLAP araçları, birleştirilmiş verileri (toplamlar, ortalamalar, maksimumlar veya minimumlar) hesaplayan ve görüntüleyen uygulamalardır ve toplanan verilerin kendisi OLAP aracının adres alanında önbelleğe alınır.

    Kaynak veriler bir masaüstü DBMS'de bulunuyorsa, toplu veriler OLAP aracının kendisi tarafından hesaplanır. Kaynak verilerin kaynağı bir sunucu DBMS ise, istemci OLAP araçlarının çoğu sunucuya GROUP BY yan tümcesini içeren SQL sorguları gönderir ve sonuç olarak sunucuda hesaplanan toplu verileri alır.

    Kural olarak, OLAP işlevselliği, istatistiksel veri işleme araçlarında (Stat Soft ve SPSS şirketlerinin ürünleri, Rusya pazarında bu sınıftaki ürünler arasında yaygın olarak dağıtılmaktadır) ve bazı elektronik tablolarda uygulanmaktadır. özellikle, Microsoft Excel 2000. Bu ürünle, küçük bir yerel çok boyutlu OLAP küpü oluşturabilir ve bir dosya olarak kaydedebilir ve iki veya üç boyutlu bölümlerini görüntüleyebilirsiniz.

    Birçok Geliştirme araçları en basit OLAP işlevselliğini (Borland Delphi ve Borland C++Builder'daki Karar Küpü bileşenleri gibi) uygulayan uygulamalar oluşturmanıza izin veren sınıf veya bileşen kitaplıkları içerir. Ayrıca birçok firma teklif veriyor. kontroller ActiveX ve benzer işlevleri uygulayan diğer kitaplıklar.

    İstemci OLAP araçlarının, kural olarak, az sayıda boyutla (genellikle altıdan fazla olmaması önerilir) ve bu parametreler için az çeşitli değerlerle kullanıldığını unutmayın - sonuçta, alınan toplu veriler sığmalıdır. Böyle bir aracın adres uzayı ve sayısı, ölçüm sayısındaki artışla katlanarak artar. Bu nedenle, en ilkel müşteri OLAP araçları bile, kural olarak, içinde çok boyutlu bir küp oluşturmak için gerekli RAM miktarının bir ön hesaplamasını yapmanıza izin verir.

    Çoğu (hepsi değil) istemci tarafı OLAP araçları, toplu veri önbelleğinin içeriğini bir dosya olarak saklamanıza izin verir ve bu da bunların yeniden hesaplanmasını engeller. Bu fırsatın genellikle toplu verileri başka kuruluşlara aktarmak veya yayınlamak üzere yabancılaştırmak için kullanıldığını unutmayın. Bu tür yabancılaştırılmış toplu verilerin tipik bir örneği, farklı bölgelerde ve farklı yaş gruplarında meydana gelen insidans istatistikleridir. açık bilgiçeşitli ülkelerin sağlık bakanlıkları ve Dünya Sağlık Örgütü tarafından yayınlanan Aynı zamanda, hakkında bilgi olan orijinal verinin kendisi özel durumlar hastalıklar, sağlık kurumlarının gizli verileridir ve hiçbir durumda sigorta şirketlerinin eline geçmemeli ve hatta kamuya açıklanmamalıdır.

    Bir dosyada toplu verilerle bir önbellek kaydetme fikri, Daha fazla gelişme toplu verilerin depolanması ve değiştirilmesinin yanı sıra bunları içeren depolamanın bakımının OLAP sunucusu adı verilen ayrı bir uygulama veya işlem tarafından gerçekleştirildiği sunucu tarafı OLAP araçlarında. İstemci uygulamaları, bu tür çok boyutlu depolamayı talep edebilir ve yanıt olarak bazı verileri alabilir. Bazı istemci uygulamaları da bu tür depolar oluşturabilir veya bunları değişen kaynak verilerine göre güncelleyebilir.

    İstemci OLAP araçlarına kıyasla sunucu OLAP araçlarını kullanmanın avantajları, masaüstü araçlara kıyasla sunucu DBMS kullanmanın avantajlarına benzer: sunucu araçlarının kullanılması durumunda, toplu verilerin hesaplanması ve depolanması sunucuda ve istemci uygulamasında gerçekleşir. yalnızca onlara yapılan sorguların sonuçlarını alır, bu da genel olarak azaltmanıza olanak tanır ağ trafiği, kurşun zamanı istemci uygulaması tarafından tüketilen istekler ve kaynak gereksinimleri. Kurumsal ölçekte analiz ve veri işlemenin kural olarak tam olarak örneğin Oracle Express Server, Microsoft SQL Server 2000 Analysis Services, Hyperion Essbase, Crystal Decisions ürünleri, Business Objects, Cognos gibi sunucu OLAP araçlarına dayalı olduğunu unutmayın. , S.A.S Enstitüsü. Sunucu DBMS'nin tüm önde gelen üreticileri belirli sunucu OLAP araçlarını ürettikleri (veya diğer şirketlerden lisans aldıkları) için, seçenekleri oldukça geniştir ve hemen hemen her durumda, veritabanı sunucusunun kendisiyle aynı üreticiden bir OLAP sunucusu satın alabilirsiniz.

    Pek çok istemci OLAP aracının (özellikle Microsoft Excel 2003, Seagate Analysis, vb.), sunucu OLAP depolarına erişmenize izin verdiğini ve bu durumda istemci uygulamaları yürüten istemci uygulamaları olarak hareket ettiğini unutmayın. benzer istekler. Ayrıca, çeşitli üreticilerin OLAP araçları için istemci uygulamaları olan birçok ürün vardır.

    Çok boyutlu veri depolamanın teknik yönleri

    Çok boyutlu veri ambarları, örneğin güne, aya, yıla, ürün kategorisine göre satış hacimleri gibi farklı derecelerde ayrıntıya sahip toplu veriler içerir. Toplu verilerin saklanmasının amacı, kurşun zamanı talepler, çünkü çoğu durumda analiz ve tahminler için ayrıntılı değil, ilgilenilen özet verilerdir. Bu nedenle, çok boyutlu bir veritabanı oluştururken, bazı toplu veriler her zaman hesaplanır ve saklanır.

    Tüm toplu verileri kaydetmenin her zaman haklı olmadığını unutmayın. Gerçek şu ki, yeni boyutlar eklerken, küpü oluşturan veri miktarı katlanarak artıyor (bazen veri miktarının "patlayıcı büyümesi" hakkında söyleniyor). Daha spesifik olarak, toplam verinin ne kadar büyüdüğü, küp boyutlarının sayısına ve her bir boyut üyesine bağlıdır. çeşitli seviyeler Bu boyutların hiyerarşileri. "Patlayıcı büyüme" sorununu çözmek için, olası tüm toplu verilerden uzakta hesaplanırken kabul edilebilir bir sorgu yürütme hızı elde etmeyi sağlayan çeşitli şemalar kullanılır.

    Hem kaynak hem de toplu veriler, ilişkisel veya çok boyutlu yapılarda saklanabilir. Bu nedenle, şu anda verileri depolamanın üç yolu vardır.

    • MOLAP(Çok boyutlu OLAP) - kaynak ve birleştirilmiş veriler çok boyutlu bir veritabanında saklanır. Verileri çok boyutlu yapılarda depolamak, verileri çok boyutlu bir dizi olarak değiştirmenize olanak tanır, böylece toplam değerleri hesaplama hızı boyutların herhangi biri için aynıdır. Ancak bu durumda, çok boyutlu veri tabanı orijinal ilişkisel verileri tamamen içerdiğinden, çok boyutlu veri tabanı gereksizdir.
    • ROLAP(İlişkisel OLAP) - Orijinal veriler, orijinal olarak bulunduğu aynı ilişkisel veritabanında kalır. Toplu veriler, aynı veritabanında saklanmaları için özel olarak oluşturulan hizmet tablolarına yerleştirilir.
    • HOLAP(Hibrit OLAP) - Orijinal veriler, orijinal olarak bulunduğu aynı ilişkisel veritabanında kalırken, toplam veriler çok boyutlu bir veritabanında depolanır.

    Bazı OLAP araçları, veri depolamayı yalnızca ilişkisel yapılarda, bazıları ise yalnızca çok boyutlu olanlarda destekler. Ancak, modern OLAP sunucu araçlarının çoğu üç veri depolama yöntemini de destekler. Depolama yönteminin seçimi, kaynak verilerin hacmine ve yapısına, sorgu yürütme hızı gereksinimlerine ve OLAP küplerini güncelleme sıklığına bağlıdır.

    Ayrıca, modern OLAP araçlarının büyük çoğunluğunun "boş" değerleri saklamadığını da not ediyoruz ("boş" değere bir örnek, sezon dışı mevsimlik ürünlerin satışının olmaması olabilir).

    Temel OLAP Kavramları

    FAMSI testi

    Karmaşık çok boyutlu veri analizi teknolojisine OLAP (Çevrimiçi Analitik İşleme) denir. OLAP, bir veri ambarı organizasyonunun önemli bir bileşenidir. OLAP kavramı, 1993 yılında tanınmış bir veritabanı araştırmacısı ve ilişkisel veri modelinin yazarı Edgar Codd tarafından tanımlanmıştır. 1995 yılında, Codd tarafından belirlenen gerekliliklere dayanarak, sözde FASMI testi(Paylaşılan Çok Boyutlu Bilginin Hızlı Analizi) - çok boyutlu analiz uygulamaları için aşağıdaki gereksinimler dahil olmak üzere, paylaşılan çok boyutlu bilgilerin hızlı analizi:

    • Hızlı(Hızlı) - daha az ayrıntılı analiz pahasına olsa bile, kullanıcıya makul bir sürede (genellikle en fazla 5 sn) analiz sonuçlarının sağlanması;
    • analiz(Analiz) - belirli bir uygulamaya özgü herhangi bir mantıksal ve istatistiksel analizi gerçekleştirme ve bunu son kullanıcının erişebileceği bir biçimde kaydetme yeteneği;
    • paylaşılan(Paylaşılan) - uygun kilitleme mekanizmaları ve yetkili erişim araçları desteği ile verilere çok kullanıcılı erişim;
    • Çok boyutlu(Çok boyutlu) - Hiyerarşiler ve çoklu hiyerarşiler için tam destek dahil olmak üzere verilerin çok boyutlu kavramsal temsili (bu, önemli bir OLAP gereksinimidir);
    • Bilgi(Bilgi) - uygulama, hacmi ve depolama konumu ne olursa olsun gerekli tüm bilgilere erişebilmelidir.

    OLAP işlevselliğinin uygulanabileceğine dikkat edilmelidir. Farklı yollar, en basit veri analiz araçlarından başlayarak Ofis uygulamaları ve sunucu ürünlerine dayalı dağıtılmış analitik sistemlerle son bulur.

    Bilginin çok boyutlu gösterimi

    Küba

    OLAP, iş bilgilerine erişmek, bunları görüntülemek ve analiz etmek için uygun, yüksek hızlı bir yol sağlar. Kullanıcı doğal, sezgisel bir veri modeli, onları çok boyutlu küpler (Küpler) şeklinde organize eder. Çok boyutlu koordinat sisteminin eksenleri, analiz edilen iş sürecinin ana nitelikleridir. Örneğin, satış için bir ürün, bölge, alıcı türü olabilir. Ölçümlerden biri olarak zaman kullanılır. Ölçüm eksenlerinin kesişme noktalarında (Boyutlar), süreci nicel olarak karakterize eden veriler vardır - ölçümler (Ölçüler). Bunlar, parçalar halinde veya parasal olarak satış hacimleri, stok bakiyeleri, maliyetler vb. bilgi ve analiz sürecinde aklına gelen diğer manipülasyonları gerçekleştirir.

    Şekil l'de gösterilen üç boyutlu küpün ölçüleri olarak. 26.1'de satış miktarları, ölçüm olarak ise zaman, ürün ve mağaza kullanılmıştır. Ölçümler belirli gruplama seviyelerinde sunulur: ürünler kategoriye göre gruplanır, mağazalar ülkeye göre gruplanır ve işlem süreleri aya göre gruplanır. Biraz sonra gruplandırma seviyelerine (hiyerarşilere) daha detaylı bakacağız.


    Pirinç. 26.1.

    Küpü "kesmek"

    Üç boyutlu bir küpün bile bilgisayar ekranında görüntülenmesi, ilgilenilen ölçülerin değerlerinin görülebilmesi için zordur. Üçten fazla boyutu olan küpler hakkında ne söyleyebiliriz? Bir küpte depolanan verileri görselleştirmek için, kural olarak, karmaşık hiyerarşik satır ve sütun başlıklarına sahip olağan iki boyutlu, yani tablo gösterimleri kullanılır.

    Bir küpün iki boyutlu bir temsili, onu bir veya daha fazla eksen (boyut) boyunca "keserek" elde edilebilir: ikisi hariç tüm boyutların değerlerini sabitleriz ve normal bir iki boyutlu elde ederiz. masa. Tablonun yatay ekseni (sütun başlıkları) bir boyutu, dikey eksen (satır başlıkları) başka bir boyutu ve tablo hücreleri ölçü değerlerini temsil eder. Bu durumda, ölçüler kümesi aslında boyutlardan biri olarak kabul edilir: ya görüntülemek için bir ölçü seçeriz (ve sonra satırların ve sütunların başlıklarına iki boyut yerleştirebiliriz) ya da birkaç ölçü (ve sonra bir tane) gösteririz. tablonun eksenlerinin her biri, ölçülerin adları ve diğer - tek bir "kesilmemiş" boyutun değerleri tarafından işgal edilecektir).

    (seviyeler). Örneğin, üzerinde sunulan etiketler tüm OLAP araçları tarafından desteklenmez. Örneğin, Microsoft Analysis Services 2000'de her iki hiyerarşi türü de desteklenirken, Microsoft OLAP Services 7.0'da yalnızca dengeli olanlar desteklenir. Farklı OLAP araçlarında farklı olan, hiyerarşi seviyelerinin sayısı ve bir seviyede izin verilen maksimum üye sayısı ve mümkün olan maksimum boyut sayısı olabilir.

    OLAP Uygulama Mimarisi

    OLAP hakkında yukarıda söylenen her şey aslında verilerin çok boyutlu sunumuna atıfta bulunuyordu. Kabaca söylemek gerekirse, müşterinin kullandığı aracın ne son kullanıcısı ne de geliştiricileri, verilerin nasıl depolandığını önemsemez.

    OLAP uygulamalarında çok boyutluluk üç seviyeye ayrılabilir.

    • Çok boyutlu veri temsili - çok boyutlu görselleştirme ve veri işleme sağlayan son kullanıcı araçları; çok boyutlu temsil katmanı, verinin fiziksel yapısından soyutlar ve veriyi çok boyutlu olarak ele alır.
    • Çok boyutlu işleme, çok boyutlu sorguları formüle etmek için bir araçtır (dil). SQL dili burada kullanılamaz olduğu ortaya çıkıyor) ve böyle bir talebi işleyebilen ve yürütebilen bir işlemci.
    • Çok boyutlu depolama - çok boyutlu sorguların verimli bir şekilde yürütülmesini sağlayan verilerin fiziksel organizasyonu anlamına gelir.

    İlk iki seviye hatasız tüm OLAP araçlarında bulunur. Üçüncü seviye, yaygın olarak kullanılmasına rağmen gerekli değildir, çünkü çok boyutlu temsil için veriler sıradan ilişkisel yapılardan da elde edilebilir; bu durumda çok boyutlu sorgu işlemcisi, çok boyutlu sorguları yürütülen SQL sorgularına çevirir ilişkisel VTYS.

    Belirli OLAP ürünleri genellikle çok boyutlu bir veri sunum aracıdır (OLAP istemcisi - örneğin, Microsoft'tan Excel 2000'deki Pivot Tablolar veya Knosys'ten ProClarity) veya çok boyutlu bir arka uç DBMS'dir (OLAP sunucusu - örneğin Oracle Express Server veya Microsoft OLAP) Hizmetler).

    Çok boyutlu işleme katmanı genellikle OLAP istemcisinde ve/veya OLAP sunucusunda bulunur, ancak Microsoft'un Pivot Tablo Hizmeti bileşeni gibi en saf haliyle izole edilebilir.

    OLAP (Çevrimiçi Analitik İşleme) elektronik bir yoldur analitik işlemeönceden hesaplanmış toplamları kullanarak verilerin hiyerarşik kategoriler halinde organizasyonunu temsil eden veriler. OLAP verileri hiyerarşik olarak düzenlenir ve tablolar yerine küpler halinde depolanır. OLAP küpleri, parametrelerin çizildiği eksenlere ve parametreye bağlı toplu veriler içeren hücrelere sahip çok boyutlu bir veri kümesidir. Küpler, çok sayıda bireysel kayıt yerine raporlar için yalnızca özet sonuçlar sağladığından, büyük miktarda verinin karmaşık, çok boyutlu analizi için tasarlanmıştır.

    OLAP kavramı, 1993 yılında ünlü veri tabanı araştırmacısı ve ilişkisel veri modelinin yazarı E. F. Codd tarafından tanımlanmıştır. Şu anda, OLAP desteği birçok DBMS ve diğer araçlarda uygulanmaktadır.

    Bir OLAP küpü iki tür veri içerir:

    Toplam değerler, özetlemek istediğiniz değerler, temsil eden hesaplanan veri alanları;

    açıklayıcı bilgi ölçümler veya boyutlar. Tanımlayıcı bilgiler genellikle ayrıntı seviyelerine ayrılır. Örneğin: "Zaman" boyutunda "Yıl", "Çeyrek", "Ay" ve "Gün". Rapor kullanıcıları, alanları ayrıntı düzeylerine dağıtarak, üst düzey bir özetten başlayıp daha ayrıntılı bir görünüme geçerek veya tam tersini yaparak, görüntülemek istedikleri ayrıntı düzeyini seçebilirler.

    Microsoft Query araçları, aşağıdakiler gibi ilişkisel veritabanı verilerini yükleyen bir sorgudan OLAP küpleri oluşturmanıza da olanak tanır: Microsoft Erişimi, doğrusal tablo ise yapısal bir hiyerarşiye (küp) dönüştürülür.

    OLAP Küp Oluşturma Sihirbazı yerleşiktir Microsoft aracı sorgu. İlişkisel veritabanına dayalı bir OLAP küpü oluşturmak için sihirbazı çalıştırmadan önce aşağıdaki adımları tamamlamanız gerekir.

    1. Veri kaynağını tanımlayın (bkz. Şekil 6.1).

    2. Microsoft Query'yi kullanarak, yalnızca OLAP küpünün veri alanları veya boyut alanları olacak alanları içeren bir sorgu oluşturun, eğer küpteki alan birden fazla kullanılıyorsa, sorguya dahil edilmelidir. doğru numara bir kere.

    3. Sorgu Oluşturma Sihirbazının son adımında, radyo düğmesini şu şekilde ayarlayın: Şuradan bir OLAP küpü oluşturun: verilen istek (bkz. Şekil 6.2) veya doğrudan menüde Sorgu araçları kullanılarak sorgu oluşturulduktan sonra Dosya takım seç Yaratmak OLAP küpü OLAP Küp Oluşturma Sihirbazını başlatacak olan.

    OLAP Küp Oluşturma Sihirbazı'nın üç adımı vardır.

    Sihirbazın ilk adımında (bkz. Şekil 6.6), veri alanları– Toplamları tanımlamak istediğiniz hesaplanmış alanlar.



    Pirinç. 6.6. Veri alanlarını tanımlama

    Sihirbaz önerilen hesaplanan alanları (genellikle sayısal alanlar) listenin en üstüne yerleştirir, işaretler ve bu alanların nihai işlevini belirler, genellikle - toplam. Veri alanları seçilirken, hesaplanan alan olarak en az bir alan seçilmeli ve boyut tanımlamak için en az bir alan işaretlenmemiş kalmalıdır.

    Bir OLAP küpü oluştururken dört özet işlevi kullanılabilir - toplam, Sayı(değer sayısı), Asgari, Maksimum sayısal alanlar ve bir işlev için Sayı diğer tüm alanlar için. Aynı alan için birkaç farklı özet işlevi kullanmak istiyorsanız, o alanın sorguya gerektiği kadar dahil edilmesi gerekir.

    Hesaplanan alan adı bir sütunda değiştirilebilir Veri alanı adı.

    Sihirbazın ikinci adımında tanımlayıcı veriler ve boyutları tanımlanır (bkz. Şekil 6.7). Bir boyut alanı seçmek için listeden ihtiyacınız var Kaynak alanlar istenen boyut alanını sürükleyin Üst düzey listeye ölçümler olarak işaretlenen alana Boyut oluşturmak için alanları buraya sürükleyin. OLAP küpü oluşturmak için en az bir boyut tanımlamanız gerekir. Sihirbazın aynı adımında bağlam menüsünü kullanarak boyut veya seviye alanının adını değiştirebilirsiniz.

    Pirinç. 6.7. Boyut alanlarının tanımı

    Yalıtılmış veya farklı veriler içeren ve bir hiyerarşiye ait olmayan alanlar, tek düzeyli boyutlar olarak tanımlanabilir. Ancak, bazı alanlar düzeyler halinde düzenlenirse, bir küp kullanmak daha verimli olacaktır. Bir boyutun parçası olarak bir düzey oluşturmak için listeden bir alanı sürükleyin Kaynak alanlar bir boyut veya düzey olan bir alanda. Daha detaylı bilgi içeren alanlar daha fazla yer almalıdır. alt seviyeler. Örneğin, Şekil 6.7'de alan İş unvanı alan seviyesi Bölüm Adı.

    Bir alanı daha düşük veya daha yüksek bir düzeye taşımak için, onu boyut içinde daha düşük veya daha yüksek bir alana sürüklersiniz. veya düğmeleri sırasıyla seviyeleri görüntülemek veya gizlemek için kullanılır.

    Tarih veya saat alanları üst düzey boyut olarak kullanılıyorsa, OLAP Küpü Oluşturma Sihirbazı bu boyutlar için otomatik olarak düzeyler oluşturur. Kullanıcı daha sonra raporlarda hangi seviyelerin bulunması gerektiğini seçebilir. Örneğin, haftaları, üç aylık dönemleri ve yılları veya ayları seçebilirsiniz (bkz. Şekil 6.7).

    Sihirbazın, yalnızca üst düzey boyutu oluşturduğunuzda tarih ve saat alanları için otomatik olarak düzeyler oluşturduğunu unutmayın; bu alanları mevcut bir boyutun alt seviyeleri olarak eklediğinizde otomatik seviyeler oluşturulmaz.

    Sihirbazın üçüncü adımında küp tipi belirlenir, usta tarafından yaratıldı, ancak üç seçenek mümkündür (bkz. Şekil 6.8).

    Pirinç. 6.8. Sihirbazın üçüncü adımında oluşturulacak küp tipinin seçilmesi

    · İlk iki seçenek, rapor her açıldığında bir küp oluşturmayı içerir (eğer küp Excel'den görüntüleniyorsa, bir pivot tablodan bahsediyoruz). Bu durumda, istek dosyası ve dosya *.oqy küp tanımları Küpü oluşturmak için yönergeleri içeren bir. *.oqy dosyası, kübe dayalı raporlar oluşturmak için Excel'de açılabilir ve küpte değişiklik yapmanız gerekirse, Query ile açabilirsiniz. tekrar başlat küp sihirbazı.

    Varsayılan olarak, küp tanım dosyaları ve sorgu dosyaları, Application Data\Microsoft\Que-ries konumunda kullanıcının profil klasöründe depolanır. *.oqy dosyasını standart klasöre kaydederken, küp tanımı dosya adı sekmede görüntülenir. OLAP küpleri Microsoft Query'de yeni bir sorgu açarken veya bir komut seçerken İstek oluştur(Menü Veri, alt menü Harici verileri içe aktarma) Microsoft Excel'de.

    Küp tipinin üçüncü seçeneğinin seçilmesi durumunda Bir küp için tüm verileri içeren bir küp dosyasını kaydetme, küp için tüm veriler alınır ve kullanıcı tarafından belirtilen konumda * uzantılı bir küp dosyası oluşturulur .cub bu verilerin saklandığı yer. yaratılış verilen dosya butona tıklandığında hemen olmuyor Hazır; dosya, küp tanımı bir dosyaya kaydedildiğinde veya küpten bir rapor oluşturulduğunda oluşturulur.

    Küp türünün seçimi birkaç faktör tarafından belirlenir: küpün içerdiği veri miktarı; küp temelinde oluşturulacak raporların türü ve karmaşıklığı; sistem kaynakları (bellek ve disk alanı), vb.

    İçinde ayrı bir *.cub küp dosyası oluşturulmalıdır. aşağıdaki durumlar:

    1) sık sık değişen etkileşimli raporlar için, yeterli disk alanı;

    2) küpü açık tutmak istediğinizde ağ sunucusu raporları oluştururken diğer kullanıcıların kullanımına sunmak için. Bir küp dosyası, diğer kullanıcıların erişmesini engellemek istediğiniz gizli veya hassas verileri atlarken, kaynak veritabanından belirli veriler sağlayabilir.

    OLAP (Çevrimiçi Analitik İşleme) veri küpleri, çok boyutlu verilerin verimli bir şekilde çıkarılmasını ve analiz edilmesini sağlar. Diğer veritabanlarının aksine, OLAP veritabanları, özellikle analitik işleme ve bunlardan her türlü veri setinin hızlı bir şekilde çıkarılması için tasarlanmıştır. Aslında, Access veya SQL Server gibi standart ilişkisel veritabanları ile OLAP veritabanları arasında birkaç önemli fark vardır.

    Pirinç. 1. Bir OLAP küpünü bir Excel çalışma kitabına bağlamak için şu komutu kullanın: Analiz Hizmetlerinden

    Notu şu biçimde indir veya

    İlişkisel veritabanlarında bilgi, sırayla eklenen, kaldırılan ve güncellenen kayıtlar olarak temsil edilir. OLAP veritabanları, verilerin yalnızca anlık görüntüsünü depolar. Bir OLAP veritabanında, bilgiler tek bir veri bloğu olarak arşivlenir ve yalnızca talep üzerine görüntülenmesi amaçlanır. Bir OLAP veri tabanına yeni bilgiler eklemek mümkün olsa da, mevcut veriler silinmek şöyle dursun nadiren düzenlenir.

    İlişkisel veritabanları ve OLAP veritabanları yapısal olarak farklıdır. İlişkisel veritabanları genellikle birbirine bağlı bir dizi tablodan oluşur. Bazı durumlarda, ilişkisel bir veritabanı o kadar çok tablo içerir ki, bunların nasıl ilişkili olduğunu belirlemek çok zordur. OLAP veritabanlarında, bireysel veri blokları arasındaki ilişki önceden tanımlanır ve OLAP küpleri olarak bilinen bir yapıda saklanır. Veri küpleri, veri tabanında gezinmeyi büyük ölçüde basitleştiren, veritabanının hiyerarşik yapısı ve ilişkileri hakkında eksiksiz bilgileri depolar. Ek olarak, alınan verilerin nerede olduğunu ve başka hangi verilerin onunla ilişkilendirildiğini önceden biliyorsanız, raporlar oluşturmak çok daha kolaydır.

    İlişkisel veritabanları ile OLAP veritabanları arasındaki temel fark, bilgilerin depolanma şeklidir. OLAP küpündeki veriler nadiren genel bir şekilde sunulur. OLAP veri küpleri tipik olarak önceden tasarlanmış bir formatta sunulan bilgileri içerir. Böylece, küplerdeki verileri gruplama, filtreleme, sıralama ve birleştirme işlemleri, onları bilgi ile doldurmadan önce gerçekleştirilir. Bu, istenen verilerin çıkarılmasını ve görüntülenmesini mümkün olduğunca basit hale getirir. İlişkisel veritabanlarından farklı olarak, bilgileri ekranda göstermeden önce düzgün bir şekilde düzenlemeye gerek yoktur.

    OLAP veritabanları tipik olarak BT yöneticileri tarafından oluşturulur ve korunur. Kuruluşunuzun OLAP veritabanlarını yönetmekten sorumlu bir yapısı yoksa, ilişkisel veritabanı yöneticisiyle iletişime geçerek uygulama talebinde bulunabilirsiniz. Şirket ağı en azından bireysel OLAP çözümleri.

    OLAP veri küpüne bağlanma

    Bir OLAP veritabanına erişmek için önce bir OLAP küpüne bağlantı kurmanız gerekir. Şerit sekmesine giderek başlayın Veri. Düğmeye bas Diğer kaynaklardan ve açılır menüden komutu seçin Analiz Hizmetlerinden(Şek. 1).

    Veri Bağlantı Sihirbazı'nın belirtilen komutunu seçtiğinizde (Şekil 2). Ana görevi, kullanılacak sunucuyla bağlantı kurmanıza yardımcı olmaktır. excel programı veri yönetiminde.

    1. Öncelikle Excel'e kayıt bilgilerini sağlamanız gerekir. Şekil 2'de gösterildiği gibi, iletişim kutusunun alanlarına sunucu adını, oturum açma adını ve veri erişim parolasını girin. 2. düğmesine tıklayın Daha öte. ile bağlantı kuruyorsanız hesap Windows daha sonra anahtarı ayarlayın Windows Kimlik Doğrulamasını Kullan.

    2. Açılır listeden çalışmak istediğiniz veritabanını seçin (Şekil 3). Geçerli örnek, Analysis Services Tutorial veritabanını kullanır. Aşağıdaki listeden bu veritabanını seçtikten sonra, içinde bulunan tüm OLAP küplerini içe aktarmanız istenir. Gerekli veri küpünü seçin ve düğmesine tıklayın Daha öte.

    Pirinç. 3. Veri analizi için kullanmayı planladığınız çalışan bir veritabanı ve OLAP küpü seçin

    3. Sihirbazın bir sonraki iletişim kutusunda, Şek. 4, oluşturduğunuz bağlantı hakkında açıklayıcı bilgiler girmeniz gerekmektedir. İletişim kutusunun tüm alanları Şekil 1'de gösterilmiştir. 4 isteğe bağlıdır. Geçerli iletişim kutusunu doldurmadan her zaman yok sayabilirsiniz ve bu, bağlantıyı hiçbir şekilde etkilemez.

    Pirinç. 4. Bağlantıyla ilgili açıklayıcı bilgileri değiştirin

    4. düğmesine tıklayın Hazır Bağlantıyı tamamlamak için. Ekranda bir iletişim kutusu görünecektir. Veri içe aktarma(Şek. 5). Anahtarı ayarla Özet Tablo Raporu ve PivotTable'ı oluşturmaya başlamak için Tamam'ı tıklayın.

    OLAP küp yapısı

    OLAP veritabanına dayalı bir PivotTable oluşturma sürecinde, görev bölmesi penceresinin Pivot tablo alanları normal bir pivot tablodan farklı olacaktır. Bunun nedeni, PivotTable'ın kendisine bağlı OLAP küpünün yapısını olabildiğince yakından gösterecek şekilde sıralanmasında yatmaktadır. OLAP küpünde mümkün olan en kısa sürede gezinmek için bileşenlerine ve bunların nasıl etkileşime girdiğine aşina olmanız gerekir. Şek. Şekil 6, tipik bir OLAP küpünün temel yapısını göstermektedir.

    Gördüğünüz gibi, bir OLAP küpünün ana bileşenleri boyutlar, hiyerarşiler, düzeyler, üyeler ve ölçülerdir:

    • boyutlar. Analiz edilen veri öğelerinin temel özelliği. en fazla yaygın örnekler boyutlar Ürünler (Mallar), Müşteri (Alıcı) ve Çalışanı (Çalışan) içerir. Şek. 6, Ürünler boyutunun yapısını gösterir.
    • Hiyerarşiler. Belirli bir boyuttaki seviyelerin önceden tanımlanmış bir toplamı. Hiyerarşi, özet veriler oluşturmanıza ve bu düzeyler arasında var olan ilişkilere girmeden yapının farklı düzeylerinde analiz etmenize olanak tanır. Şek. 6'da, Ürünler boyutunun tek bir Ürün Kategorileri hiyerarşisinde toplanan üç düzeyi vardır.
    • Seviyeler. Düzeyler, ortak bir hiyerarşide toplanan kategorilerdir. Seviyeleri birbirinden ayrı olarak sorgulanabilen ve analiz edilebilen veri alanları olarak düşünün. Şek. 6 sadece üç seviye vardır: Kategori (Kategori), Alt Kategori (Alt Kategori) ve Ürün Adı (Ürün Adı).
    • Üyeler. tek eleman boyut içindeki veriler. Üyelere erişim genellikle boyutlar, hiyerarşiler ve düzeylerden oluşan bir OLAP yapısı aracılığıyla gerçekleştirilir. Şek. Ürün Adı seviyesi için 6 üye tanımlanmıştır. Diğer düzeyler, yapıda gösterilmeyen üyelere sahiptir.
    • miktar OLAP küplerindeki gerçek verilerdir. Ölçüler, ölçü boyutları adı verilen kendi boyutlarında saklanır. Ölçüler, boyutların, hiyerarşilerin, düzeylerin ve üyelerin herhangi bir kombinasyonu kullanılarak sorgulanabilir. Bu prosedüre "dilimleme" önlemleri denir.

    Artık OLAP küplerinin yapısına aşina olduğunuza göre, PivotTable Alan Listesine yeni bir göz atalım. Mevcut alanların organizasyonu netleşir ve herhangi bir şikayette bulunmaz. Şek. Şekil 7, OLAP PivotTable öğelerinin Alan Listesinde nasıl sunulduğunu gösterir.

    OLAP PivotTable Alan Listesinde, önce ölçüler görünür ve bir toplam (sigma) simgesiyle gösterilir. DEĞER alanında olabilecek tek veri öğeleri bunlardır. Listede onlardan sonra, tablo görüntüsü olan bir simge ile gösterilen boyutlar belirtilir. Örneğimizde Müşteri boyutu kullanılmıştır. Bu boyutun içinde bir dizi hiyerarşi iç içe geçmiştir. Hiyerarşi genişletildikten sonra, bireysel veri düzeylerini görebilirsiniz. Bir OLAP küpünün veri yapısını görüntülemek için, pivot tablodaki alanlar listesinde gezinmek yeterlidir.

    OLAP PivotTable'larındaki kısıtlamalar

    İle çalışan pivot tablolar OLAP, Analysis Services OLAP ortamında bir PivotTable veri kaynağıyla etkileşim kurduğunuzu unutmayın. Bu, bir veri küpünün, küpte yer alan boyutlardan ölçülere kadar her davranışsal yönünün de OLAP analitik hizmetleri tarafından kontrol edildiği anlamına gelir. Bu da OLAP PivotTable'larında gerçekleştirilebilecek işlemlerde kısıtlamalara yol açar:

    • Bir PivotTable'ın DEĞERLER alanına ölçüler dışında alanlar yerleştiremezsiniz;
    • özetleme için kullanılan işlevi değiştirmek mümkün değildir;
    • hesaplanan alan veya hesaplanan öğe oluşturamazsınız;
    • alan adlarında yapılan tüm değişiklikler, bu alan pivot tablodan çıkarıldıktan hemen sonra geri alınır;
    • sayfa alanının parametrelerinin değiştirilmesine izin verilmez;
    • komut mevcut değil Göstermeksayfalar;
    • devre dışı seçeneği Göstermekimzalarelementler değer alanında alan olmadığında;
    • devre dışı seçeneği ara toplamlar filtre tarafından seçilen sayfa öğelerine göre;
    • seçenek mevcut değil Arka planrica etmek;
    • DEĞERLER alanına çift tıklandıktan sonra, pivot tablo önbelleğinden yalnızca ilk 1000 kayıt döndürülür;
    • kullanılamıyor onay kutusu optimize ethafıza.

    Çevrimdışı veri küpleri oluşturun

    Standart bir PivotTable'da, kaynak veriler yerel sabit sürücüde depolanır. Böylece, ağa erişiminiz olmasa bile bunları her zaman yönetebilir ve yapıyı değiştirebilirsiniz. Ancak bu hiçbir şekilde OLAP PivotTable'ları için geçerli değildir. OLAP PivotTable'larında, önbellek yerel sabit sürücüde bulunmaz. Bu nedenle, bağlantı kesildikten hemen sonra yerel ağ OLAP PivotTable'ınız başarısız olur. Böyle bir tablodaki alanların hiçbirini taşıyamazsınız.

    Bir ağa bağlı olmadığınızda da OLAP verilerini analiz etmeniz gerekiyorsa, bir çevrimdışı veri küpü oluşturun. Bu, pivot tablo önbelleği olan ayrı bir dosyadır. Bu dosya, yerel ağ bağlantısı kesildikten sonra görüntülenen OLAP verilerini depolar. Bağımsız bir veri küpü oluşturmak için önce bir OLAP PivotTable oluşturun. İmleci pivot tabloya getirin ve düğmesine tıklayın OLAP araçları bağlamsal sekme Analiz, bağlamsal sekmeler kümesine dahildir Pivot tablolarla çalışma. Bir takım seçin Çevrimdışı OLAP(Şek. 8).

    Ekranda bir iletişim kutusu görünecektir. Çevrimdışı OLAP'ı kurun(Şek. 9). Düğmeye bas Çevrimdışı veri dosyası oluştur. Data Cube Dosya Oluşturma Sihirbazının ilk penceresi ekranda belirecektir. Düğmeye bas Daha öte prosedüre devam etmek için.

    İkinci adımda (Şekil 10), veri küpüne dahil edilecek boyutları ve seviyeleri belirleyin. İletişim kutusunda, OLAP veritabanından içe aktarılacak verileri seçmelisiniz. Yalnızca bilgisayarı yerel ağdan çıkardıktan sonra ihtiyaç duyulacak boyutları seçmek gerekir. Ne kadar çok boyut belirtirseniz, o kadar daha büyük boyutçevrimdışı bir veri küpüne sahip olacak.

    Düğmeye bas Daha öteüçüncü adıma geçmek için (Şek. 11). Bu pencerede, küpe dahil edilmeyecek üyeleri veya veri öğelerini seçersiniz. Onay kutusu işaretlenmemişse, belirtilen öğe içe aktarılmayacak ve Ekstra alan yerel sabit sürücüde.

    Veri küpünün konumunu ve adını belirtin (Şekil 12). Data cube dosyaları .cub uzantılıdır.

    Bir süre sonra Excel, çevrimdışı veri küpünü belirtilen klasöre kaydeder. Test etmek için, seçilen veri küpüyle ilişkilendirilmiş bir PivotTable içeren bir Excel çalışma kitabını otomatik olarak oluşturacak olan dosyaya çift tıklayın. Oluşturulduktan sonra, çevrimdışı veri küpünü çevrimdışı LAN modunda çalışan tüm ilgili kullanıcılara dağıtabilirsiniz.

    Yerel ağa bağlandıktan sonra, çevrimdışı veri küpü dosyasını açabilir ve onu ve ilgili veri tablosunu güncelleyebilirsiniz. Ağ erişimi olmadığında çevrimdışı veri küpü kullanılmasına rağmen, ağ bağlantısı geri geldiğinde güncellenmesi gerektiğini unutmayın. Ağ bağlantısı kesildikten sonra bir çevrimdışı veri küpünü güncellemeye çalışmak başarısızlıkla sonuçlanacaktır.

    PivotTable'larda Data Cube İşlevlerini Uygulama

    OLAP veritabanlarında kullanılan veri küpü işlevleri de PivotTable'dan çalıştırılabilir. İÇİNDE eski sürümler Excel, veri küpü işlevlerine yalnızca Analysis ToolPak eklentisini yükledikten sonra eriştiniz. Excel 2013'te, bu işlevler programın içine yerleştirilmiştir ve bu nedenle kullanıma hazırdır. Yeteneklerini tam olarak tanımak için belirli bir örneği düşünün.

    En iyilerinden biri basit yollar bir veri küpünün işlevlerini öğrenmek, bir OLAP PivotTable'ı veri küpü formüllerine dönüştürmektir. Bu prosedür çok basittir ve veri küpü formüllerini sıfırdan oluşturmadan hızlı bir şekilde almanızı sağlar. Temel ilke, PivotTable'daki tüm hücreleri OLAP veritabanına bağlı formüllerle değiştirmektir. Şek. Şekil 13, bir OLAP veri tabanı ile ilişkili bir pivot tabloyu göstermektedir.

    İmleci pivot tabloda herhangi bir yere getirin, düğmesine tıklayın OLAP araçları bağlamsal şerit sekmesi Analiz ve komutu seçin Formüllere dönüştür(Şek. 14).

    PivotTable'ınız bir rapor filtresi alanı içeriyorsa, Şekil 1'de gösterilen iletişim kutusu 15. Bu pencerede, açılır veri filtreleri listelerini formüllere dönüştürmek isteyip istemediğinizi belirtebilirsiniz. Evet ise, açılır listeler kaldırılacak ve bunun yerine statik formüller görüntülenecektir. Gelecekte pivot tablonun içeriğini değiştirmek için açılır listeleri kullanmayı planlıyorsanız, iletişim kutusundaki tek onay kutusunun işaretini kaldırın. Uyumluluk Modunda bir PivotTable üzerinde çalışıyorsanız, veri filtreleri önceden uyarı yapılmadan otomatik olarak formüllere dönüştürülür.

    Birkaç saniye sonra pivot tablo yerine veri küplerinde çalışan ve Excel penceresinde çıktı sağlayan formüller görüntülenecektir. gerekli bilgi. Lütfen bunun önceden uygulanan stilleri kaldırdığına dikkat edin (Şek. 16).

    Pirinç. 16. Formül çubuğuna bir göz atın: hücreler veri küpü formüllerini içerir

    Görüntülediğiniz değerler artık PivotTable nesnesinin parçası olmadığından sütunlar, satırlar ve hesaplanan üyeler ekleyebilir, bunları diğer dış kaynaklarla birleştirebilir ve raporu kendi hızınızda değiştirebilirsiniz. Farklı yollar, sürükleme formülleri dahil.

    OLAP PivotTable'larına Hesaplamalar Ekleme

    İÇİNDE önceki sürümler OLAP PivotTable'larındaki Excel, özel hesaplamalara izin vermiyordu. Bu, OLAP PivotTable'lara, normal PivotTable'ların hesaplanan alanlar ve üyeler ekleyebildiği şekilde ek bir analiz düzeyi eklemenin mümkün olmadığı anlamına geliyordu (bkz. ; okumaya devam etmeden önce, bu malzemeye aşina olduğunuzdan emin olun).

    Excel 2013, yeni OLAP araçlarını sunar - hesaplanmış ölçüler ve hesaplanmış MDX üyeleri. Artık veritabanı yöneticisi tarafından sağlanan bir OLAP küpündeki ölçüleri ve üyeleri kullanmakla sınırlı değilsiniz. alıyorsun Ek özelliklerözel hesaplamalar oluşturarak analiz edin.

    MDX'e giriş. OLAP küpüyle PivotTable kullandığınızda, veritabanına MDX (Çok Boyutlu İfadeler) sorguları gönderirsiniz. MDX, çok boyutlu kaynaklardan (OLAP küpleri gibi) veri almak için kullanılan bir sorgulama dilidir. Bir OLAP PivotTable değiştirildiğinde veya güncellendiğinde, karşılık gelen MDX sorguları OLAP veritabanına iletilir. Sorgunun sonuçları Excel'e geri döndürülür ve PivotTable alanında görüntülenir. Bu, PivotTable önbelleğinin yerel bir kopyası olmadan OLAP verileriyle çalışmayı mümkün kılar.

    Hesaplanan ölçüler ve MDX öğeleri, MDX dil sözdizimi kullanılarak oluşturulur. Bu sözdizimi ile PivotTable, hesaplamaların OLAP veritabanı arka ucuyla etkileşime girmesine izin verir. Bu kitaptaki örnekler, yeni özellikleri gösteren temel MDX yapılarına dayanmaktadır. Excel işlevleri 2013. Karmaşık hesaplanmış ölçümler ve MDX öğeleri oluşturmanız gerekiyorsa, MDX'in yetenekleri hakkında daha fazla bilgi edinmek için zaman harcamanız gerekecektir.

    Hesaplanmış ölçüler oluşturun. Hesaplanan ölçü, hesaplanan alanın OLAP sürümüdür. Fikir, mevcut OLAP alanları üzerinde gerçekleştirilen bazı matematiksel işlemlere dayalı olarak yeni bir veri alanı oluşturmaktır. Şek. Şekil 17'de, ürünlerin listesini ve miktarını ve bunların her birinin satışından elde edilen geliri içeren bir OLAP pivot tablosu kullanılır. Öğe başına ortalama fiyatı hesaplayacak yeni bir ölçü eklememiz gerekiyor.

    Analiz Pivot tablolarla çalışma. Aşağıya doğru açılan menü OLAP araçlarıÖğeyi seçin (Şek. 18).

    Pirinç. 18. Menü öğesini seçin MDX Hesaplanmış Ölçü

    Ekranda bir iletişim kutusu görünecektir. Hesaplanmış bir ölçü oluşturun(Şek. 19).

    Aşağıdakileri yapın:

    2. Yeni hesaplanan ölçüyü içerecek ölçü grubunu seçin. Bunu yapmazsanız, Excel yeni ölçüyü otomatik olarak ilk kullanılabilir ölçü grubuna yerleştirir.

    3. Tarlada MDX(MDX) yeni bir ölçü tanımlayan bir kod girin. Giriş sürecini hızlandırmak için, hesaplamalarda kullanılacak mevcut ölçüleri seçmek için soldaki listeyi kullanın. MDX alanına eklemek için istediğiniz ölçüye çift tıklayın. Hesaplamak ortalama fiyat birim satış, aşağıdaki MDX ifadesi kullanılır:

    4. Tamam'a tıklayın.

    Düğmeye dikkat edin MDX'i kontrol edin, pencerenin sağ alt kısmında bulunur. MDX sözdiziminin doğru olduğunu doğrulamak için bu düğmeye tıklayın. Sözdizimi hatalar içeriyorsa, uygun bir mesaj görüntülenecektir.

    Yeni bir hesaplanmış ölçü oluşturmayı bitirdiğinizde, listeye gidin. Pivot tablo alanları ve onu seçin (Şek. 20).

    Hesaplanmış bir ölçünün kapsamı geçerli çalışma kitabıyla sınırlıdır. Başka bir deyişle, hesaplanan ölçüler doğrudan sunucunun OLAP küpünde oluşturulmaz. Bu, siz paylaşmadığınız sürece hiç kimsenin hesaplanan ölçüme erişemeyeceği anlamına gelir. çalışma kitabı veya internette yayınlamayın.

    MDX hesaplanmış üyeleri oluşturun. Bir MDX hesaplanmış üyesi, normal bir hesaplanmış üyenin OLAP versiyonudur. Fikir, mevcut OLAP öğeleri üzerinde gerçekleştirilen bazı matematiksel işlemlere dayalı olarak yeni bir veri öğesi oluşturmaktır. Şek. 22, 2005-2008 (üç aylık dökümü) için satış verilerini içeren bir OLAP PivotTable kullanır. Oluşturarak birinci ve ikinci çeyrek için verileri toplamak istediğinizi varsayalım. yeni eleman Yılın İlk Yarısı (Yılın ilk yarısı). Üçüncü ve dördüncü çeyreklerle ilgili verileri de birleştirerek yeni bir Yılın İkinci Yarısını (Yılın ikinci yarısı) oluşturacağız.

    Pirinç. 22. Yılın İlk Yarısı ve Yılın İkinci Yarısı olmak üzere yeni MDX hesaplanmış üyeleri ekleyeceğiz

    İmleci pivot tabloda herhangi bir yere getirin ve bağlamsal sekmeyi seçin Analiz bir dizi bağlamsal sekmeden Pivot tablolarla çalışma. Aşağıya doğru açılan menü OLAP araçlarıÖğeyi seçin MDX Bilgisayarlı Üye(Şek. 23).

    Ekranda bir iletişim kutusu görünecektir. (Şek. 24).

    Pirinç. 24. Pencere Hesaplanan üye oluştur

    Aşağıdakileri yapın:

    1. Hesaplanan ölçüye bir ad verin.

    2. Hesaplanan yeni üyelerin oluşturulmakta olduğu üst hiyerarşiyi seçin. bir şantiyede ana öğe bir değer atayın Tüm. Bu ayarla Excel, bir ifadeyi değerlendirirken üst hiyerarşinin tüm üyelerine erişebilir.

    3. Pencerede MDX MDX sözdizimini girin. Biraz zaman kazanmak için, MDX'te kullanılacak mevcut üyeleri seçmek için solda görüntülenen listeyi kullanın. Seçilen öğeye çift tıklayın ve Excel onu pencereye ekleyecektir MDX. Şek. 24, birinci ve ikinci çeyreğin toplamı hesaplanır:

    ..&& +

    .. && +

    .. && + …

    4. Tamam'a tıklayın. Excel, yeni oluşturulan MDX hesaplanmış üyesini PivotTable'da görüntüler. Şek. 25, yeni hesaplanan öğe, pivot tablonun diğer hesaplanan öğeleriyle birlikte görüntülenir.

    Şek. Şekil 26, Hesaplanan Yılın İkinci Yarısını oluşturmak için kullanılan benzer bir süreci göstermektedir.

    Excel'in MDX'in orijinal öğelerini kaldırmaya bile çalışmadığına dikkat edin (Şekil 27). PivotTable, 2005-2008 yılları arasındaki kayıtları üç ayda bir dökümüyle göstermeye devam ediyor. Bu durumda, bu bir sorun değildir, ancak çoğu senaryoda, çakışmaları önlemek için "fazladan" öğeleri gizlemelisiniz.

    Pirinç. 27. Excel, oluşturulan MDX hesaplanmış üyesini orijinal üyelerle birlikte görüntüler. Ancak, çakışmaları önlemek için orijinal öğeleri kaldırmak yine de daha iyidir.

    Unutmayın: hesaplanan üyeler yalnızca geçerli çalışma kitabındadır. Başka bir deyişle, hesaplanan ölçüler doğrudan sunucunun OLAP küpünde oluşturulmaz. Bu, çalışma kitabını paylaşmadığınız veya çevrimiçi yayınlamadığınız sürece hiç kimsenin hesaplanan ölçüye veya hesaplanan üyeye erişemeyeceği anlamına gelir.

    Bir OLAP küpündeki üst hiyerarşi veya üst öğe değişirse, MDX hesaplanan öğenin artık çalışmayacağını unutmayın. Bu öğeyi yeniden oluşturmanız gerekecek.

    OLAP Bilgi İşlem Yönetimi. Excel, OLAP PivotTable'larında hesaplanan ölçüleri ve MDX öğelerini yönetmenize olanak tanıyan bir arabirim sağlar. İmleci pivot tabloda herhangi bir yere getirin ve bağlamsal sekmeyi seçin Analiz bir dizi bağlamsal sekmeden Pivot tablolarla çalışma. Aşağıya doğru açılan menü OLAP araçlarıÖğeyi seçin bilgi işlem yönetimi. Pencerede bilgi işlem yönetimiüç düğme mevcuttur (Şek. 28):

    • Yaratmak. Yeni bir hesaplanmış ölçü veya hesaplanmış MDX üyesi oluşturun.
    • Değiştirmek. Seçilen hesaplamayı değiştirin.
    • Silmek. Seçilen hesaplamayı silin.

    Pirinç. 28. İletişim kutusu bilgi işlem yönetimi

    OLAP verileri üzerinde what-if analizi yapın. Excel 2013'te, OLAP PivotTable'larındaki veriler üzerinde ne olursa olsun analizi yapabilirsiniz. Bu yeni yetenekle, bir PivotTable'daki değerleri değiştirebilir ve değişikliklerinize göre ölçüleri ve üyeleri yeniden hesaplayabilirsiniz. Değişiklikleri OLAP küpüne de yayabilirsiniz. What-if analizinden yararlanmak için bir OLAP PivotTable oluşturun ve bağlamsal sekmeyi seçin Analiz Pivot tablolarla çalışma. Aşağıya doğru açılan menü OLAP araçları takım seç Eğer analiz olursa –> What-if analizini etkinleştir(Şek. 29).

    Bundan sonra pivot tablonun değerlerini değiştirebilirsiniz. Pivot tabloda seçilen değeri değiştirmek için üzerine sağ tıklayın ve seçin bağlam menüsüÖğeyi seçin (Şek. 30). Excel, hesaplanan ölçüler ve hesaplanan MDX üyeleri dahil olmak üzere düzenlemelerinize göre PivotTable'daki tüm hesaplamaları yeniden çalıştırır.

    Pirinç. 30. Bir öğe seçin Pivot tabloyu hesaplarken değişikliği dikkate alın pivot tabloda değişiklik yapmak için

    Varsayılan olarak, What-if analizi modunda PivotTable'da yapılan düzenlemeler yereldir. Değişiklikleri OLAP sunucusuna yaymak istiyorsanız, değişiklikleri yayınlamak için komutu seçin. Bağlamsal sekmeyi seçin Analiz, bağlamsal sekmeler kümesinde bulunur Pivot tablolarla çalışma. Aşağıya doğru açılan menü OLAP araçları eşyaları seç Eğer analiz olursa – > Değişiklikleri Yayınla(Şek. 31). Bu komut, OLAP sunucusunda "geri yazma"yı etkinleştirir; bu, değişikliklerin orijinal OLAP küpüne yayılabileceği anlamına gelir. (Değişiklikleri bir OLAP sunucusuna yaymak için, sunucuya erişim için uygun izinlere sahip olmanız gerekir. OLAP veritabanına yazma erişimi izinleri almanıza yardımcı olması için DBA'nızla iletişime geçin.)

    Not, Alexander Jelen'in kitabına dayanarak yazılmıştır. . Bölüm 9

    Bu çalışmanın bir parçası olarak, aşağıdaki sorular dikkate alınacaktır:

    • OLAP küpleri nedir?
    • Ölçüler, boyutlar, hiyerarşiler nelerdir?
    • OLAP küpleri üzerinde ne tür işlemler gerçekleştirilebilir?
    OLAP küpü kavramı

    OLAP'ın ana varsayımı, veri sunumunda çok boyutluluktur. OLAP terminolojisinde, küp kavramı veya hiperküp, çok boyutlu ayrık bir veri alanını tanımlamak için kullanılır.

    Küp bir analist kullanıcısının bilgileri sorgulayabileceği çok boyutlu bir veri yapısıdır. Küpler gerçeklerden ve boyutlardan oluşturulur.

    Veri- bu, şirketteki analize tabi tutulacak nesneler ve olaylar hakkındaki verilerdir. Aynı türden gerçekler ölçümleri oluşturur. Ölçü, küp hücredeki bir değer türüdür.

    ölçümler gerçeklerin analizinin yapıldığı veri öğeleridir. Bu tür öğelerden oluşan bir koleksiyon, bir boyutun özniteliğini oluşturur (örneğin, haftanın günleri, "zaman" boyutunun bir özniteliğini oluşturabilir). Ticari işletmelerin iş analizi görevlerinde "zaman", "satış", "ürünler", "müşteriler", "çalışanlar", "coğrafi konum" gibi kategoriler genellikle ölçüm görevi görür. Boyutlar çoğunlukla, kullanıcının gerçek verileri analiz edebileceği mantıksal kategoriler olan hiyerarşik yapılardır. Her hiyerarşi bir veya daha fazla seviyeye sahip olabilir. Dolayısıyla, "coğrafi konum" boyutunun hiyerarşisi, "ülke - bölge - şehir" düzeylerini içerebilir. Örneğin, zaman hiyerarşisinde aşağıdaki düzeyler dizisi ayırt edilebilir: Bir boyutun birkaç hiyerarşisi olabilir (bu durumda, bir boyutun her hiyerarşisi, boyut tablosunun aynı anahtar özniteliğine sahip olmalıdır).

    Bir küp, bir veya daha fazla olgu tablosundan gerçek verileri içerebilir ve çoğu zaman birden çok boyut içerir. Belirli herhangi bir küp genellikle belirli bir yönlü analiz konusuna sahiptir.

    Şekil 1, belirli bir şirketin petrol ürünleri satışlarını bölgelere göre analiz etmek için tasarlanmış bir küp örneğini göstermektedir. Bu küpün üç boyutu (zaman, ürün ve bölge) ve bir ölçüsü (parasal olarak ifade edilen satış değeri) vardır. Ölçü değerleri, küpün karşılık gelen hücrelerinde (hücresinde) saklanır. Her hücre, boyutların her birinden, demet adı verilen bir dizi üye tarafından benzersiz bir şekilde tanımlanır. Örneğin, küpün sol alt köşesinde bulunan hücre (98399$ değerini içerir) demet tarafından verilir [Temmuz 2005, Uzak Doğu, Dizel]. Buradaki 98399$ değeri, Temmuz 2005'te Uzak Doğu'daki motorin satış hacmini (parasal olarak) göstermektedir.

    Ayrıca bazı hücrelerin herhangi bir değer içermediğine dikkat edin: Olgu tablosu onlar için veri içermediğinden bu hücreler boştur.

    Pirinç. 1.Çeşitli bölgelerde petrol ürünleri satışı hakkında bilgi içeren küp

    Bu tür küpleri oluşturmanın nihai amacı, gerekli bilgileri gerçek verilerden çıkaran sorguların işlem süresini en aza indirmektir. Bu görevi gerçekleştirmek için, küpler genellikle önceden hesaplanmış özet veriler içerir. toplamalar(toplamalar). Onlar. küp, gerçek olandan daha büyük bir veri alanını kaplar - içinde mantıksal, hesaplanmış noktalar vardır. Toplama işlevleri, nokta değerlerini gerçek değerlere dayalı olarak mantıksal bir alanda hesaplamanıza olanak tanır. En basit toplama işlevleri SUM, MAX, MIN, COUNT'dur. Böylece, örneğin, örnekte gösterilen küp için MAX işlevini kullanarak, Uzak Doğu vb.

    Çok boyutlu küplerin bir başka özelliği de başlangıç ​​noktasının belirlenmesindeki zorluktur. Örneğin, Ürün veya Bölgeler boyutu için 0 noktasını nasıl ayarlarsınız? Bu sorunun çözümü, boyutun tüm öğelerini birleştiren özel bir özniteliği tanıtmaktır. Bu öznitelik (otomatik olarak oluşturulur) yalnızca bir öğe içerir - Tümü ("Tümü"). Toplamlar gibi basit toplama işlevleri için, All öğesi, verilen boyutun gerçek uzayındaki tüm öğelerin değerlerinin toplamına eşdeğerdir.

    Çok boyutlu veri modelinde önemli bir kavram, alt uzay veya alt küptür. Bir alt küp, küpün içindeki bazı çok boyutlu şekiller biçimindeki toplam küp uzayının bir parçasıdır. Bir küpün çok boyutlu uzayı ayrık ve sınırlı olduğundan, alt küp de ayrık ve sınırlıdır.

    OLAP küpleri üzerindeki işlemler

    Bir OLAP küpünde aşağıdaki işlemler gerçekleştirilebilir:

    • kesmek;
    • döndürme;
    • konsolidasyon;
    • detay.
    dilim(Şekil 2) bir alt küpün özel bir halidir. Bu, bu alt kümeye dahil olmayan bir veya daha fazla boyut öğesinin tek bir değerine karşılık gelen çok boyutlu bir veri dizisinin bir alt kümesini oluşturmak için bir prosedürdür. Örneğin sadece belirli bir bölgede yani Urallarda petrol ürünleri satışlarının zaman içinde nasıl ilerlediğini öğrenmek için "Mallar" boyutunu "Urallar" öğesi üzerinde sabitlemeniz ve ilgili alt kümeyi (alt küpü) çıkartmanız gerekir. küp.
  • Pirinç. 2. OLAP küp dilimi

    Döndürme(Şekil 3) - raporda veya görüntülenen sayfada sunulan ölçümlerin yerini değiştirme işlemi. Örneğin, bir döndürme işlemi, bir tablonun satırlarını ve sütunlarını değiştirmeyi içerebilir. Ek olarak, bir veri küpünün döndürülmesi, tablo dışı boyutları görüntülenen sayfada bulunan boyutların konumuna taşımaktır ve bunun tersi de geçerlidir.

    Bugün OLAP nedir, genel olarak her uzman bilir. En azından "OLAP" ve "çok boyutlu veri" kavramları zihnimizde sıkı sıkıya bağlantılıdır. Yine de bu konunun yeniden gündeme getiriliyor olması umarım okuyucuların çoğunluğu tarafından onaylanır, çünkü fikrin zamanla modası geçmemesi için periyodik olarak iletişim kurmanız gerekir. Zeki insanlar veya iyi bir yayındaki makaleleri okuyun...

    Veri ambarları (OLAP'ın yeri bilgi yapısı işletmeler)

    "OLAP" terimi, "veri ambarı" (Veri Ambarı) terimiyle ayrılmaz bir şekilde bağlantılıdır.

    Veri ambarlarının "kurucu babası" Bill Inmon tarafından formüle edilen bir tanım şöyledir: "Veri ambarı, yönetimsel kararlar alma sürecini desteklemek için alana özgü, zamana bağlı ve değişmez bir veri koleksiyonudur."

    Depolamadaki veriler şu adresten gelir: işletim sistemleri(OLTP sistemleri), iş süreçlerini otomatikleştirmek için tasarlanmıştır. Ek olarak, depolama şu şekilde doldurulabilir: dış kaynaklar istatistiksel raporlar gibi.

    Neden veri ambarları inşa ediyoruz - sonuçta, işletim sistemlerinin veritabanlarında veya dosyalarında zaten "yaşayan" açıkça gereksiz bilgiler içeriyorlar? Cevap kısa olabilir: operasyonel sistemlerin verilerini doğrudan analiz etmek imkansızdır veya çok zordur. Bu, verilerin parçalanması, çeşitli DBMS formatlarında ve şirket ağının farklı "köşelerinde" depolanması dahil olmak üzere çeşitli nedenlerden kaynaklanmaktadır. Ancak kuruluştaki tüm veriler merkezi bir veritabanı sunucusunda depolansa bile (ki bu çok nadirdir), analist bunların karmaşık, bazen kafa karıştırıcı yapılarını neredeyse kesinlikle anlamayacaktır. Yazarın, aç analistleri operasyonel sistemlerden "ham" verilerle "beslemeye" çalışmak konusunda oldukça üzücü bir deneyimi var - bu onlar için çok zor oldu.

    Bu nedenle, havuzun görevi, analiz için "hammaddeleri" tek bir yerde ve basit, anlaşılır bir yapıda sağlamaktır. Ralph Kimball, "The Data Warehouse Toolkit" adlı kitabının önsözünde, okuyucu tüm kitabı okuduktan sonra tek bir şeyi, yani deponun yapısının basit olması gerektiğini anlarsa, yazarın görevini düşüneceğini yazıyor. tamamlanmış.

    Ayrı bir depolamanın görünümünü haklı çıkaran başka bir neden daha var - operasyonel bilgiler için karmaşık analitik sorgular, şirketin mevcut işini yavaşlatıyor, tabloları uzun süre engelliyor ve sunucu kaynaklarını ele geçiriyor.

    Kanımca, depolama ille de devasa bir veri birikimi değildir - asıl mesele, analiz için uygun olmasıdır. Genel olarak konuşursak, küçük depolar için ayrı bir terim tasarlanmıştır - Data Marts (veri kioskları), ancak Rusça pratiğimizde bunu sık sık duymazsınız.

    OLAP- kullanışlı araç analiz

    Merkezileştirme ve uygun yapılanma, bir analistin ihtiyaç duyduğu her şeyden uzaktır. Sonuçta, bilgileri görüntülemek ve görselleştirmek için hala bir araca ihtiyacı var. Tek bir veri havuzuna dayalı olarak oluşturulmuş olsa bile geleneksel raporların tek bir eksiği vardır: esneklik. Verilerin istenen görünümünü elde etmek için "bükülemez", "genişletilemez" veya "daraltılamaz". Tabii ki, bir programcıyı arayabilirsiniz (eğer gelmek isterse) ve o (meşgul değilse) oldukça hızlı bir şekilde yeni bir rapor hazırlayacaktır - diyelim ki bir saat içinde (yazıyorum ve buna kendim de inanmıyorum - hayatta bu kadar çabuk olmuyor, ona üç saat verelim) . Bir analistin günde en fazla iki fikri kontrol edebileceği ortaya çıktı. Ve o (eğer iyi bir analistse) her saat bu türden birkaç fikir bulabilir. Ve analist ne kadar çok "dilim" ve "dilim" görürse, o kadar çok fikre sahip olur ve bu da doğrulama için giderek daha fazla yeni "dilim" gerektirir. Keşke verileri basit ve rahat bir şekilde genişletip daraltmasına izin verecek bir aracı olsaydı! OLAP böyle bir araçtır.

    OLAP, bir veri ambarının gerekli bir özelliği olmasa da, bu veri ambarında biriken bilgileri analiz etmek için giderek daha fazla kullanılmaktadır.

    Tipik bir depolamaya dahil edilen bileşenler, şekil 2'de gösterilmiştir. 1.

    Pirinç. 1. Veri ambarı yapısı

    Operasyonel veriler çeşitli kaynaklardan toplanır, temizlenir, entegre edilir ve ilişkisel bir depoya konur. Aynı zamanda, çeşitli raporlama araçları kullanılarak analiz için hazırdırlar. Daha sonra veriler (tamamen veya kısmen) OLAP analizi için hazırlanır. Özel bir OLAP veri tabanına yüklenebilir veya ilişkisel bir depoda bırakılabilirler. En önemli unsuru meta verilerdir, yani verilerin yapısı, yerleşimi ve dönüşümü hakkında bilgi. Onlar sayesinde çeşitli depolama bileşenlerinin etkin etkileşimi sağlanır.

    Özetle, OLAP'ı bir depoda biriken verilerin çok boyutlu analizi için bir dizi araç olarak tanımlayabiliriz. Teorik olarak, OLAP araçları doğrudan operasyonel verilere veya bunların tam kopyalarına uygulanabilir (operasyonel kullanıcılara müdahale etmemek için). Ancak bunu yaparak, yukarıda açıklanan komisyona adım atma, yani analiz için doğrudan uygun olmayan operasyonel verileri analiz etmeye başlama riskini alıyoruz.

    OLAP'ın tanımı ve temel kavramları

    Başlamak için deşifre edelim: OLAP, Çevrimiçi Analitik İşleme, yani çevrimiçi veri analizidir. OLAP'ın 12 tanımlayıcı ilkesi, 1993 yılında ilişkisel veritabanlarının "mucidi" E. F. Codd tarafından formüle edildi. Daha sonra, tanımı, paylaşılan çok boyutlu bilgileri hızlı bir şekilde analiz etme yeteneği sağlamak için bir OLAP uygulaması gerektiren FASMI testi olarak yeniden çalışıldı ().

    FASMI testi

    Hızlı(Hızlı) - analiz, bilgilerin tüm yönleri üzerinde eşit derecede hızlı yapılmalıdır. Kabul edilebilir yanıt süresi 5 saniye veya daha azdır.

    analiz(Analiz) - Uygulama geliştiricisi tarafından önceden tanımlanan veya kullanıcı tarafından isteğe bağlı olarak tanımlanan temel sayısal ve istatistiksel analiz türlerini gerçekleştirmek mümkün olmalıdır.

    paylaşılan(Paylaşılan) - Birden fazla kullanıcının verilere erişimi olmalı, hassas bilgilere erişim kontrol edilmelidir.

    Çok boyutlu(Çok boyutlu) OLAP'ın ana, en temel özelliğidir.

    Bilgi(Bilgi) - uygulama, hacmi ve depolama konumu ne olursa olsun gerekli tüm bilgilere erişebilmelidir.

    OLAP = Çok Boyutlu Görünüm = Küp

    OLAP, iş bilgilerine erişmek, bunları görüntülemek ve analiz etmek için uygun, yüksek hızlı bir yol sağlar. Kullanıcı, bunları çok boyutlu küpler (Küpler) biçiminde düzenleyerek doğal, sezgisel bir veri modeli elde eder. Çok boyutlu koordinat sisteminin eksenleri, analiz edilen iş sürecinin ana nitelikleridir. Örneğin, satış için bir ürün, bölge, alıcı türü olabilir. Ölçümlerden biri olarak zaman kullanılır. Eksenlerin kesişme noktalarında - ölçümler (Boyutlar) - süreci nicel olarak karakterize eden veriler vardır - ölçümler (Ölçüler). Bunlar, parçalar halinde veya parasal olarak satış hacimleri, stok bakiyeleri, maliyetler vb. bilgi ve analiz sürecinde aklına gelen diğer manipülasyonları gerçekleştirir.

    Şekil l'de gösterilen üç boyutlu küpün ölçüleri olarak. 2'de satış miktarları, ölçüm olarak ise zaman, ürün ve mağaza kullanılmıştır. Ölçümler belirli gruplama seviyelerinde sunulur: ürünler kategoriye göre gruplanır, mağazalar ülkeye göre gruplanır ve işlem süreleri aya göre gruplanır. Biraz sonra, gruplama (hiyerarşi) düzeylerini daha ayrıntılı olarak ele alacağız.


    Pirinç. 2. Küp örneği

    Küpü "kesmek"

    Üç boyutlu bir küpün bile bilgisayar ekranında görüntülenmesi, ilgilenilen ölçülerin değerlerinin görülebilmesi için zordur. Üçten fazla boyutu olan küpler hakkında ne söyleyebiliriz? Küpte saklanan verileri görselleştirmek için, kural olarak, karmaşık hiyerarşik satır ve sütun başlıklarına sahip olağan iki boyutlu, yani tablolu görünümler kullanılır.

    Bir küpün iki boyutlu bir temsili, onu bir veya daha fazla eksen (boyut) boyunca "keserek" elde edilebilir: ikisi hariç tüm boyutların değerlerini sabitleriz ve normal bir iki boyutlu tablo elde ederiz . Tablonun yatay ekseni (sütun başlıkları) bir boyutu, dikey eksen (satır başlıkları) başka bir boyutu ve tablo hücreleri ölçü değerlerini temsil eder. Bu durumda, ölçüler kümesi aslında boyutlardan biri olarak kabul edilir - ya görüntülemek için bir ölçü seçeriz (ve sonra satırların ve sütunların başlıklarına iki boyut yerleştirebiliriz) ya da birkaç ölçü (ve sonra bir tane) gösteririz. tablonun eksenlerinden biri ölçülerin adları tarafından, diğeri ise tek bir "kesilmemiş" boyutun değeri tarafından işgal edilecektir).

    Şek. 3 - işte bir ölçü için küpün iki boyutlu bir dilimi - Birim Satışlar (satılan adet) ve iki "kesilmemiş" boyut - Mağaza (Mağaza) ve Zaman (Zaman).


    Pirinç. 3. Bir ölçü için iki boyutlu küp dilimi

    Şek. 4, yalnızca bir "kesilmemiş" boyutu gösterir - Mağaza, ancak birkaç ölçümün değerlerini gösterir - Birim Satışlar (satılan adet), Mağaza Satışları (satış tutarı) ve Mağaza Maliyeti (mağaza giderleri).


    Pirinç. 4. Çoklu Ölçüler için 2B Küp Dilimleme

    İkiden fazla boyut "kesilmemiş" kaldığında, bir küpün iki boyutlu bir temsili de mümkündür. Bu durumda, "kesilmiş" küpün iki veya daha fazla boyutu dilim eksenlerine (satırlar ve sütunlar) yerleştirilecektir - bkz. 5.


    Pirinç. 5. Aynı eksende birkaç boyuta sahip bir küpün iki boyutlu dilimi

    Etiketler

    Boyutlar boyunca "kenara ayrılan" değerlere üyeler veya etiketler (üyeler) denir. Etiketler hem küpü "kesmek" hem de seçilen verileri kısıtlamak (filtrelemek) için kullanılır - "kesilmemiş" kalan bir boyuttayken, tüm değerlerle değil, bunların alt kümeleriyle, örneğin birkaç şehirden üçüyle ilgileniriz düzine. Etiket değerleri 2B küp görünümünde satır ve sütun başlıkları olarak görünür.

    Hiyerarşiler ve düzeyler

    Etiketler, bir veya daha fazla düzeyden oluşan hiyerarşilerde birleştirilebilir. Örneğin, "Mağaza" (Mağaza) boyutunun etiketleri doğal olarak seviyelere sahip bir hiyerarşide birleştirilir:

    Ülke (Ülke)

    Eyalet (Eyalet)

    Şehir (Şehir)

    Mağaza (Mağaza).

    Hiyerarşinin seviyelerine göre, ABD ("Ülke" düzeyi) veya Kaliforniya ("Eyalet" düzeyi) için satışlar gibi toplam değerler hesaplanır. Bir boyutta birden fazla hiyerarşi uygulanabilir - örneğin zaman için: (Yıl, Çeyrek, Ay, Gün) ve (Yıl, Hafta, Gün).

    OLAP Uygulama Mimarisi

    OLAP hakkında yukarıda söylenen her şey aslında verilerin çok boyutlu sunumuna atıfta bulunuyordu. Kabaca söylemek gerekirse, müşterinin kullandığı aracın ne son kullanıcısı ne de geliştiricileri, verilerin nasıl depolandığını önemsemez.

    OLAP uygulamalarında çok boyutluluk üç seviyeye ayrılabilir:

    • Çok boyutlu veri temsili - çok boyutlu görselleştirme ve veri işleme sağlayan son kullanıcı araçları; çok boyutlu temsil katmanı, verinin fiziksel yapısından soyutlar ve veriyi çok boyutlu olarak ele alır.
    • Çok boyutlu işleme - çok boyutlu sorguları formüle etmek için bir araç (dil) (geleneksel ilişkisel SQL dili burada uygun değildir) ve böyle bir sorguyu işleyip yürütebilen bir işlemci.
    • Çok boyutlu depolama - çok boyutlu sorguların verimli bir şekilde yürütülmesini sağlayan verilerin fiziksel organizasyonu anlamına gelir.

    İlk iki düzey, tüm OLAP araçlarında zorunludur. Üçüncü seviye, yaygın olarak kullanılmasına rağmen gerekli değildir, çünkü çok boyutlu temsil için veriler sıradan ilişkisel yapılardan da elde edilebilir; bu durumda çok boyutlu sorgu işlemcisi, çok boyutlu sorguları ilişkisel bir DBMS tarafından yürütülen SQL sorgularına çevirir.

    Belirli OLAP ürünleri genellikle çok boyutlu bir veri sunum aracı, bir OLAP istemcisi (örneğin, Microsoft'tan Excel 2000'deki Pivot Tablolar veya Knosys'den ProClarity) veya çok boyutlu bir arka uç DBMS, bir OLAP sunucusudur (örneğin, Oracle Express Server) veya Microsoft OLAP Hizmetleri).

    Çok boyutlu işleme katmanı genellikle OLAP istemcisinde ve/veya OLAP sunucusunda bulunur, ancak Microsoft'un Pivot Tablo Hizmeti bileşeni gibi en saf haliyle izole edilebilir.

    Teknik yönlerçok boyutlu veri depolama

    Yukarıda belirtildiği gibi, OLAP analiz araçları doğrudan ilişkisel sistemlerden de veri çıkarabilir. Bu yaklaşım, OLAP sunucularının önde gelen veritabanı satıcılarının fiyat listelerinde olmadığı bir zamanda daha cazipti. Ancak bugün Oracle, Informix ve Microsoft tam teşekküllü OLAP sunucuları ve hatta ağlarına bir "hayvanat bahçesi" yazılım yerleştirmek istemeyen BT yöneticileri sunuyor. farklı üreticiler, aynı markanın bir OLAP sunucusunu satın alabilir (daha doğrusu şirketin yönetimine ilgili bir taleple başvurabilir) ana sunucu veritabanları.

    OLAP sunucuları veya çok boyutlu veritabanı sunucuları, çok boyutlu verilerini farklı şekillerde depolayabilir. Bu yöntemleri ele almadan önce, agregaların depolanması gibi önemli bir husus hakkında konuşmamız gerekiyor. Gerçek şu ki, herhangi bir veri ambarında - hem normal hem de çok boyutlu - operasyonel sistemlerden alınan ayrıntılı verilerin yanı sıra, aylara, kategorilere göre satış hacimlerinin toplamları gibi özet göstergeler (toplu göstergeler, kümeler) de saklanır. mallar vb. Toplamalar, yalnızca sorgu yürütmeyi hızlandırmak amacıyla açık bir şekilde depolanır. Sonuçta, bir yandan, kural olarak, depoda çok büyük miktarda veri birikir ve diğer yandan, çoğu durumda analistler ayrıntılı değil, genelleştirilmiş göstergelerle ilgilenir. Ve yıl için satış miktarını hesaplamak için her seferinde milyonlarca bireysel satışın toplanması gerekseydi, hız büyük olasılıkla kabul edilemez olurdu. Bu nedenle, verileri çok boyutlu bir veritabanına yüklerken, tüm toplam göstergeler veya bunların bir kısmı hesaplanır ve kaydedilir.

    Ama bildiğiniz gibi, her şeyin bedelini ödemek zorundasınız. Ayrıca, veri miktarını ve bunları yüklemek için gereken süreyi artırarak özet verilere yönelik sorguları işleme hızı için ödeme yapmanız gerekir. Dahası, hacimdeki artış kelimenin tam anlamıyla felaket olabilir - yayınlanan standart testlerden birinde, 10 MB ilk veri için toplam toplam sayısı 2,4 GB gerektiriyordu, yani veriler 240 kat arttı! Agregaları hesaplarken verilerin "şişme" derecesi, küp boyutlarının sayısına ve bu boyutların yapısına, yani boyutun farklı düzeylerindeki "babalar" ve "çocuklar" sayısının oranına bağlıdır. Agregaların depolanması sorununu çözmek için bazen kullanılır. karmaşık şemalar, tüm olası toplamlardan uzakta hesaplanırken, sorgu yürütme performansında önemli bir artış elde etmeyi sağlar.

    Şimdi bilgi depolamak için çeşitli seçenekler hakkında. Hem ayrıntılı veriler hem de kümeler, ilişkisel veya çok boyutlu yapılarda saklanabilir. Çok boyutlu depolama, verileri herhangi bir boyutta aynı hızlı toplam hesaplamasını ve çeşitli çok boyutlu dönüşümleri sağlayan çok boyutlu bir dizi olarak ele almanıza olanak tanır. Bir süre önce OLAP ürünleri, ilişkisel veya çok boyutlu depolamayı destekledi. Bugün, kural olarak, aynı ürün, bu depolama türlerinin her ikisini ve ayrıca üçüncü bir tür karışımı sağlar. Aşağıdaki şartlar geçerlidir:

    • MOLAP(Çok boyutlu OLAP) - hem ayrıntılı veriler hem de kümeler çok boyutlu bir veritabanında saklanır. Bu durumda, çok boyutlu veriler tamamen ilişkisel veriler içerdiğinden, en büyük fazlalık elde edilir.
    • ROLAP(İlişkisel OLAP) - ayrıntılı veriler, başlangıçta "yaşadıkları" yerde kalır - ilişkisel bir veritabanında; agregalar, özel olarak oluşturulmuş hizmet tablolarında aynı veritabanında depolanır.
    • HOLAP(Hibrit OLAP) - ayrıntılı veriler yerinde kalır (ilişkisel bir veritabanında), kümeler ise çok boyutlu bir veritabanında depolanır.

    Bu yöntemlerin her birinin avantajları ve dezavantajları vardır ve koşullara bağlı olarak kullanılmalıdır - veri miktarı, ilişkisel VTYS'nin gücü, vb.

    Verileri çok boyutlu yapılarda depolarken, boş değerlerin depolanması nedeniyle olası bir "şişkinlik" sorunu vardır. Sonuçta, eğer çok boyutlu dizi Tüm olası ölçüm etiketi kombinasyonları için bir yer ayrılırsa ve yalnızca küçük bir kısım gerçekten doldurulursa (örneğin, bazı ürünler yalnızca az sayıda bölgede satılır), bu durumda küpün çoğu boş olacaktır, ancak yer işgal edilecek. Modern OLAP ürünleri bu sorunla başa çıkabilir.

    Devam edecek. İleride, önde gelen üreticiler tarafından üretilen belirli OLAP ürünlerinden bahsedeceğiz.