• سیستم های OLAP و OLTP OLTP - پردازش داده های معاملاتی آنلاین OLAP - پردازش داده های تحلیلی آنلاین. سیستم های OLTP و OLAP

    سیستم های OLTP و OLAP

    در قسمت فرعی قبل اشاره شد که به منظور نمایندگی کافی موضوع، سهولت توسعه و نگهداری پایگاه داده، رابطه باید به حالت عادی سوم برسد (اشکالی از عادی سازی و سفارشات بالاتر وجود دارد، اما در عمل آنها بسیار به ندرت استفاده می شوند)، یعنی به شدت عادی شود. با این حال، روابط ضعیف نرمال شده نیز مزایای خود را دارند، که اصلی ترین آنها این است که اگر به پایگاه داده عمدتاً فقط با پرس و جو دسترسی داشته باشید، و اصلاحات و افزودن داده ها به ندرت انجام شود، انتخاب آنها بسیار سریعتر است. این با این واقعیت توضیح داده می شود که در روابط ضعیف نرمال شده اتصال آنها قبلاً برقرار شده است ، و زمان پردازشگر برای این کار صرف نمی شود. دو دسته از سیستم ها برای آنها وجود دارد بیشترمناسب روابط عادی و ضعیف.

    مدل های داده به شدت نرمال شده برای برنامه های OLTP مناسب هستند - بر- خط معامله در حال پردازش (OLTP) - برنامه های کاربردی پردازش عملیاتیمعاملات نمونه های معمولی از برنامه های OLTP سیستم ها هستند حسابداری انبار، سفارش بلیط، سیستم های عامل بانکی و غیره. وظیفه اصلی چنین سیستم هایی انجام دادن است تعداد زیادیمعاملات کوتاه تراکنش ها به خودی خود بسیار ساده هستند، اما مشکلات این است که تعداد زیادی از این تراکنش ها وجود دارد، آنها به طور همزمان اجرا می شوند و در صورت بروز خطا، تراکنش باید به عقب برگردد و سیستم را به حالت قبل از شروع تراکنش برگرداند. تقریباً تمام پرس و جوهای پایگاه داده در برنامه های OLTP شامل دستورات درج، به روز رسانی و حذف هستند. درخواست های انتخاب عمدتاً برای ارائه گزیده ای از داده ها از انواع مختلف دایرکتوری ها به کاربران در نظر گرفته شده است. بنابراین، بیشتر درخواست ها از قبل در مرحله طراحی سیستم شناخته می شوند. برای برنامه‌های OLTP، سرعت و قابلیت اطمینان انجام به‌روزرسانی‌های کوتاه داده ضروری است. هرچه سطح نرمال سازی داده ها در برنامه های OLTP بالاتر باشد، سریعتر و قابل اعتمادتر است. انحراف از این قانون زمانی رخ می دهد که در حال حاضر در مرحله توسعه، برخی از پرس و جوهای متداول شناخته شده باشند که نیاز به اتصال روابط دارند و سرعت اجرای آنها به طور قابل توجهی بر عملکرد برنامه ها تأثیر می گذارد.

    نوع دیگری از برنامه‌ها، برنامه‌های OLAP هستند بر- خط تحلیلی در حال پردازش (OLAP) - برنامه های کاربردی پردازش داده های تحلیلی آنلاین. این یک اصطلاح تعمیم یافته است که اصول سیستم های پشتیبانی تصمیم را مشخص می کند - سیستم پشتیبانی تصمیم (DSS)، انبارهای داده - انبار داده، سیستم های داده کاوی - داده کاوی. چنین سیستم هایی برای یافتن وابستگی بین داده ها، انجام تجزیه و تحلیل پویا بر اساس اصل "چه می شود اگر ..." و کارهای مشابه طراحی شده اند. برنامه های OLAP با حجم زیادی از داده های انباشته شده در سازمان یا گرفته شده از منابع دیگر کار می کنند. چنین سیستم هایی با ویژگی های زیر مشخص می شوند:

      داده های جدید نسبتاً به ندرت در بلوک های بزرگ به سیستم اضافه می شود، به عنوان مثال، یک بار در ماه یا سه ماه. داده های اضافه شده به سیستم معمولاً هرگز حذف نمی شوند.
      قبل از بارگیری، داده ها مراحل مختلف آماده سازی مربوط به آوردن آنها به فرمت های خاص و موارد مشابه را طی می کنند. درخواست ها به سیستم غیرقانونی و نسبتاً پیچیده هستند. سرعت اجرای پرس و جو مهم است، اما حیاتی نیست.

    پایگاه‌های داده در برنامه‌های OLAP معمولاً به‌عنوان یک یا چند ابر مکعب نشان داده می‌شوند که ابعاد آنها داده‌های مرجع هستند و سلول‌های خود هایپرمکعب مقادیر آن داده‌ها را ذخیره می‌کنند. از نظر فیزیکی، یک ابر مکعب را می توان بر اساس یک مدل داده چند بعدی خاص ساخت - چند بعدی OLAP (MOLAP) یا با استفاده از مدل داده های رابطه ای نمایش داده می شود - رابطه ای OLAP (ROLAP).

    در سیستم های OLAP که استفاده می کنند مدل رابطه ایداده ها، توصیه می شود داده ها را در قالب روابط نرمال شده ضعیف حاوی داده های خلاصه اصلی از پیش محاسبه شده ذخیره کنید. افزونگی داده ها و مشکلات مربوط به آن در اینجا وحشتناک نیستند، زیرا به ندرت به روز می شوند و همراه با به روز رسانی داده ها، مجموع ها دوباره محاسبه می شوند.

    ویژگی ها و دامنه وظایفی که به طور موثر توسط هر فناوری حل شده است به شرح زیر توضیح داده شده است. جدول مقایسه:

    مشخصه

    OLTP

    OLAP

    هدف سیستم

    ثبت، جستجوی عملیاتی و پردازش معاملات، تجزیه و تحلیل تنظیم شده

    کار با داده های تاریخی، پردازش تحلیلی، پیش بینی، مدل سازی

    اطلاعات ذخیره شده

    عملیاتی، تفصیلی

    دوره زمانی زیادی را پوشش می دهد

    نوع داده

    ساختار یافته

    ناهمگون

    "سن" داده ها

    جاری (چند ماه)

    تاریخی (سالها) و پیش بینی شده

    فرکانس به روز رسانی داده ها

    بخش های زیاد و کوچک

    بخش های کوچک و بزرگ

    سطح تجمیع داده ها

    داده های تفصیلی

    اساسا - داده های جمع آوری شده

    عملیات غالب

    ورود داده ها، جستجو، به روز رسانی

    تحلیل داده ها

    نحوه استفاده از داده ها

    قابل پیش بینی

    غیر قابل پیش بینی

    در سطح معامله

    در سطح کل پایگاه داده

    نوع فعالیت

    عملیاتی، تاکتیکی

    تحلیلی، استراتژیک

    اولویت های

    انعطاف پذیری
    استقلال کاربر

    تعداد زیادی کارمند اجرایی

    نسبتا تعداد کمی از مدیران ارشد

    مقایسه OLTP و OLAP

    مشخصه

    OLTP

    OLAP

    ماهیت درخواست ها

    بسیاری از معاملات ساده

    معاملات پیچیده

    اطلاعات ذخیره شده

    عملیاتی، تفصیلی

    دوره زمانی زیادی را پوشش می دهد

    نوع فعالیت

    عملیاتی، تاکتیکی

    تحلیلی، استراتژیک

    نوع داده

    ساختار یافته

    ناهمگون

    ویژگی سیستم

    سیستم حسابداری (OLTP)

    OLAP

    تعامل کاربر

    در سطح معامله

    در سطح کل پایگاه داده

    داده هایی که هنگام دسترسی کاربر به سیستم استفاده می شود

    ورودی های جداگانه

    ضبط گروه ها

    زمان پاسخ

    ثانیه ها

    چند ثانیه تا چند دقیقه

    استفاده از منابع سخت افزاری

    پایدار

    پویا

    ماهیت داده ها

    عمدتا اولیه (بیشتر سطح پایینجزئیات)

    بیشتر مشتقات (مقادیر تجمعی)

    ماهیت دسترسی به پایگاه داده

    مسیرهای دسترسی از پیش تعریف شده یا ایستا و روابط داده

    مسیرهای دسترسی نامشخص یا پویا و روابط داده

    تنوع داده ها

    بالا (داده ها با هر تراکنش به روز می شوند)

    کم (داده ها به ندرت در طول یک پرس و جو به روز می شوند)

    اولویت های

    عملکرد بالا در دسترس بودن بالا

    انعطاف پذیری
    استقلال کاربر

    سیستم های OLAP

    OLAP (پردازش تحلیلی آنلاین انگلیسی، پردازش تحلیلی بلادرنگ) یک فناوری پردازش داده است که شامل تهیه خلاصه (تجمیع) اطلاعات بر اساس آرایه‌های داده بزرگ است که بر اساس یک اصل چند بعدی ساختار یافته‌اند. پیاده سازی های فناوری OLAP جزء هستند راه حل های نرم افزاریکلاس هوش تجاری

    بنیانگذار اصطلاح OLAP - Edgar Codd، در سال 1993 "12 قانون پردازش تحلیلی در زمان واقعی" را پیشنهاد کرد.

    شرکت ها اغلب چندین مورد دارند سیستم های اطلاعاتی- سیستم های حسابداری انبار، سیستم های حسابداری، سیستم های ERP برای خودکارسازی افراد فرآیندهای تولید، سیستم های جمع آوری گزارش ها از دپارتمان های شرکت و همچنین فایل های زیادی که روی کامپیوتر کارمندان پراکنده شده اند.

    با بسیاری از منابع اطلاعاتی متفاوت، دریافت پاسخ به سؤالات کلیدی در مورد عملیات یک شرکت و دیدن آنها اغلب بسیار دشوار است. تصویر بزرگ. و وقتی که اطلاعات لازمدر یکی از سیستم های استفاده شده یا یک فایل محلی قرار دارد، اغلب قدیمی است یا با اطلاعات به دست آمده از سیستم دیگر در تضاد است.

    این مشکلبه طور موثر با کمک سیستم های اطلاعاتی و تحلیلی ساخته شده بر اساس فناوری های OLAP (نام های دیگر: سیستم OLAP، سیستم هوش تجاری، هوش تجاری) حل می شود. سیستم‌های OLAP سیستم‌های حسابداری موجود را ادغام می‌کنند و ابزارهایی را برای تجزیه و تحلیل بی‌درنگ حجم زیادی از داده‌ها، طراحی گزارش پویا، نظارت و پیش‌بینی شاخص‌های کلیدی کسب‌وکار در اختیار کاربر قرار می‌دهند.

    مزایای سیستم های OLAP

    اطلاعات نقش کلیدی در مدیریت یک شرکت دارد. به عنوان یک قاعده، حتی شرکت های کوچک از چندین سیستم اطلاعاتی برای خودکارسازی حوزه های مختلف فعالیت استفاده می کنند. به دست آوردن گزارش تحلیلی در سیستم های اطلاعاتی مبتنی بر پایگاه های داده سنتی با تعدادی محدودیت همراه است:

    توسعه هر گزارش مستلزم کار یک برنامه نویس است.



    گزارش ها بسیار آهسته (اغلب چندین ساعت) تولید می شوند، بنابراین عملکرد کل سیستم اطلاعاتی کند می شود.

    داده های دریافتی از عناصر ساختاری مختلف شرکت یکپارچه و اغلب متناقض نیستند.

    سیستم های OLAP، با توجه به ایدئولوژی ساخت خود، برای تجزیه و تحلیل مقادیر زیادی از اطلاعات طراحی شده اند و به شما امکان می دهند بر محدودیت های سیستم های اطلاعاتی سنتی غلبه کنید.

    ایجاد یک سیستم OLAP در یک شرکت اجازه می دهد:

    ادغام داده ها از سیستم های اطلاعاتی مختلف، ایجاد یک نسخه واحد از حقیقت

    · طراحی گزارش های جدید با چند کلیک ماوس بدون مشارکت برنامه نویسان.

    · تحلیل زمان واقعی داده ها برای هر دسته و شاخص های تجاری در هر سطح از جزئیات.

    شاخص های کلیدی کسب و کار را پایش و پیش بینی کنید

    هنگام کار با یک سیستم OLAP، همیشه می توانید به سرعت پاسخ سؤالات در حال ظهور را بیابید، تصویر بزرگ را ببینید و دائماً وضعیت کسب و کار را زیر نظر داشته باشید. در عین حال می توانید مطمئن باشید که فقط از اطلاعات به روز استفاده می کنید.

    نتایج پیاده سازی سیستم OLAP

    مدیریت یک چشم انداز روشن کامل از وضعیت و یک مکانیسم واحد برای حسابداری، کنترل و تجزیه و تحلیل دریافت می کند.

    با خودکارسازی فرآیندهای داخلی کسب و کار و افزایش بهره وری کارکنان، نیاز به منابع انسانی کاهش می یابد.

    اقدام OLAP

    دلیل استفاده از OLAP برای پردازش پرس و جو سرعت است. پایگاه داده های رابطه ای موجودیت ها را در جداول جداگانه ذخیره می کنند که معمولاً به خوبی نرمال شده اند. این ساختار برای پایگاه های داده عملیاتی (سیستم های OLTP) مناسب است، اما پرس و جوهای پیچیده چند جدولی در آن نسبتاً کند هستند.

    یک ساختار OLAP ایجاد شده از داده های تولید، مکعب OLAP نامیده می شود. یک مکعب از اتصال جداول با استفاده از یک طرح ستاره یا یک طرح برف ریزه ایجاد می شود. در مرکز طرح ستاره یک جدول حقایق است که حاوی حقایق کلیدی است که در حال پرس و جو هستند. جداول متعدد با ابعاد به یک جدول حقایق متصل شده اند. این جداول نشان می دهد که چگونه داده های رابطه ای انباشته شده را می توان تجزیه و تحلیل کرد. تعداد تجمع‌های ممکن با تعداد روش‌هایی که داده‌های اصلی را می‌توان به صورت سلسله مراتبی نمایش داد، تعیین می‌شود.

    به عنوان مثال، همه مشتریان را می توان بر اساس شهر یا منطقه کشور (غرب، شرق، شمال و غیره) گروه بندی کرد، بنابراین 50 شهر، 8 منطقه و 2 کشور 3 سطح از یک سلسله مراتب را با 60 عضو تشکیل می دهند. همچنین مشتریان را می توان در رابطه با محصولات گروه بندی کرد. اگر 250 محصول در 2 دسته، 3 گروه محصول و 3 بخش تولید وجود داشته باشد، تعداد دانه ها 16560 خواهد بود. هنگام اضافه کردن ابعاد به طرح، تعداد گزینه هابه سرعت به ده ها میلیون یا بیشتر می رسد.

    یک مکعب OLAP حاوی داده‌ها و اطلاعات اولیه در مورد ابعاد (جمع‌ها) است. مکعب به طور بالقوه حاوی تمام اطلاعاتی است که ممکن است برای پاسخ به هر سؤالی مورد نیاز باشد. با توجه به تعداد زیاد واحدها، اغلب یک محاسبه کامل فقط برای برخی از اندازه گیری ها انجام می شود، برای بقیه آن ها "در صورت تقاضا" انجام می شود.

    همراه با مفهوم اصلی، سه نوع OLAP وجود دارد:

    OLAP با ابعاد بسیار (Multidimensional OLAP - MOLAP);

    OLAP رابطه ای (OLAP رابطه ای - ROLAP);

    هیبرید OLAP (Hybrid OLAP - HOLAP).

    MOLAP شکل کلاسیک OLAP است، بنابراین اغلب به سادگی به عنوان OLAP شناخته می شود. از پایگاه داده جمع بندی، یک نوع خاص از پردازشگر پایگاه داده فضایی استفاده می کند، و طرح داده های مکانی مورد نیاز را ایجاد می کند و هم داده های اساسی و هم مجموعه ها را حفظ می کند.

    ROLAP مستقیماً با ذخیره‌سازی رابطه‌ای کار می‌کند، حقایق و جداول با ابعاد در جداول رابطه‌ای ذخیره می‌شوند و جداول رابطه‌ای اضافی برای ذخیره مجموعه‌ها ایجاد می‌شوند.

    HOLAP از جداول رابطه ای برای ذخیره داده های اولیه و جداول چند بعدی برای ذخیره انبوه ها استفاده می کند.

    یک مورد خاص از ROLAP، ROLAP در زمان واقعی (R-ROLAP) است. برخلاف ROLAP، R-ROLAP جداول رابطه‌ای اضافی را برای ذخیره‌سازی مجموعه‌ها ایجاد نمی‌کند، اما تجمیع‌ها در زمان پرس و جو محاسبه می‌شوند. در این مورد، یک پرس و جو چند بعدی به سیستم OLAP به طور خودکار به یک پرس و جو SQL به داده های رابطه ای تبدیل می شود.

    هر نوع ذخیره سازی دارای مزایای خاصی است، اگرچه در ارزیابی آنها اختلاف نظر وجود دارد. تولید کنندگان مختلف. MOLAP برای مجموعه داده‌های کوچک مناسب است، به سرعت مجموع‌ها را محاسبه می‌کند و پاسخ‌ها را برمی‌گرداند، اما حجم عظیمی از داده را تولید می‌کند. ROLAP به عنوان یک راه حل مقیاس پذیرتر رتبه بندی می شود، در حالی که از کوچکترین فضای ممکن نیز استفاده می کند. در این حالت سرعت پردازش به میزان قابل توجهی کاهش می یابد. HOLAP در وسط این دو رویکرد قرار دارد، به خوبی مقیاس می شود و پردازش آن سریع است. معماری R-ROLAP امکان تجزیه و تحلیل چند بعدی بلادرنگ داده های OLTP را فراهم می کند.

    مشکل در به کارگیری OLAP در ایجاد پرس و جو، انتخاب داده های زیربنایی و طراحی یک طرح است که در نتیجه اکثر موارد محصولات مدرن OLAP با تعداد زیادی پرس و جو از پیش پیکربندی شده همراه است. مشکل دیگر در داده های اساسی است. آنها باید کامل و منسجم باشند.

    پیاده سازی های OLAP

    از نظر تاریخی، اولین سیستم مدیریت پایگاه داده چند بعدی که اساساً یک پیاده سازی OLAP است، سیستم Express است که در سال 1970 توسط IRI توسعه یافت (بعدها حقوق محصول توسط Oracle Corporation به دست آمد و به یک گزینه OLAP برای پایگاه داده اوراکل تبدیل شد). اصطلاح OLAP توسط ادگار کاد در انتشاراتی در Computerworld در سال 1993 معرفی شد، که در آن او 12 اصل پردازش تحلیلی را پیشنهاد کرد، مشابه 12 قانون برای پایگاه های داده رابطه ای که یک دهه قبل توسط او فرموله شده بود، به عنوان محصول مرجع که اصول پیشنهادی را برآورده می کند. ، Codd سیستم Essbase Arbor را نشان داد (در سال 1997 توسط Hyperion خریداری شد که به نوبه خود توسط Oracle در سال 2007 خریداری شد). قابل توجه است که این نشریه متعاقباً به دلیل تضاد منافع احتمالی از آرشیو Computerworld حذف شد، همانطور که کاد بعداً ارائه کرد. خدمات مشاورهبرای آربور

    سایر محصولات معروف OLAP: خدمات تجزیه و تحلیل مایکروسافت (که قبلاً خدمات OLAP بخشی از سرور SQL نامیده می شد)، سرور SAS OLAP، TM1، PowerPlay، SAP BW، MicroStrategy Ingelligence Server، Mondrian، Complex Analytical PROGNOZ.

    از نقطه نظر پیاده سازی، آنها به "OLAP فیزیکی" و "مجازی" (رابطه، انگلیسی رابطه ای OLAP، ROLAP) تقسیم می شوند. "فیزیکی"، به نوبه خود، بسته به اجرا به چند بعدی (انگلیسی OLAP چند بعدی، MOLAP) و ترکیبی - (انگلیسی ترکیبی OLAP، HOLAP) تقسیم می شود.

    در حالت اول، برنامه ای وجود دارد که در مرحله پیش بارگذاری داده ها در OLAP از منابع، یک محاسبه مقدماتی از مجموع ها را انجام می دهد (محاسبات بر اساس چندین مقدار اولیه، به عنوان مثال، "کل برای ماه")، که سپس انجام می شود. ذخیره شده در یک پایگاه داده چند بعدی خاص که فراهم می کند استخراج سریعو ذخیره سازی اقتصادی نمونه هایی از این محصولات عبارتند از: Microsoft Analysis Services، Oracle OLAP Option، Essbase، SAS OLAP Server، TM1، PowerPlay.

    OLAP هیبریدی یک ترکیب است. خود داده ها در یک پایگاه داده رابطه ای ذخیره می شوند، در حالی که مجموعه ها در یک پایگاه داده چند بعدی ذخیره می شوند.

    در پیاده سازی ROLAP، تمام داده ها توسط سیستم های مدیریت پایگاه داده رابطه ای ذخیره و پردازش می شوند و ممکن است تجمیع ها اصلا وجود نداشته باشند یا در اولین درخواست در DBMS یا حافظه پنهان نرم افزار تحلیلی ایجاد شوند. نمونه هایی از این محصولات عبارتند از SAP BW، Microstrategy Intelligence Server، Mondrian.

    از دیدگاه کاربر، همه گزینه ها از نظر قابلیت مشابه به نظر می رسند. OLAP بیشترین کاربرد خود را در محصولات برای برنامه ریزی مالی، انبارهای داده، راه حل های هوش تجاری.

    سیستم های OLTP (سیستم های پردازش تراکنش آنلاین)

    OLTP (Online Transaction Processing)، سیستم تراکنش - پردازش معاملات در زمان واقعی. روشی برای سازماندهی پایگاه داده که در آن سیستم با تراکنش های کوچک اما با جریان زیاد کار می کند و در عین حال کلاینت به حداقل زمان پاسخگویی از سیستم نیاز دارد.

    اصطلاح OLTP برای سیستم ها (برنامه ها) نیز به کار می رود. سیستم های OLTP برای ورودی، ذخیره سازی ساختار یافته و پردازش اطلاعات (عملیات، اسناد) در زمان واقعی طراحی شده اند.

    مشکل یکپارچگی اطمینان از صحت داده های پایگاه داده در هر زمان معین است. در موارد زیر قابل نقض است: 1. هنگام ورود و به روز رسانی، زمانی که اطلاعات نادرست ارائه می شود. 2. هنگامی که چندین کاربر به طور همزمان از داده ها استفاده می کنند. 3. در صورت خرابی APS.

    حل مشکلات یکپارچگی باید از منظر برنامه ای و سازمانی مورد توجه قرار گیرد. برای نرم افزار 1. شما به تعدادی رویداد سازمانی نیاز دارید (برای پیگیری ورودی)، کاربر باید قوانین و محدودیت های ورودی را بداند. برای مشکلات 2-3 - ابزار استاندارد DBMS یا ماژول های نرم افزار خاص. DBMS - 2 محدودیت یکپارچگی اصلی: 1. محدودیت های ساختاری (تنظیم شده توسط پیوندهای عملکردی و بررسی با بررسی برابری مقادیر پایگاه داده) 2. محدودیت در مقادیر واقعی. نیاز است که مقادیر فیلد به یک محدوده خاص تعلق داشته باشد یا وابستگی بین مقادیر برخی از فیلدها باشد. (انواع داده ها و ماسک های ورودی). محدودیت‌ها را می‌توان در هر زمانی توسط DBMS تنظیم کرد، اما DBMS ممکن است محدودیت را نپذیرد (اگر بسیاری از رکوردها دیگر آن را برآورده نکنند)، اگر مطابقت وجود داشته باشد، در فرهنگ لغت نوشته شده و استفاده می‌شود. محدودیت ها در سطح دشواری متفاوت است:

    2. محدودیت در مجموعه ویژگی های رشته. (موقعیت - نرخ تخلیه، مناطق - شهرها).

    3. محدودیت در بسیاری از خطوط در همان زمان.

    همه این محدودیت‌ها آماری هستند، اما زمانی که پایگاه داده از حالتی به حالت دیگر منتقل می‌شود، لازم است که محدودیت‌های یکپارچگی قبل از شروع همه تغییرات و بعد از پایان همه، نه هر کدام، رعایت شود. این گونه محدودیت ها معوق نامیده می شود و مفهوم معاملات در رابطه با آنها معرفی می شود. تراکنش یک عمل کامل شده در پایگاه داده از دیدگاه کاربر است. در عین حال، واحد منطقی عملکرد سیستم است. یک تراکنش برخی از عملکردهای کاربردی را پیاده سازی می کند، به عنوان مثال، انتقال پول از یک حساب به حساب دیگر در سیستم بانکی.

    باید دارای 4 خاصیت باشد: 1. اتمی (تقسیم ناپذیری): به عنوان یک عملیات دسترسی به پایگاه داده انجام می شود، باید به طور کامل انجام شود یا اصلاً انجام نشود. 2. سازگاری - یکپارچگی متقابل داده ها را پس از تکمیل پردازش تراکنش تضمین می کند. 3. جداسازی (هر تراکنش می تواند داده ها را تغییر دهد که به طور موقت در حالت ناسازگار است). در عین حال، دسترسی سایر تراکنش ها به این داده ها تا پایان تراکنش ممنوع است. 4. دوام - اگر معامله موفقیت آمیز باشد، تغییرات از بین نخواهند رفت. نتیجه یک تراکنش می تواند commit (عملی برای انجام تغییرات در پایگاه داده) یا بازگشت (لغو تراکنش و برگرداندن پایگاه داده به حالت قبل از شروع آن) باشد. مکانیسم commit و rollback بر اساس استفاده از گزارش تراکنش است، جایی که حالت قبل (در چندین تکرار) و بعد از آن ذخیره می شود. برخی از لهجه‌های SQL شامل دستورات commit میانی (نقطه به نقطه بازگشت) هستند.

    مانیتورهای پردازش تراکنش (TPM) هستند سیستم های نرم افزاری(به واسطه یا میان افزار مراجعه کنید)، حل مشکلمدیریت موثر اطلاعات و منابع محاسباتی در یک سیستم توزیع شده آنها یک محیط توسعه و مدیریت منعطف و باز را فراهم می کنند. برنامه های موبایل، بر پردازش آنلاین تراکنش های توزیع شده متمرکز شده است. در میان مهمترین ویژگی ها TPM - مقیاس پذیری، پشتیبانی از کامل بودن عملکرد و یکپارچگی برنامه، دستیابی حداکثر عملکردهنگام پردازش داده ها با شاخص های کم هزینه، حفظ یکپارچگی داده ها در یک محیط ناهمگن. TPM ها بر یک مدل مشتری-سرور سه لایه متکی هستند

    بر بازار مدرنمانیتورهای تراکنش، "بازیگران" اصلی سیستم هایی مانند ACMS (DEC)، CICS (IBM)، TOP END (NCR)، TUXEDO System (Novell) هستند.

    انبارهای دادهبر اساس عکس های فوری ثابت در یک دوره زمانی طولانی از پایگاه های داده عملیاتی تشکیل می شوند سیستم اطلاعاتو احتمالا متفاوت منابع خارجی. انبارهای داده از فناوری های پایگاه داده، OLAP، داده کاوی، تجسم داده ها استفاده می کنند.

    مشخصات اصلی انبارهای داده

    • حاوی داده های تاریخی
    • اطلاعات دقیق و همچنین داده های جزئی و کامل را ذخیره می کند.
    • داده ها عمدتا ثابت هستند.
    • روش غیرقانونی، بدون ساختار و اکتشافی پردازش داده ها؛
    • شدت متوسط ​​و کم پردازش تراکنش؛
    • روش غیرقابل پیش بینی استفاده از داده ها؛
    • طراحی شده برای تجزیه و تحلیل؛
    • تمرکز بر حوزه های موضوعی;
    • پشتیبانی از تصمیم گیری استراتژیک؛
    • به تعداد نسبتاً کمی از مدیران خدمات ارائه می دهد.

    اصطلاح OLAP (پردازش تحلیلی آنلاین) برای توصیف مدل ارائه داده ها و بر این اساس، فناوری پردازش آنها در انبارهای داده استفاده می شود. OLAP از یک نمای چند بعدی از داده های انبوه برای ارائه استفاده می کند دسترسی سریعبه صورت استراتژیک اطلاعات مهمبرای اهداف تجزیه و تحلیل عمیق برنامه های OLAP باید ویژگی های اساسی زیر را داشته باشند:

    • چند بعدی نمایش داده ها;
    • پشتیبانی از محاسبات پیچیده؛
    • در نظر گرفتن صحیح عامل زمان

    مزایای OLAP:

    • ترویج کاراییکارکنان تولید، توسعه دهندگان برنامه های کاربردی. دسترسی به موقع به اطلاعات استراتژیک
    • ارائه فرصت های کافی برای کاربران تغییرات خودبه طرحواره
    • برنامه های OLAP متکی هستند انبارهای دادهو سیستم های OLTP، داده های به روز را از آنها دریافت می کنند که باعث صرفه جویی می شود کنترل یکپارچگیداده های شرکتی
    • کاهش بار روی سیستم های OLTP و انبارهای داده.

    OLAP و OLTP. ویژگی ها و تفاوت های اصلی

    OLAP OLTP
    ذخیره دادهباید شامل داده های داخلی شرکت و داده های خارجی باشد منبع اصلی اطلاعاتی که وارد پایگاه داده عملیاتی می شود، فعالیت های شرکت است و تجزیه و تحلیل داده ها مستلزم دخالت منابع خارجی اطلاعات (به عنوان مثال، گزارش های آماری) است.
    حجم پایگاه های داده های تحلیلی حداقل یک مرتبه بزرگتر از حجم پایگاه های عملیاتی است. برای تحلیل و پیش بینی قابل اعتماد در ذخیره دادهشما باید اطلاعاتی در مورد فعالیت های شرکت و وضعیت بازار برای چندین سال داشته باشید برای پردازش عملیاتی، داده های چند ماه گذشته مورد نیاز است
    ذخیره دادهباید حاوی اطلاعات یکسان ارائه شده و توافق شده باشد که تا حد امکان به محتوای پایگاه های داده عملیاتی نزدیک باشد. برای استخراج و «پاک کردن» اطلاعات از منابع مختلف به یک جزء نیاز است. در بسیاری از شرکت های بزرگ، چندین سیستم اطلاعات عملیاتی با پایگاه داده های خاص خود به طور همزمان وجود دارد (به دلایل تاریخی). پایگاه‌های اطلاعاتی عملیاتی ممکن است حاوی اطلاعات معادل معنایی باشد که در قالب‌های مختلف، با نشانه‌های متفاوتی از زمان دریافت آن، گاهی اوقات حتی متناقض ارائه شده است.
    مجموعه پرس و جوها در برابر یک پایگاه داده تحلیلی قابل پیش بینی نیست. انبارهای دادهوجود دارد تا به درخواست‌های تحلیلگر موقت پاسخ دهد. فقط می‌توانید روی این واقعیت حساب کنید که درخواست‌ها خیلی زیاد نمی‌شوند و بر حجم زیادی از اطلاعات تأثیر نمی‌گذارند. اندازه های پایگاه داده تحلیلی استفاده از پرس و جوها را با تجمیع ترغیب می کند (جمع، حداقل، حداکثر، مقدار متوسطو غیره.) سیستم های پردازش داده برای حل مشکلات خاص طراحی شده اند. اطلاعات از پایگاه داده اغلب و در بخش های کوچک انتخاب می شوند. معمولاً مجموعه ای از پرس و جوها به پایگاه داده عملیاتی از قبل در طول طراحی شناخته شده است
    با تنوع کمی از پایگاه داده های تحلیلی (فقط هنگام بارگیری داده ها)، ترتیب آرایه ها معقول است، بیشتر روش های سریعنمایه سازی برای نمونه گیری انبوه، ذخیره سازی داده های از پیش تجمیع شده سیستم های پردازش داده به دلیل ماهیت خود بسیار متغیر هستند، که در DBMS مورد استفاده در نظر گرفته می شود (ساختار پایگاه داده عادی، ردیف ها خارج از نظم ذخیره می شوند، درختان B برای نمایه سازی، معامله گری)
    اطلاعات پایگاه‌های اطلاعاتی تحلیلی برای شرکت بسیار حیاتی است که به یک سری حفاظت بزرگ نیاز است (حق دسترسی فردی به ردیف‌ها و/یا ستون‌های خاص جدول) برای سیستم های پردازش داده، معمولاً کافی است امنیت اطلاعاتدر سطح میز

    قوانین کد برای سیستم های OLAP

    در سال 1993، Codd OLAP را برای کاربران تحلیلگر منتشر کرد: چگونه باید باشد. در آن، او مفاهیم اساسی پردازش تحلیلی آنلاین را تشریح کرد و 12 قاعده را که محصولات برای ارائه پردازش تحلیلی آنلاین باید رعایت کنند، شناسایی کرد.

    1. نمایش چند بعدی مفهومی. یک مدل OLAP باید در هسته خود چند بعدی باشد. یک نمودار مفهومی چند بعدی یا نمایش سفارشی مدل‌سازی و تحلیل و همچنین محاسبات را تسهیل می‌کند.
    2. شفافیت. کاربر می‌تواند تمام داده‌های لازم را از دستگاه OLAP دریافت کند، بدون اینکه حتی گمان کند از کجا آمده‌اند. صرف نظر از اینکه محصول OLAP بخشی از ابزارهای کاربر است یا خیر، این واقعیت باید برای کاربر نامرئی باشد. اگر OLAP توسط محاسبات سرویس گیرنده-سرور ارائه می شود، در صورت امکان، این واقعیت نیز باید برای کاربر نامرئی باشد. OLAP باید در چارچوب یک معماری واقعاً باز ارائه شود و به کاربر اجازه دهد در هر کجا که باشد با استفاده از یک ابزار تحلیلی با سرور ارتباط برقرار کند. علاوه بر این، هنگامی که ابزار تحلیلی با محیط های پایگاه داده همگن و ناهمگن تعامل داشته باشد، باید شفافیت نیز حاصل شود.
    3. دسترسی. OLAP باید خود را ارائه دهد نمودار منطقی برای دسترسی به یک محیط پایگاه داده ناهمگن و انجام تبدیل های مناسب برای ارائه داده به کاربر. علاوه بر این، لازم است از قبل در مورد مکان و نحوه و نوع سازماندهی داده های فیزیکی واقعاً مورد استفاده قرار گیرد. یک سیستم OLAP فقط باید به داده‌هایی دسترسی داشته باشد که واقعاً مورد نیاز هستند و اعمال نمی‌شوند اصل کلی"قیف آشپزخانه" که مستلزم ورودی غیر ضروری است.
    4. ثابت کاراییهنگام تهیه گزارش ها کاراییگزارش دهی نباید با رشد تعداد ابعاد و اندازه پایگاه داده به میزان قابل توجهی کاهش یابد.
    5. معماری سرویس گیرنده-سرور. نه تنها محصول مورد نیاز است که یک محصول مشتری/سرور باشد، بلکه مؤلفه سرور نیز باید به اندازه کافی هوشمند باشد که مشتریان مختلف بتوانند با حداقل تلاش و برنامه نویسی به یکدیگر متصل شوند.
    6. چند بعدی بودن عمومی همه ابعاد باید برابر باشند، هر بعد باید هم در ساختار و هم در قابلیت های عملیاتی معادل باشد. درست است، اضافی قابلیت های عملیاتیبرای اندازه گیری های فردی (ظاهراً زمان دلالت دارد)، اما چنین است توابع اضافیباید به هر ابعادی داده شود. این نباید طوری باشد که اساسی باشد ساختارهای دادهفرمت های محاسباتی یا گزارش دهی بیشتر به یک بعد اختصاص داشت.
    7. کنترل دینامیک ماتریس های پراکنده. سیستم های OLAP باید به طور خودکار طرح فیزیکی خود را بر اساس نوع مدل، حجم داده ها و پراکندگی پایگاه داده تنظیم کنند.
    8. پشتیبانی چند کاربره ابزار OLAP باید این توانایی را فراهم کند اشتراک گذاری (درخواست و اضافه)، یکپارچگی و امنیت.
    9. عملیات متقابل نامحدود همه نوع عملیات باید برای هر اندازه گیری مجاز باشد.
    10. دستکاری داده های بصری دستکاری داده ها از طریق اقدامات مستقیم بر روی سلول ها در حالت مشاهده بدون استفاده از منوها و عملیات های متعدد انجام شد.
    11. گزینه های گزارش دهی انعطاف پذیر اندازه گیری ها باید به روشی که کاربر می خواهد در گزارش قرار گیرد.
    12. نامحدود

    در حوزه فناوری اطلاعات، دو حوزه مکمل یکدیگر وجود دارد:

    فن آوری های متمرکز بر پردازش داده های عملیاتی (معامله ای). این فناوری ها زیربنای سیستم های اطلاعات اقتصادی طراحی شده برای پردازش داده های عملیاتی هستند. چنین سیستم هایی نامیده می شوند OLTP(پردازش معاملات آنلاین) سیستم های;

    فن آوری های متمرکز بر تجزیه و تحلیل داده ها و تصمیم گیری. این فناوری ها زیربنای سیستم های اطلاعات اقتصادی طراحی شده برای تجزیه و تحلیل هستند

    داده های انباشته شده چنین سیستم هایی نامیده می شوند OLAP

    (پردازش تحلیلی آنلاین) سیستم های.

    هدف اصلی سیستم های OLAP- چند بعدی پویا

    تجزیه و تحلیل داده های تاریخی و فعلی، پایدار در طول زمان، تجزیه و تحلیل

    روندها، مدل سازی و پیش بینی آینده. چنین

    سیستم ها، به عنوان یک قاعده، بر پردازش دلخواه متمرکز هستند،

    درخواست های از پیش تنظیم شده به عنوان اصلی

    ویژگی های این سیستم ها به شرح زیر است:

    پشتیبانی از نمایش داده های چند بعدی، برابری همه ابعاد، استقلال عملکرد از تعداد ابعاد.

    شفافیت برای کاربر ساختار، روش های ذخیره و پردازش داده ها؛

    نگاشت خودکار ساختار داده های منطقی به سیستم های خارجی.

    پردازش دینامیکی ماتریس های پراکنده به روشی کارآمد.

    اصطلاح OLAP نسبتاً جدید است و گاهی اوقات در منابع مختلف ادبی به طور متفاوت تفسیر می شود. این اصطلاح اغلب با پشتیبانی تصمیم (DSS (سیستم‌های پشتیبانی تصمیم) - سیستم‌های پشتیبانی تصمیم شناخته می‌شود. و به عنوان مترادف اصطلاح اخیر، از Data Warehousing - انبارهای داده استفاده می‌کنند، به معنی مجموعه‌ای از راه‌حل‌های سازمانی، نرم‌افزار و سخت‌افزار برای ارائه تحلیل‌گران. با اطلاعات مبتنی بر داده های سیستم های پردازش تراکنش سطح پایین و سایر منابع

    "انبار داده ها" به شما امکان می دهد داده های انباشته شده در دوره های زمانی طولانی را پردازش کنید. این داده ها ناهمگن هستند (و لزوماً ساختاری ندارند). برای "انبار داده ها" ماهیت چند بعدی پرس و جوها ذاتی است. حجم عظیمی از داده ها، پیچیدگی ساختار داده ها و پرس و جوها نیازمند استفاده از روش های خاصی برای دسترسی به اطلاعات است.

    در منابع دیگر، مفهوم سیستم پشتیبانی تصمیم (DSS) گسترده تر در نظر گرفته شده است. انبارهای داده و ابزارهای پردازش تحلیلی آنلاین می توانند به عنوان یکی از اجزای معماری DSS عمل کنند.

    OLAP همیشه شامل پردازش پرس و جو تعاملی و متعاقب آن تجزیه و تحلیل چند گذری اطلاعات است که به شما امکان می دهد روندهای مختلف و نه همیشه واضح مشاهده شده در حوزه موضوعی را شناسایی کنید.

    گاهی اوقات بین "OLAP به معنای محدود" تمایزی وجود دارد - اینها سیستم هایی هستند که فقط مجموعه ای از داده ها را در بخش های مختلف ارائه می دهند و "OLAP به معنای گسترده" یا به سادگی OLAP که شامل:

    پشتیبانی از چندین کاربر در حال ویرایش پایگاه داده

    توابع مدل سازی، از جمله مکانیسم های محاسباتی برای به دست آوردن نتایج مشتق شده، و همچنین جمع آوری و ترکیب داده ها.

    پیش بینی، روند و تجزیه و تحلیل آماری.

    طبیعتاً هر یک از این نوع IS به سازماندهی خاصی از داده ها و همچنین خاص نیاز دارد ابزارهای نرم افزاری، حصول اطمینان از اجرای موثر وظایف پیش رو.

    OLAP - ابزارها تجزیه و تحلیل اطلاعات کسب و کار را بر روی پارامترهای مختلفی از جمله نوع محصول، موقعیت جغرافیایی خریدار، زمان معامله و فروشنده ارائه می دهند که هر کدام از آنها امکان ایجاد سلسله مراتبی از نماها را فراهم می کند. بنابراین، برای زمان، می توانید از فواصل سالانه، فصلی، ماهانه و حتی هفتگی و روزانه استفاده کنید. تفکیک‌های جغرافیایی می‌تواند بر اساس شهرها، ایالت‌ها، مناطق، کشورها، یا در صورت لزوم، بر اساس کل نیمکره باشد.

    سیستم های OLAP را می توان به سه دسته تقسیم کرد.

    پیچیده ترین و گران ترین آنها مبتنی بر فناوری های اختصاصی هستند. سرورهای پایگاه داده چند بعدی. این سیستم ها یک چرخه کامل از پردازش OLAP را فراهم می کندو علاوه بر مؤلفه سرور، رابط مشتری یکپارچه خود را نیز شامل می شود، یا برای تجزیه و تحلیل داده ها استفاده می شود برنامه های خارجیکار با صفحات گسترده محصولات این کلاس بیشتر برای استفاده در انبارهای اطلاعاتی بزرگ مناسب هستند. تعمیر و نگهداری آنها مستلزم کارکنان کاملی است که در نصب و نگهداری سیستم و تشکیل نمایش داده ها برای کاربران نهایی مشارکت دارند. معمولا این بسته ها بسیار گران هستند. نمونه‌هایی از محصولات این کلاس عبارتند از Arbor Software's Essbase، IRI's Express (اکنون بخشی از Oracle)، Pilot Software's Lightship و غیره.

    لازم به ذکر است که یکی از راه های اطمینان از پردازش سریع داده ها در حین تجزیه و تحلیل آنها، سازماندهی داده ها در قالب پایگاه های داده چند بعدی (MDD) است. اطلاعات در MDD به عنوان رکوردهای نمایه شده در جداول ذخیره نمی شوند، بلکه در قالب آرایه های منطقی مرتب شده اند. هیچ مدل واحد ذخیره سازی داده چند بعدی شناخته شده جهانی وجود ندارد. MDD روش استانداردی برای دسترسی به داده ها ندارد و ممکن است الزامات پردازش داده های تحلیلی خاص را برآورده کند.

    با در نظر گرفتن همه موارد، مقایسه بین محصولات مختلف MDD فقط در کلی ترین دسته ها قابل انجام است. در پایین ترین سطح بازار، تنها بیننده های LAN تک کاربره و کوچک برای داده های چند بعدی وجود دارد. اگرچه عملکرد نسبتاً بالایی دارند و استفاده از آنها آسان است، اما دامنه این سیستم ها محدود است. و فاقد ابزارهای مورد نیاز برای پیاده سازی OLAP - پردازش در وسیع ترین مفهوم هستند. محصولاتی که در این دسته قرار می گیرند عبارتند از PowerPlay Cognos، Andyne's PaBlo و Business Objects Mercury. بخش گران قیمت بازار توسط Acumate ES از Kenan Technologies، Express از Oracle، Gentium از Planning Sciences و Holos از سیستم های جامع ارائه می شود. آنها به قدری در توانایی های خود تفاوت دارند که هر یک از آنها را می توان با خیال راحت به یک دسته جداگانه تقسیم کرد. در نهایت، سیستم‌های MDD خالص: Arbor Software's Essbase، Pilot Software's LightShip Server، و Sinper's TM/1 [N. رادن (بازار نرم افزار)].

    دسته دوم ابزارهای OLAP - سیستم های OLAP رابطه ای(ROLA). در اینجا از DBMS های رابطه ای قدیمی برای ذخیره داده ها استفاده می شود و یک لایه ابرداده تعریف شده توسط مدیر سیستم بین پایگاه داده و رابط مشتری سازماندهی می شود. از طریق این لایه میانی، مؤلفه کلاینت می تواند با یک پایگاه داده رابطه ای مانند یک پایگاه داده چند بعدی تعامل داشته باشد. مانند ابزارهای درجه یک، سیستم‌های ROLAP برای کار با انبارهای اطلاعاتی بزرگ به خوبی سازگار هستند، نیاز به هزینه‌های نگهداری قابل توجهی توسط متخصصان بخش اطلاعات دارند و عملیات چند کاربره را فراهم می‌کنند. محصولات این نوع عبارتند از IQ/Vision توسط IQ Software Corporation، DSS/Server و DSS/Agent توسط MicroStrategy و DecisionSuite توسط Information Advantage.

    ROLAP - ابزارها توابع پشتیبانی تصمیم را در یک افزونه بر روی یک پردازنده پایگاه داده رابطه ای پیاده سازی می کنند.

    چنین محصولات نرم افزاریباید تعدادی از الزامات را برآورده کند، به ویژه:

    یک مولد قدرتمند SQL بهینه سازی شده با OLAP داشته باشید که به شما امکان می دهد از عبارات SQL SELECT چند پاسی و/یا سوالات فرعی مرتبط استفاده کنید.

    ابزارهای به اندازه کافی توسعه یافته برای پردازش غیر پیش پا افتاده داشته باشید که رتبه بندی را تضمین می کند، تحلیل مقایسه ایو محاسبه درصد در یک کلاس.

    ایجاد عبارات SQL بهینه شده برای DBMS رابطه ای هدف، از جمله پشتیبانی از برنامه های افزودنی این زبان موجود در آن.

    مکانیسم‌هایی برای توصیف مدل داده با استفاده از ابرداده فراهم کنید و استفاده از این ابرداده را برای ساخت پرس‌و‌جوها در زمان واقعی فعال کنید.

    مکانیزمی را بگنجانید که به شما امکان می دهد کیفیت ساخت جداول محوری را از نظر سرعت محاسبه، ترجیحاً با جمع آوری آمار در مورد استفاده از آنها، ارزیابی کنید.

    سوم، نسبتا نوع جدید OLAP -ابزار - ابزارهای پرس و جو و گزارش دسکتاپ، همراه با توابع OLAP یا یکپارچه با ابزارهای خارجی که چنین عملکردهایی را انجام می دهند. این سیستم‌های بسیار پیشرفته داده‌ها را از منابع اصلی استخراج می‌کنند، آن‌ها را تبدیل می‌کنند و آن‌ها را در یک پایگاه داده چند بعدی پویا قرار می‌دهند که روی رایانه شخصی کاربر نهایی اجرا می‌شود. این رویکرد، که امکان انجام بدون سرور پایگاه داده چند بعدی گران قیمت و لایه فراداده میانی پیچیده مورد نیاز برای ابزارهای ROLAP را فراهم می کند، در عین حال کارایی تجزیه و تحلیل کافی را فراهم می کند. این ابزارهای دسکتاپ برای کار با پایگاه داده های کوچک و به سادگی سازماندهی شده مناسب هستند. نیاز به نگهداری ماهرانه برای آنها کمتر از سایر سیستم های OLAP است و تقریباً با سطح محیط های پردازش پرس و جو مرسوم مطابقت دارد. از بازیگران اصلی این بخش بازار می‌توان به Brio Technology با سیستم Brio Query Enterprise، Business Objects با محصولی به همین نام و Cognos با PowerPlay اشاره کرد.

    تعداد محصولات OLAP سازگار با وب در حال حاضر در حال افزایش است.

    یک مسئله مهم تطبیق OLAP با بقیه نرم افزارها است. اگرچه فروشندگان OLAP شروع به ارائه برخی راه‌ها برای تعامل با SQL DBMS و سایر ابزارها کرده‌اند، با این حال، کاربران و تحلیلگران هشدار می‌دهند که سطح یکپارچه‌سازی متفاوت است و احتمالاً به مقدار قابل توجهی از کدنویسی، از جمله نوشتن پرس‌و‌جوهای SQL نیاز دارد. علاوه بر این، برای ادغام OLAP با بقیه نرم افزارشرکت ها هیچ استاندارد صنعتی وجود ندارد.

    راه حل این مشکل ممکن است به شرح زیر باشد. به عنوان مثال، بسیاری از شرکت‌ها پایگاه‌های داده OLAP را به‌عنوان بخش جلویی انبارهای داده خود قرار می‌دهند. با این رویکرد، مخازن هسته OLAP چند بعدی را با نمونه‌های داده تغذیه می‌کنند که کاربران می‌توانند بعداً برای اجرای سریع پرس‌و‌جوهای پیچیده به آنها دسترسی داشته باشند. هدف ایجاد یک محیط پرس و جو است که مکان داده ها را از کاربر پنهان کند. این محیط به طور خودکار پرس و جوهای پیچیده را در مقابل موتور پردازش چند بعدی اجرا می کند یا اطلاعات دقیق و پرس و جوهای ساده را در سرورهای رابطه ای جستجو می کند. برای شرکت هایی که نمی توانند این مسیر را طی کنند، شرکت های مشاوره نقش مهمی در ایجاد پیوند بین ابزارهای OLAP و سایر نرم افزارها دارند.

    سیستم های OLTPبه عنوان یک وسیله بسیار کارآمد برای تحقق پردازش عملیاتی، معلوم شد که برای کارهای پردازش تحلیلی کاربرد کمی دارد. این ناشی از موارد زیر است:

    1. با استفاده از سیستم های سنتی OLTP، می توانید یک گزارش تحلیلی و حتی پیش بینی هر پیچیدگی، اما از قبل تنظیم شده بسازید. هر گامی به کنار، هر نیاز غیرقانونی کاربر نهایی، به عنوان یک قاعده، مستلزم دانش ساختار داده و صلاحیت نسبتاً بالای برنامه نویس است.

    2. بسیاری از قابلیت های لازم برای سیستم های عملیاتی برای کارهای تحلیلی اضافی هستند و در عین حال ممکن است حوزه موضوعی را منعکس نکنند. بیشتر کارهای تحلیلی نیاز به استفاده از ابزارهای تخصصی خارجی برای تحلیل، پیش بینی و مدل سازی دارند. ساختار پایگاه داده سفت و سخت اجازه دستیابی به عملکرد قابل قبول را در مورد انتخاب ها و مرتب سازی های پیچیده نمی دهد و بنابراین، سازماندهی دروازه ها به زمان زیادی نیاز دارد.

    3. بر خلاف سیستم های تراکنش، سیستم های تحلیلی نیازی به ابزارهای پیشرفته برای اطمینان از یکپارچگی داده ها، پشتیبان گیری و بازیابی آنها ندارند. این نه تنها خود ابزارهای پیاده سازی را ساده می کند، بلکه سربار داخلی را کاهش می دهد و بنابراین، عملکرد را هنگام بازیابی داده ها بهبود می بخشد.

    محدوده وظایفی که به طور موثر توسط هر یک از سیستم ها حل می شود، بر اساس ویژگی های مقایسه ای سیستم های OLTP و OLAP تعیین می شود (جدول 8).

    سیستم‌های OLTP و OLAP در بخش فرعی قبلی اشاره شد که برای نمایش مناسب حوزه موضوعی، سهولت توسعه و نگهداری پایگاه داده، روابط باید به شکل عادی سوم کاهش یابد (اشکال عادی سازی و سفارشات بالاتر وجود دارد، اما در عمل آنها به ندرت استفاده می شوند)، پس باید بسیار نرمال شوند. با این حال، روابط ضعیف نرمال شده نیز مزایای خود را دارند، که اصلی ترین آنها این است که اگر به پایگاه داده عمدتاً فقط با پرس و جو دسترسی داشته باشید، و اصلاحات و افزودن داده ها به ندرت انجام شود، انتخاب آنها بسیار سریعتر است. این با این واقعیت توضیح داده می شود که در روابط ضعیف نرمال شده اتصال آنها قبلاً برقرار شده است ، و زمان پردازشگر برای این کار صرف نمی شود. دو دسته از سیستم ها وجود دارد که روابط نرمال شده قوی و ضعیف برای آنها مناسب تر است. مدل های داده بسیار نرمال شده برای برنامه های OLTP - پردازش تراکنش های آنلاین (OLTP) - برنامه های پردازش تراکنش آنلاین به خوبی مناسب هستند. نمونه‌های معمولی از برنامه‌های OLTP سیستم‌های کنترل موجودی، سیستم‌های فروش بلیط، سیستم‌های بانکی عملیاتی و غیره هستند. وظیفه اصلی چنین سیستم هایی انجام تعداد زیادی تراکنش کوتاه مدت است. تراکنش ها به خودی خود بسیار ساده هستند، اما مشکلات این است که تعداد زیادی از این تراکنش ها وجود دارد، آنها به طور همزمان اجرا می شوند و در صورت بروز خطا، تراکنش باید به عقب برگردد و سیستم را به حالت قبل از شروع تراکنش برگرداند. تقریباً تمام پرس و جوهای پایگاه داده در برنامه های OLTP شامل دستورات درج، به روز رسانی و حذف هستند. درخواست های انتخاب عمدتاً برای ارائه گزیده ای از داده ها از انواع مختلف دایرکتوری ها به کاربران در نظر گرفته شده است. بنابراین، بیشتر درخواست ها از قبل در مرحله طراحی سیستم شناخته می شوند. برای برنامه‌های OLTP، سرعت و قابلیت اطمینان انجام به‌روزرسانی‌های کوتاه داده ضروری است. هرچه سطح نرمال سازی داده ها در برنامه های OLTP بالاتر باشد، سریعتر و قابل اعتمادتر است. انحراف از این قانون زمانی رخ می دهد که در حال حاضر در مرحله توسعه، برخی از پرس و جوهای متداول شناخته شده باشند که نیاز به اتصال روابط دارند و سرعت اجرای آنها به طور قابل توجهی بر عملکرد برنامه ها تأثیر می گذارد. نوع دیگری از برنامه ها برنامه های OLAP - پردازش تحلیلی آنلاین (OLAP) - برنامه های کاربردی پردازش داده های تحلیلی آنلاین هستند. این یک اصطلاح تعمیم یافته است که اصول سیستم های پشتیبانی تصمیم را مشخص می کند - سیستم پشتیبانی تصمیم (DSS)، انبارهای داده - انبار داده، سیستم های داده کاوی - داده کاوی. چنین سیستم هایی برای یافتن وابستگی بین داده ها، انجام تجزیه و تحلیل پویا بر اساس اصل "چه می شود اگر ..." و کارهای مشابه طراحی شده اند. برنامه های OLAP بر روی حجم زیادی از داده ها، انباشته شده در سازمان یا گرفته شده از منابع دیگر، کار می کنند. چنین سیستم هایی با ویژگی های زیر مشخص می شوند: * داده های جدید نسبتاً به ندرت در بلوک های بزرگ به سیستم اضافه می شود، به عنوان مثال، یک بار در ماه یا سه ماهه. * داده های اضافه شده به سیستم، به عنوان یک قاعده، هرگز حذف نمی شوند. * قبل از بارگذاری، داده ها مراحل مختلف آماده سازی مربوط به آوردن آنها به فرمت های خاص و موارد مشابه را طی می کنند. * درخواست ها به سیستم غیرقانونی و کاملاً پیچیده است. * سرعت اجرای پرس و جو مهم است، اما حیاتی نیست. پایگاه‌های داده در برنامه‌های OLAP معمولاً به‌عنوان یک یا چند ابر مکعب نشان داده می‌شوند که ابعاد آنها داده‌های مرجع هستند و سلول‌های خود هایپرمکعب مقادیر آن داده‌ها را ذخیره می‌کنند. از نظر فیزیکی، یک ابر مکعب را می توان بر اساس یک مدل داده چند بعدی خاص - OLAP چند بعدی (MOLAP) ساخته یا با استفاده از یک مدل داده رابطه ای - OLAP رابطه ای (ROLAP) نشان داد. در سیستم‌های OLAP که از مدل داده‌های رابطه‌ای استفاده می‌کنند، توصیه می‌شود که داده‌ها را به شکل روابط نرمال‌شده ضعیفی که حاوی داده‌های خلاصه اولیه از پیش محاسبه‌شده است ذخیره کنند. افزونگی داده ها و مشکلات مربوط به آن در اینجا وحشتناک نیستند، زیرا به ندرت به روز می شوند و همراه با به روز رسانی داده ها، مجموع ها دوباره محاسبه می شوند. ویژگی ها و دامنه وظایفی که به طور موثر توسط هر فناوری حل شده است در جدول مقایسه ای زیر توضیح داده شده است: ویژگی های OLTPOLAP هدف سیستم ثبت، جستجوی آنلاین و پردازش تراکنش ها، تجزیه و تحلیل تنظیم شده کار با داده های تاریخی، پردازش تحلیلی، پیش بینی، مدل سازی داده های ذخیره شده عملیاتی، تفصیلی پوشش یک دوره زمانی طولانی، انباشته (چند ماه) تاریخی (سال) و پیش بینی فراوانی به روز رسانی داده ها زیاد، در «تکه های کوچک» کوچک، در «تکه های بزرگ» سطح تجمیع داده ها داده های تفصیلی عمدتاً داده های انباشته شده عملیات غالب داده ها ورود، جستجو، به روز رسانی تجزیه و تحلیل داده ها نحوه استفاده از داده ها قابل پیش بینی غیرقابل پیش بینی تعامل کاربر در سطح تراکنش در سطح کل داده های پایگاه داده نوع فعالیت عملیاتی، تاکتیکی تحلیلی، استراتژیک اولویت ها عملکرد بالا در دسترس بودن انعطاف پذیری بالا استقلال کاربر دسته بندی کاربر تعداد زیادی از کارکنان اجرایی تعداد نسبتاً کمی کارمندان اجرایی مقایسه ویژگی های OLTP در مقابل Quo OLAPOLAP تراکنش های ساده تراکنش های پیچیده داده های ذخیره شده عملیاتی، دانه ای، بلندمدت، تجمیع شده نوع فعالیت تحلیلی، استراتژیک -GicData typeStructuredDifferenttypeSystem مشخصه سیستم حسابداری (OLTP) OLAPU تعامل در سطح تراکنش در سطح پایگاه داده در سطح گسترده پایگاه داده استفاده می شود زمانی که کاربر به اطلاعات زمانی که کاربر می تواند ثبت مجدد کند. استفاده از ماهیت StableDynamicData عمدتاً اولیه (پایین ترین سطح جزئیات) عمدتاً مشتق شده (مقادیر خلاصه) الگوهای دسترسی به پایگاه داده مسیرهای دسترسی از پیش تعریف شده یا ثابت و روابط داده مسیرهای دسترسی نامشخص یا پویا و روابط داده نوسانات داده بالا (داده ها با هر تراکنش به روز می شوند) کم (داده ها) به ندرت در طول یک پرس و جو به روز می شود) اولویت ها عملکرد بالا در دسترس بودن بالا انعطاف پذیری استقلال کاربر