سیستم های OLAP و OLTP OLTP - پردازش داده های معاملاتی آنلاین OLAP - پردازش داده های تحلیلی آنلاین. سیستم های OLTP و OLAP
سیستم های OLTP و OLAP
در قسمت فرعی قبل اشاره شد که به منظور نمایندگی کافی موضوع، سهولت توسعه و نگهداری پایگاه داده، رابطه باید به حالت عادی سوم برسد (اشکالی از عادی سازی و سفارشات بالاتر وجود دارد، اما در عمل آنها بسیار به ندرت استفاده می شوند)، یعنی به شدت عادی شود. با این حال، روابط ضعیف نرمال شده نیز مزایای خود را دارند، که اصلی ترین آنها این است که اگر به پایگاه داده عمدتاً فقط با پرس و جو دسترسی داشته باشید، و اصلاحات و افزودن داده ها به ندرت انجام شود، انتخاب آنها بسیار سریعتر است. این با این واقعیت توضیح داده می شود که در روابط ضعیف نرمال شده اتصال آنها قبلاً برقرار شده است ، و زمان پردازشگر برای این کار صرف نمی شود. دو دسته از سیستم ها برای آنها وجود دارد بیشترمناسب روابط عادی و ضعیف.
مدل های داده به شدت نرمال شده برای برنامه های OLTP مناسب هستند - بر- خط معامله در حال پردازش (OLTP) - برنامه های کاربردی پردازش عملیاتیمعاملات نمونه های معمولی از برنامه های OLTP سیستم ها هستند حسابداری انبار، سفارش بلیط، سیستم های عامل بانکی و غیره. وظیفه اصلی چنین سیستم هایی انجام دادن است تعداد زیادیمعاملات کوتاه تراکنش ها به خودی خود بسیار ساده هستند، اما مشکلات این است که تعداد زیادی از این تراکنش ها وجود دارد، آنها به طور همزمان اجرا می شوند و در صورت بروز خطا، تراکنش باید به عقب برگردد و سیستم را به حالت قبل از شروع تراکنش برگرداند. تقریباً تمام پرس و جوهای پایگاه داده در برنامه های OLTP شامل دستورات درج، به روز رسانی و حذف هستند. درخواست های انتخاب عمدتاً برای ارائه گزیده ای از داده ها از انواع مختلف دایرکتوری ها به کاربران در نظر گرفته شده است. بنابراین، بیشتر درخواست ها از قبل در مرحله طراحی سیستم شناخته می شوند. برای برنامههای OLTP، سرعت و قابلیت اطمینان انجام بهروزرسانیهای کوتاه داده ضروری است. هرچه سطح نرمال سازی داده ها در برنامه های OLTP بالاتر باشد، سریعتر و قابل اعتمادتر است. انحراف از این قانون زمانی رخ می دهد که در حال حاضر در مرحله توسعه، برخی از پرس و جوهای متداول شناخته شده باشند که نیاز به اتصال روابط دارند و سرعت اجرای آنها به طور قابل توجهی بر عملکرد برنامه ها تأثیر می گذارد.
نوع دیگری از برنامهها، برنامههای OLAP هستند بر- خط تحلیلی در حال پردازش (OLAP) - برنامه های کاربردی پردازش داده های تحلیلی آنلاین. این یک اصطلاح تعمیم یافته است که اصول سیستم های پشتیبانی تصمیم را مشخص می کند - سیستم پشتیبانی تصمیم (DSS)، انبارهای داده - انبار داده، سیستم های داده کاوی - داده کاوی. چنین سیستم هایی برای یافتن وابستگی بین داده ها، انجام تجزیه و تحلیل پویا بر اساس اصل "چه می شود اگر ..." و کارهای مشابه طراحی شده اند. برنامه های OLAP با حجم زیادی از داده های انباشته شده در سازمان یا گرفته شده از منابع دیگر کار می کنند. چنین سیستم هایی با ویژگی های زیر مشخص می شوند:
- داده های جدید نسبتاً به ندرت در بلوک های بزرگ به سیستم اضافه می شود، به عنوان مثال، یک بار در ماه یا سه ماه. داده های اضافه شده به سیستم معمولاً هرگز حذف نمی شوند.
- قبل از بارگیری، داده ها مراحل مختلف آماده سازی مربوط به آوردن آنها به فرمت های خاص و موارد مشابه را طی می کنند. درخواست ها به سیستم غیرقانونی و نسبتاً پیچیده هستند. سرعت اجرای پرس و جو مهم است، اما حیاتی نیست.
پایگاههای داده در برنامههای OLAP معمولاً بهعنوان یک یا چند ابر مکعب نشان داده میشوند که ابعاد آنها دادههای مرجع هستند و سلولهای خود هایپرمکعب مقادیر آن دادهها را ذخیره میکنند. از نظر فیزیکی، یک ابر مکعب را می توان بر اساس یک مدل داده چند بعدی خاص ساخت - چند بعدی OLAP (MOLAP) یا با استفاده از مدل داده های رابطه ای نمایش داده می شود - رابطه ای OLAP (ROLAP).
در سیستم های OLAP که استفاده می کنند مدل رابطه ایداده ها، توصیه می شود داده ها را در قالب روابط نرمال شده ضعیف حاوی داده های خلاصه اصلی از پیش محاسبه شده ذخیره کنید. افزونگی داده ها و مشکلات مربوط به آن در اینجا وحشتناک نیستند، زیرا به ندرت به روز می شوند و همراه با به روز رسانی داده ها، مجموع ها دوباره محاسبه می شوند.
ویژگی ها و دامنه وظایفی که به طور موثر توسط هر فناوری حل شده است به شرح زیر توضیح داده شده است. جدول مقایسه:
مشخصه | OLTP | OLAP |
هدف سیستم | ثبت، جستجوی عملیاتی و پردازش معاملات، تجزیه و تحلیل تنظیم شده | کار با داده های تاریخی، پردازش تحلیلی، پیش بینی، مدل سازی |
اطلاعات ذخیره شده | عملیاتی، تفصیلی | دوره زمانی زیادی را پوشش می دهد |
نوع داده | ساختار یافته | ناهمگون |
"سن" داده ها | جاری (چند ماه) | تاریخی (سالها) و پیش بینی شده |
فرکانس به روز رسانی داده ها | بخش های زیاد و کوچک | بخش های کوچک و بزرگ |
سطح تجمیع داده ها | داده های تفصیلی | اساسا - داده های جمع آوری شده |
عملیات غالب | ورود داده ها، جستجو، به روز رسانی | تحلیل داده ها |
نحوه استفاده از داده ها | قابل پیش بینی | غیر قابل پیش بینی |
در سطح معامله | در سطح کل پایگاه داده |
|
نوع فعالیت | عملیاتی، تاکتیکی | تحلیلی، استراتژیک |
اولویت های | انعطاف پذیری |
|
تعداد زیادی کارمند اجرایی | نسبتا تعداد کمی از مدیران ارشد |
مقایسه OLTP و OLAP
مشخصه | OLTP | OLAP |
ماهیت درخواست ها | بسیاری از معاملات ساده | معاملات پیچیده |
اطلاعات ذخیره شده | عملیاتی، تفصیلی | دوره زمانی زیادی را پوشش می دهد |
نوع فعالیت | عملیاتی، تاکتیکی | تحلیلی، استراتژیک |
نوع داده | ساختار یافته | ناهمگون |
ویژگی سیستم | سیستم حسابداری (OLTP) | OLAP |
تعامل کاربر | در سطح معامله | در سطح کل پایگاه داده |
داده هایی که هنگام دسترسی کاربر به سیستم استفاده می شود | ورودی های جداگانه | ضبط گروه ها |
زمان پاسخ | ثانیه ها | چند ثانیه تا چند دقیقه |
استفاده از منابع سخت افزاری | پایدار | پویا |
ماهیت داده ها | عمدتا اولیه (بیشتر سطح پایینجزئیات) | بیشتر مشتقات (مقادیر تجمعی) |
ماهیت دسترسی به پایگاه داده | مسیرهای دسترسی از پیش تعریف شده یا ایستا و روابط داده | مسیرهای دسترسی نامشخص یا پویا و روابط داده |
تنوع داده ها | بالا (داده ها با هر تراکنش به روز می شوند) | کم (داده ها به ندرت در طول یک پرس و جو به روز می شوند) |
اولویت های | عملکرد بالا در دسترس بودن بالا | انعطاف پذیری |
سیستم های OLAP
OLAP (پردازش تحلیلی آنلاین انگلیسی، پردازش تحلیلی بلادرنگ) یک فناوری پردازش داده است که شامل تهیه خلاصه (تجمیع) اطلاعات بر اساس آرایههای داده بزرگ است که بر اساس یک اصل چند بعدی ساختار یافتهاند. پیاده سازی های فناوری OLAP جزء هستند راه حل های نرم افزاریکلاس هوش تجاری
بنیانگذار اصطلاح OLAP - Edgar Codd، در سال 1993 "12 قانون پردازش تحلیلی در زمان واقعی" را پیشنهاد کرد.
شرکت ها اغلب چندین مورد دارند سیستم های اطلاعاتی- سیستم های حسابداری انبار، سیستم های حسابداری، سیستم های ERP برای خودکارسازی افراد فرآیندهای تولید، سیستم های جمع آوری گزارش ها از دپارتمان های شرکت و همچنین فایل های زیادی که روی کامپیوتر کارمندان پراکنده شده اند.
با بسیاری از منابع اطلاعاتی متفاوت، دریافت پاسخ به سؤالات کلیدی در مورد عملیات یک شرکت و دیدن آنها اغلب بسیار دشوار است. تصویر بزرگ. و وقتی که اطلاعات لازمدر یکی از سیستم های استفاده شده یا یک فایل محلی قرار دارد، اغلب قدیمی است یا با اطلاعات به دست آمده از سیستم دیگر در تضاد است.
این مشکلبه طور موثر با کمک سیستم های اطلاعاتی و تحلیلی ساخته شده بر اساس فناوری های OLAP (نام های دیگر: سیستم OLAP، سیستم هوش تجاری، هوش تجاری) حل می شود. سیستمهای OLAP سیستمهای حسابداری موجود را ادغام میکنند و ابزارهایی را برای تجزیه و تحلیل بیدرنگ حجم زیادی از دادهها، طراحی گزارش پویا، نظارت و پیشبینی شاخصهای کلیدی کسبوکار در اختیار کاربر قرار میدهند.
مزایای سیستم های OLAP
اطلاعات نقش کلیدی در مدیریت یک شرکت دارد. به عنوان یک قاعده، حتی شرکت های کوچک از چندین سیستم اطلاعاتی برای خودکارسازی حوزه های مختلف فعالیت استفاده می کنند. به دست آوردن گزارش تحلیلی در سیستم های اطلاعاتی مبتنی بر پایگاه های داده سنتی با تعدادی محدودیت همراه است:
توسعه هر گزارش مستلزم کار یک برنامه نویس است.
گزارش ها بسیار آهسته (اغلب چندین ساعت) تولید می شوند، بنابراین عملکرد کل سیستم اطلاعاتی کند می شود.
داده های دریافتی از عناصر ساختاری مختلف شرکت یکپارچه و اغلب متناقض نیستند.
سیستم های OLAP، با توجه به ایدئولوژی ساخت خود، برای تجزیه و تحلیل مقادیر زیادی از اطلاعات طراحی شده اند و به شما امکان می دهند بر محدودیت های سیستم های اطلاعاتی سنتی غلبه کنید.
ایجاد یک سیستم OLAP در یک شرکت اجازه می دهد:
ادغام داده ها از سیستم های اطلاعاتی مختلف، ایجاد یک نسخه واحد از حقیقت
· طراحی گزارش های جدید با چند کلیک ماوس بدون مشارکت برنامه نویسان.
· تحلیل زمان واقعی داده ها برای هر دسته و شاخص های تجاری در هر سطح از جزئیات.
شاخص های کلیدی کسب و کار را پایش و پیش بینی کنید
هنگام کار با یک سیستم OLAP، همیشه می توانید به سرعت پاسخ سؤالات در حال ظهور را بیابید، تصویر بزرگ را ببینید و دائماً وضعیت کسب و کار را زیر نظر داشته باشید. در عین حال می توانید مطمئن باشید که فقط از اطلاعات به روز استفاده می کنید.
نتایج پیاده سازی سیستم OLAP
مدیریت یک چشم انداز روشن کامل از وضعیت و یک مکانیسم واحد برای حسابداری، کنترل و تجزیه و تحلیل دریافت می کند.
با خودکارسازی فرآیندهای داخلی کسب و کار و افزایش بهره وری کارکنان، نیاز به منابع انسانی کاهش می یابد.
اقدام OLAP
دلیل استفاده از OLAP برای پردازش پرس و جو سرعت است. پایگاه داده های رابطه ای موجودیت ها را در جداول جداگانه ذخیره می کنند که معمولاً به خوبی نرمال شده اند. این ساختار برای پایگاه های داده عملیاتی (سیستم های OLTP) مناسب است، اما پرس و جوهای پیچیده چند جدولی در آن نسبتاً کند هستند.
یک ساختار OLAP ایجاد شده از داده های تولید، مکعب OLAP نامیده می شود. یک مکعب از اتصال جداول با استفاده از یک طرح ستاره یا یک طرح برف ریزه ایجاد می شود. در مرکز طرح ستاره یک جدول حقایق است که حاوی حقایق کلیدی است که در حال پرس و جو هستند. جداول متعدد با ابعاد به یک جدول حقایق متصل شده اند. این جداول نشان می دهد که چگونه داده های رابطه ای انباشته شده را می توان تجزیه و تحلیل کرد. تعداد تجمعهای ممکن با تعداد روشهایی که دادههای اصلی را میتوان به صورت سلسله مراتبی نمایش داد، تعیین میشود.
به عنوان مثال، همه مشتریان را می توان بر اساس شهر یا منطقه کشور (غرب، شرق، شمال و غیره) گروه بندی کرد، بنابراین 50 شهر، 8 منطقه و 2 کشور 3 سطح از یک سلسله مراتب را با 60 عضو تشکیل می دهند. همچنین مشتریان را می توان در رابطه با محصولات گروه بندی کرد. اگر 250 محصول در 2 دسته، 3 گروه محصول و 3 بخش تولید وجود داشته باشد، تعداد دانه ها 16560 خواهد بود. هنگام اضافه کردن ابعاد به طرح، تعداد گزینه هابه سرعت به ده ها میلیون یا بیشتر می رسد.
یک مکعب OLAP حاوی دادهها و اطلاعات اولیه در مورد ابعاد (جمعها) است. مکعب به طور بالقوه حاوی تمام اطلاعاتی است که ممکن است برای پاسخ به هر سؤالی مورد نیاز باشد. با توجه به تعداد زیاد واحدها، اغلب یک محاسبه کامل فقط برای برخی از اندازه گیری ها انجام می شود، برای بقیه آن ها "در صورت تقاضا" انجام می شود.
همراه با مفهوم اصلی، سه نوع OLAP وجود دارد:
OLAP با ابعاد بسیار (Multidimensional OLAP - MOLAP);
OLAP رابطه ای (OLAP رابطه ای - ROLAP);
هیبرید OLAP (Hybrid OLAP - HOLAP).
MOLAP شکل کلاسیک OLAP است، بنابراین اغلب به سادگی به عنوان OLAP شناخته می شود. از پایگاه داده جمع بندی، یک نوع خاص از پردازشگر پایگاه داده فضایی استفاده می کند، و طرح داده های مکانی مورد نیاز را ایجاد می کند و هم داده های اساسی و هم مجموعه ها را حفظ می کند.
ROLAP مستقیماً با ذخیرهسازی رابطهای کار میکند، حقایق و جداول با ابعاد در جداول رابطهای ذخیره میشوند و جداول رابطهای اضافی برای ذخیره مجموعهها ایجاد میشوند.
HOLAP از جداول رابطه ای برای ذخیره داده های اولیه و جداول چند بعدی برای ذخیره انبوه ها استفاده می کند.
یک مورد خاص از ROLAP، ROLAP در زمان واقعی (R-ROLAP) است. برخلاف ROLAP، R-ROLAP جداول رابطهای اضافی را برای ذخیرهسازی مجموعهها ایجاد نمیکند، اما تجمیعها در زمان پرس و جو محاسبه میشوند. در این مورد، یک پرس و جو چند بعدی به سیستم OLAP به طور خودکار به یک پرس و جو SQL به داده های رابطه ای تبدیل می شود.
هر نوع ذخیره سازی دارای مزایای خاصی است، اگرچه در ارزیابی آنها اختلاف نظر وجود دارد. تولید کنندگان مختلف. MOLAP برای مجموعه دادههای کوچک مناسب است، به سرعت مجموعها را محاسبه میکند و پاسخها را برمیگرداند، اما حجم عظیمی از داده را تولید میکند. ROLAP به عنوان یک راه حل مقیاس پذیرتر رتبه بندی می شود، در حالی که از کوچکترین فضای ممکن نیز استفاده می کند. در این حالت سرعت پردازش به میزان قابل توجهی کاهش می یابد. HOLAP در وسط این دو رویکرد قرار دارد، به خوبی مقیاس می شود و پردازش آن سریع است. معماری R-ROLAP امکان تجزیه و تحلیل چند بعدی بلادرنگ داده های OLTP را فراهم می کند.
مشکل در به کارگیری OLAP در ایجاد پرس و جو، انتخاب داده های زیربنایی و طراحی یک طرح است که در نتیجه اکثر موارد محصولات مدرن OLAP با تعداد زیادی پرس و جو از پیش پیکربندی شده همراه است. مشکل دیگر در داده های اساسی است. آنها باید کامل و منسجم باشند.
پیاده سازی های OLAP
از نظر تاریخی، اولین سیستم مدیریت پایگاه داده چند بعدی که اساساً یک پیاده سازی OLAP است، سیستم Express است که در سال 1970 توسط IRI توسعه یافت (بعدها حقوق محصول توسط Oracle Corporation به دست آمد و به یک گزینه OLAP برای پایگاه داده اوراکل تبدیل شد). اصطلاح OLAP توسط ادگار کاد در انتشاراتی در Computerworld در سال 1993 معرفی شد، که در آن او 12 اصل پردازش تحلیلی را پیشنهاد کرد، مشابه 12 قانون برای پایگاه های داده رابطه ای که یک دهه قبل توسط او فرموله شده بود، به عنوان محصول مرجع که اصول پیشنهادی را برآورده می کند. ، Codd سیستم Essbase Arbor را نشان داد (در سال 1997 توسط Hyperion خریداری شد که به نوبه خود توسط Oracle در سال 2007 خریداری شد). قابل توجه است که این نشریه متعاقباً به دلیل تضاد منافع احتمالی از آرشیو Computerworld حذف شد، همانطور که کاد بعداً ارائه کرد. خدمات مشاورهبرای آربور
سایر محصولات معروف OLAP: خدمات تجزیه و تحلیل مایکروسافت (که قبلاً خدمات OLAP بخشی از سرور SQL نامیده می شد)، سرور SAS OLAP، TM1، PowerPlay، SAP BW، MicroStrategy Ingelligence Server، Mondrian، Complex Analytical PROGNOZ.
از نقطه نظر پیاده سازی، آنها به "OLAP فیزیکی" و "مجازی" (رابطه، انگلیسی رابطه ای OLAP، ROLAP) تقسیم می شوند. "فیزیکی"، به نوبه خود، بسته به اجرا به چند بعدی (انگلیسی OLAP چند بعدی، MOLAP) و ترکیبی - (انگلیسی ترکیبی OLAP، HOLAP) تقسیم می شود.
در حالت اول، برنامه ای وجود دارد که در مرحله پیش بارگذاری داده ها در OLAP از منابع، یک محاسبه مقدماتی از مجموع ها را انجام می دهد (محاسبات بر اساس چندین مقدار اولیه، به عنوان مثال، "کل برای ماه")، که سپس انجام می شود. ذخیره شده در یک پایگاه داده چند بعدی خاص که فراهم می کند استخراج سریعو ذخیره سازی اقتصادی نمونه هایی از این محصولات عبارتند از: Microsoft Analysis Services، Oracle OLAP Option، Essbase، SAS OLAP Server، TM1، PowerPlay.
OLAP هیبریدی یک ترکیب است. خود داده ها در یک پایگاه داده رابطه ای ذخیره می شوند، در حالی که مجموعه ها در یک پایگاه داده چند بعدی ذخیره می شوند.
در پیاده سازی ROLAP، تمام داده ها توسط سیستم های مدیریت پایگاه داده رابطه ای ذخیره و پردازش می شوند و ممکن است تجمیع ها اصلا وجود نداشته باشند یا در اولین درخواست در DBMS یا حافظه پنهان نرم افزار تحلیلی ایجاد شوند. نمونه هایی از این محصولات عبارتند از SAP BW، Microstrategy Intelligence Server، Mondrian.
از دیدگاه کاربر، همه گزینه ها از نظر قابلیت مشابه به نظر می رسند. OLAP بیشترین کاربرد خود را در محصولات برای برنامه ریزی مالی، انبارهای داده، راه حل های هوش تجاری.
سیستم های OLTP (سیستم های پردازش تراکنش آنلاین)
OLTP (Online Transaction Processing)، سیستم تراکنش - پردازش معاملات در زمان واقعی. روشی برای سازماندهی پایگاه داده که در آن سیستم با تراکنش های کوچک اما با جریان زیاد کار می کند و در عین حال کلاینت به حداقل زمان پاسخگویی از سیستم نیاز دارد.
اصطلاح OLTP برای سیستم ها (برنامه ها) نیز به کار می رود. سیستم های OLTP برای ورودی، ذخیره سازی ساختار یافته و پردازش اطلاعات (عملیات، اسناد) در زمان واقعی طراحی شده اند.
مشکل یکپارچگی اطمینان از صحت داده های پایگاه داده در هر زمان معین است. در موارد زیر قابل نقض است: 1. هنگام ورود و به روز رسانی، زمانی که اطلاعات نادرست ارائه می شود. 2. هنگامی که چندین کاربر به طور همزمان از داده ها استفاده می کنند. 3. در صورت خرابی APS.
حل مشکلات یکپارچگی باید از منظر برنامه ای و سازمانی مورد توجه قرار گیرد. برای نرم افزار 1. شما به تعدادی رویداد سازمانی نیاز دارید (برای پیگیری ورودی)، کاربر باید قوانین و محدودیت های ورودی را بداند. برای مشکلات 2-3 - ابزار استاندارد DBMS یا ماژول های نرم افزار خاص. DBMS - 2 محدودیت یکپارچگی اصلی: 1. محدودیت های ساختاری (تنظیم شده توسط پیوندهای عملکردی و بررسی با بررسی برابری مقادیر پایگاه داده) 2. محدودیت در مقادیر واقعی. نیاز است که مقادیر فیلد به یک محدوده خاص تعلق داشته باشد یا وابستگی بین مقادیر برخی از فیلدها باشد. (انواع داده ها و ماسک های ورودی). محدودیتها را میتوان در هر زمانی توسط DBMS تنظیم کرد، اما DBMS ممکن است محدودیت را نپذیرد (اگر بسیاری از رکوردها دیگر آن را برآورده نکنند)، اگر مطابقت وجود داشته باشد، در فرهنگ لغت نوشته شده و استفاده میشود. محدودیت ها در سطح دشواری متفاوت است:
2. محدودیت در مجموعه ویژگی های رشته. (موقعیت - نرخ تخلیه، مناطق - شهرها).
3. محدودیت در بسیاری از خطوط در همان زمان.
همه این محدودیتها آماری هستند، اما زمانی که پایگاه داده از حالتی به حالت دیگر منتقل میشود، لازم است که محدودیتهای یکپارچگی قبل از شروع همه تغییرات و بعد از پایان همه، نه هر کدام، رعایت شود. این گونه محدودیت ها معوق نامیده می شود و مفهوم معاملات در رابطه با آنها معرفی می شود. تراکنش یک عمل کامل شده در پایگاه داده از دیدگاه کاربر است. در عین حال، واحد منطقی عملکرد سیستم است. یک تراکنش برخی از عملکردهای کاربردی را پیاده سازی می کند، به عنوان مثال، انتقال پول از یک حساب به حساب دیگر در سیستم بانکی.
باید دارای 4 خاصیت باشد: 1. اتمی (تقسیم ناپذیری): به عنوان یک عملیات دسترسی به پایگاه داده انجام می شود، باید به طور کامل انجام شود یا اصلاً انجام نشود. 2. سازگاری - یکپارچگی متقابل داده ها را پس از تکمیل پردازش تراکنش تضمین می کند. 3. جداسازی (هر تراکنش می تواند داده ها را تغییر دهد که به طور موقت در حالت ناسازگار است). در عین حال، دسترسی سایر تراکنش ها به این داده ها تا پایان تراکنش ممنوع است. 4. دوام - اگر معامله موفقیت آمیز باشد، تغییرات از بین نخواهند رفت. نتیجه یک تراکنش می تواند commit (عملی برای انجام تغییرات در پایگاه داده) یا بازگشت (لغو تراکنش و برگرداندن پایگاه داده به حالت قبل از شروع آن) باشد. مکانیسم commit و rollback بر اساس استفاده از گزارش تراکنش است، جایی که حالت قبل (در چندین تکرار) و بعد از آن ذخیره می شود. برخی از لهجههای SQL شامل دستورات commit میانی (نقطه به نقطه بازگشت) هستند.
مانیتورهای پردازش تراکنش (TPM) هستند سیستم های نرم افزاری(به واسطه یا میان افزار مراجعه کنید)، حل مشکلمدیریت موثر اطلاعات و منابع محاسباتی در یک سیستم توزیع شده آنها یک محیط توسعه و مدیریت منعطف و باز را فراهم می کنند. برنامه های موبایل، بر پردازش آنلاین تراکنش های توزیع شده متمرکز شده است. در میان مهمترین ویژگی ها TPM - مقیاس پذیری، پشتیبانی از کامل بودن عملکرد و یکپارچگی برنامه، دستیابی حداکثر عملکردهنگام پردازش داده ها با شاخص های کم هزینه، حفظ یکپارچگی داده ها در یک محیط ناهمگن. TPM ها بر یک مدل مشتری-سرور سه لایه متکی هستند
بر بازار مدرنمانیتورهای تراکنش، "بازیگران" اصلی سیستم هایی مانند ACMS (DEC)، CICS (IBM)، TOP END (NCR)، TUXEDO System (Novell) هستند.
انبارهای دادهبر اساس عکس های فوری ثابت در یک دوره زمانی طولانی از پایگاه های داده عملیاتی تشکیل می شوند سیستم اطلاعاتو احتمالا متفاوت منابع خارجی. انبارهای داده از فناوری های پایگاه داده، OLAP، داده کاوی، تجسم داده ها استفاده می کنند.مشخصات اصلی انبارهای داده
- حاوی داده های تاریخی
- اطلاعات دقیق و همچنین داده های جزئی و کامل را ذخیره می کند.
- داده ها عمدتا ثابت هستند.
- روش غیرقانونی، بدون ساختار و اکتشافی پردازش داده ها؛
- شدت متوسط و کم پردازش تراکنش؛
- روش غیرقابل پیش بینی استفاده از داده ها؛
- طراحی شده برای تجزیه و تحلیل؛
- تمرکز بر حوزه های موضوعی;
- پشتیبانی از تصمیم گیری استراتژیک؛
- به تعداد نسبتاً کمی از مدیران خدمات ارائه می دهد.
اصطلاح OLAP (پردازش تحلیلی آنلاین) برای توصیف مدل ارائه داده ها و بر این اساس، فناوری پردازش آنها در انبارهای داده استفاده می شود. OLAP از یک نمای چند بعدی از داده های انبوه برای ارائه استفاده می کند دسترسی سریعبه صورت استراتژیک اطلاعات مهمبرای اهداف تجزیه و تحلیل عمیق برنامه های OLAP باید ویژگی های اساسی زیر را داشته باشند:
- چند بعدی نمایش داده ها;
- پشتیبانی از محاسبات پیچیده؛
- در نظر گرفتن صحیح عامل زمان
مزایای OLAP:
- ترویج کاراییکارکنان تولید، توسعه دهندگان برنامه های کاربردی. دسترسی به موقع به اطلاعات استراتژیک
- ارائه فرصت های کافی برای کاربران تغییرات خودبه طرحواره
- برنامه های OLAP متکی هستند انبارهای دادهو سیستم های OLTP، داده های به روز را از آنها دریافت می کنند که باعث صرفه جویی می شود کنترل یکپارچگیداده های شرکتی
- کاهش بار روی سیستم های OLTP و انبارهای داده.
OLAP و OLTP. ویژگی ها و تفاوت های اصلی
OLAP | OLTP |
---|---|
ذخیره دادهباید شامل داده های داخلی شرکت و داده های خارجی باشد | منبع اصلی اطلاعاتی که وارد پایگاه داده عملیاتی می شود، فعالیت های شرکت است و تجزیه و تحلیل داده ها مستلزم دخالت منابع خارجی اطلاعات (به عنوان مثال، گزارش های آماری) است. |
حجم پایگاه های داده های تحلیلی حداقل یک مرتبه بزرگتر از حجم پایگاه های عملیاتی است. برای تحلیل و پیش بینی قابل اعتماد در ذخیره دادهشما باید اطلاعاتی در مورد فعالیت های شرکت و وضعیت بازار برای چندین سال داشته باشید | برای پردازش عملیاتی، داده های چند ماه گذشته مورد نیاز است |
ذخیره دادهباید حاوی اطلاعات یکسان ارائه شده و توافق شده باشد که تا حد امکان به محتوای پایگاه های داده عملیاتی نزدیک باشد. برای استخراج و «پاک کردن» اطلاعات از منابع مختلف به یک جزء نیاز است. در بسیاری از شرکت های بزرگ، چندین سیستم اطلاعات عملیاتی با پایگاه داده های خاص خود به طور همزمان وجود دارد (به دلایل تاریخی). | پایگاههای اطلاعاتی عملیاتی ممکن است حاوی اطلاعات معادل معنایی باشد که در قالبهای مختلف، با نشانههای متفاوتی از زمان دریافت آن، گاهی اوقات حتی متناقض ارائه شده است. |
مجموعه پرس و جوها در برابر یک پایگاه داده تحلیلی قابل پیش بینی نیست. انبارهای دادهوجود دارد تا به درخواستهای تحلیلگر موقت پاسخ دهد. فقط میتوانید روی این واقعیت حساب کنید که درخواستها خیلی زیاد نمیشوند و بر حجم زیادی از اطلاعات تأثیر نمیگذارند. اندازه های پایگاه داده تحلیلی استفاده از پرس و جوها را با تجمیع ترغیب می کند (جمع، حداقل، حداکثر، مقدار متوسطو غیره.) | سیستم های پردازش داده برای حل مشکلات خاص طراحی شده اند. اطلاعات از پایگاه داده اغلب و در بخش های کوچک انتخاب می شوند. معمولاً مجموعه ای از پرس و جوها به پایگاه داده عملیاتی از قبل در طول طراحی شناخته شده است |
با تنوع کمی از پایگاه داده های تحلیلی (فقط هنگام بارگیری داده ها)، ترتیب آرایه ها معقول است، بیشتر روش های سریعنمایه سازی برای نمونه گیری انبوه، ذخیره سازی داده های از پیش تجمیع شده | سیستم های پردازش داده به دلیل ماهیت خود بسیار متغیر هستند، که در DBMS مورد استفاده در نظر گرفته می شود (ساختار پایگاه داده عادی، ردیف ها خارج از نظم ذخیره می شوند، درختان B برای نمایه سازی، معامله گری) |
اطلاعات پایگاههای اطلاعاتی تحلیلی برای شرکت بسیار حیاتی است که به یک سری حفاظت بزرگ نیاز است (حق دسترسی فردی به ردیفها و/یا ستونهای خاص جدول) | برای سیستم های پردازش داده، معمولاً کافی است امنیت اطلاعاتدر سطح میز |
قوانین کد برای سیستم های OLAP
در سال 1993، Codd OLAP را برای کاربران تحلیلگر منتشر کرد: چگونه باید باشد. در آن، او مفاهیم اساسی پردازش تحلیلی آنلاین را تشریح کرد و 12 قاعده را که محصولات برای ارائه پردازش تحلیلی آنلاین باید رعایت کنند، شناسایی کرد.
- نمایش چند بعدی مفهومی. یک مدل OLAP باید در هسته خود چند بعدی باشد. یک نمودار مفهومی چند بعدی یا نمایش سفارشی مدلسازی و تحلیل و همچنین محاسبات را تسهیل میکند.
- شفافیت. کاربر میتواند تمام دادههای لازم را از دستگاه OLAP دریافت کند، بدون اینکه حتی گمان کند از کجا آمدهاند. صرف نظر از اینکه محصول OLAP بخشی از ابزارهای کاربر است یا خیر، این واقعیت باید برای کاربر نامرئی باشد. اگر OLAP توسط محاسبات سرویس گیرنده-سرور ارائه می شود، در صورت امکان، این واقعیت نیز باید برای کاربر نامرئی باشد. OLAP باید در چارچوب یک معماری واقعاً باز ارائه شود و به کاربر اجازه دهد در هر کجا که باشد با استفاده از یک ابزار تحلیلی با سرور ارتباط برقرار کند. علاوه بر این، هنگامی که ابزار تحلیلی با محیط های پایگاه داده همگن و ناهمگن تعامل داشته باشد، باید شفافیت نیز حاصل شود.
- دسترسی. OLAP باید خود را ارائه دهد نمودار منطقی برای دسترسی به یک محیط پایگاه داده ناهمگن و انجام تبدیل های مناسب برای ارائه داده به کاربر. علاوه بر این، لازم است از قبل در مورد مکان و نحوه و نوع سازماندهی داده های فیزیکی واقعاً مورد استفاده قرار گیرد. یک سیستم OLAP فقط باید به دادههایی دسترسی داشته باشد که واقعاً مورد نیاز هستند و اعمال نمیشوند اصل کلی"قیف آشپزخانه" که مستلزم ورودی غیر ضروری است.
- ثابت کاراییهنگام تهیه گزارش ها کاراییگزارش دهی نباید با رشد تعداد ابعاد و اندازه پایگاه داده به میزان قابل توجهی کاهش یابد.
- معماری سرویس گیرنده-سرور. نه تنها محصول مورد نیاز است که یک محصول مشتری/سرور باشد، بلکه مؤلفه سرور نیز باید به اندازه کافی هوشمند باشد که مشتریان مختلف بتوانند با حداقل تلاش و برنامه نویسی به یکدیگر متصل شوند.
- چند بعدی بودن عمومی همه ابعاد باید برابر باشند، هر بعد باید هم در ساختار و هم در قابلیت های عملیاتی معادل باشد. درست است، اضافی قابلیت های عملیاتیبرای اندازه گیری های فردی (ظاهراً زمان دلالت دارد)، اما چنین است توابع اضافیباید به هر ابعادی داده شود. این نباید طوری باشد که اساسی باشد ساختارهای دادهفرمت های محاسباتی یا گزارش دهی بیشتر به یک بعد اختصاص داشت.
- کنترل دینامیک ماتریس های پراکنده. سیستم های OLAP باید به طور خودکار طرح فیزیکی خود را بر اساس نوع مدل، حجم داده ها و پراکندگی پایگاه داده تنظیم کنند.
- پشتیبانی چند کاربره ابزار OLAP باید این توانایی را فراهم کند اشتراک گذاری (درخواست و اضافه)، یکپارچگی و امنیت.
- عملیات متقابل نامحدود همه نوع عملیات باید برای هر اندازه گیری مجاز باشد.
- دستکاری داده های بصری دستکاری داده ها از طریق اقدامات مستقیم بر روی سلول ها در حالت مشاهده بدون استفاده از منوها و عملیات های متعدد انجام شد.
- گزینه های گزارش دهی انعطاف پذیر اندازه گیری ها باید به روشی که کاربر می خواهد در گزارش قرار گیرد.
- نامحدود
در حوزه فناوری اطلاعات، دو حوزه مکمل یکدیگر وجود دارد:
فن آوری های متمرکز بر پردازش داده های عملیاتی (معامله ای). این فناوری ها زیربنای سیستم های اطلاعات اقتصادی طراحی شده برای پردازش داده های عملیاتی هستند. چنین سیستم هایی نامیده می شوند OLTP(پردازش معاملات آنلاین) سیستم های;
فن آوری های متمرکز بر تجزیه و تحلیل داده ها و تصمیم گیری. این فناوری ها زیربنای سیستم های اطلاعات اقتصادی طراحی شده برای تجزیه و تحلیل هستند
داده های انباشته شده چنین سیستم هایی نامیده می شوند OLAP
(پردازش تحلیلی آنلاین) سیستم های.
هدف اصلی سیستم های OLAP- چند بعدی پویا
تجزیه و تحلیل داده های تاریخی و فعلی، پایدار در طول زمان، تجزیه و تحلیل
روندها، مدل سازی و پیش بینی آینده. چنین
سیستم ها، به عنوان یک قاعده، بر پردازش دلخواه متمرکز هستند،
درخواست های از پیش تنظیم شده به عنوان اصلی
ویژگی های این سیستم ها به شرح زیر است:
پشتیبانی از نمایش داده های چند بعدی، برابری همه ابعاد، استقلال عملکرد از تعداد ابعاد.
شفافیت برای کاربر ساختار، روش های ذخیره و پردازش داده ها؛
نگاشت خودکار ساختار داده های منطقی به سیستم های خارجی.
پردازش دینامیکی ماتریس های پراکنده به روشی کارآمد.
اصطلاح OLAP نسبتاً جدید است و گاهی اوقات در منابع مختلف ادبی به طور متفاوت تفسیر می شود. این اصطلاح اغلب با پشتیبانی تصمیم (DSS (سیستمهای پشتیبانی تصمیم) - سیستمهای پشتیبانی تصمیم شناخته میشود. و به عنوان مترادف اصطلاح اخیر، از Data Warehousing - انبارهای داده استفاده میکنند، به معنی مجموعهای از راهحلهای سازمانی، نرمافزار و سختافزار برای ارائه تحلیلگران. با اطلاعات مبتنی بر داده های سیستم های پردازش تراکنش سطح پایین و سایر منابع
"انبار داده ها" به شما امکان می دهد داده های انباشته شده در دوره های زمانی طولانی را پردازش کنید. این داده ها ناهمگن هستند (و لزوماً ساختاری ندارند). برای "انبار داده ها" ماهیت چند بعدی پرس و جوها ذاتی است. حجم عظیمی از داده ها، پیچیدگی ساختار داده ها و پرس و جوها نیازمند استفاده از روش های خاصی برای دسترسی به اطلاعات است.
در منابع دیگر، مفهوم سیستم پشتیبانی تصمیم (DSS) گسترده تر در نظر گرفته شده است. انبارهای داده و ابزارهای پردازش تحلیلی آنلاین می توانند به عنوان یکی از اجزای معماری DSS عمل کنند.
OLAP همیشه شامل پردازش پرس و جو تعاملی و متعاقب آن تجزیه و تحلیل چند گذری اطلاعات است که به شما امکان می دهد روندهای مختلف و نه همیشه واضح مشاهده شده در حوزه موضوعی را شناسایی کنید.
گاهی اوقات بین "OLAP به معنای محدود" تمایزی وجود دارد - اینها سیستم هایی هستند که فقط مجموعه ای از داده ها را در بخش های مختلف ارائه می دهند و "OLAP به معنای گسترده" یا به سادگی OLAP که شامل:
پشتیبانی از چندین کاربر در حال ویرایش پایگاه داده
توابع مدل سازی، از جمله مکانیسم های محاسباتی برای به دست آوردن نتایج مشتق شده، و همچنین جمع آوری و ترکیب داده ها.
پیش بینی، روند و تجزیه و تحلیل آماری.
طبیعتاً هر یک از این نوع IS به سازماندهی خاصی از داده ها و همچنین خاص نیاز دارد ابزارهای نرم افزاری، حصول اطمینان از اجرای موثر وظایف پیش رو.
OLAP - ابزارها تجزیه و تحلیل اطلاعات کسب و کار را بر روی پارامترهای مختلفی از جمله نوع محصول، موقعیت جغرافیایی خریدار، زمان معامله و فروشنده ارائه می دهند که هر کدام از آنها امکان ایجاد سلسله مراتبی از نماها را فراهم می کند. بنابراین، برای زمان، می توانید از فواصل سالانه، فصلی، ماهانه و حتی هفتگی و روزانه استفاده کنید. تفکیکهای جغرافیایی میتواند بر اساس شهرها، ایالتها، مناطق، کشورها، یا در صورت لزوم، بر اساس کل نیمکره باشد.
سیستم های OLAP را می توان به سه دسته تقسیم کرد.
پیچیده ترین و گران ترین آنها مبتنی بر فناوری های اختصاصی هستند. سرورهای پایگاه داده چند بعدی. این سیستم ها یک چرخه کامل از پردازش OLAP را فراهم می کندو علاوه بر مؤلفه سرور، رابط مشتری یکپارچه خود را نیز شامل می شود، یا برای تجزیه و تحلیل داده ها استفاده می شود برنامه های خارجیکار با صفحات گسترده محصولات این کلاس بیشتر برای استفاده در انبارهای اطلاعاتی بزرگ مناسب هستند. تعمیر و نگهداری آنها مستلزم کارکنان کاملی است که در نصب و نگهداری سیستم و تشکیل نمایش داده ها برای کاربران نهایی مشارکت دارند. معمولا این بسته ها بسیار گران هستند. نمونههایی از محصولات این کلاس عبارتند از Arbor Software's Essbase، IRI's Express (اکنون بخشی از Oracle)، Pilot Software's Lightship و غیره.
لازم به ذکر است که یکی از راه های اطمینان از پردازش سریع داده ها در حین تجزیه و تحلیل آنها، سازماندهی داده ها در قالب پایگاه های داده چند بعدی (MDD) است. اطلاعات در MDD به عنوان رکوردهای نمایه شده در جداول ذخیره نمی شوند، بلکه در قالب آرایه های منطقی مرتب شده اند. هیچ مدل واحد ذخیره سازی داده چند بعدی شناخته شده جهانی وجود ندارد. MDD روش استانداردی برای دسترسی به داده ها ندارد و ممکن است الزامات پردازش داده های تحلیلی خاص را برآورده کند.
با در نظر گرفتن همه موارد، مقایسه بین محصولات مختلف MDD فقط در کلی ترین دسته ها قابل انجام است. در پایین ترین سطح بازار، تنها بیننده های LAN تک کاربره و کوچک برای داده های چند بعدی وجود دارد. اگرچه عملکرد نسبتاً بالایی دارند و استفاده از آنها آسان است، اما دامنه این سیستم ها محدود است. و فاقد ابزارهای مورد نیاز برای پیاده سازی OLAP - پردازش در وسیع ترین مفهوم هستند. محصولاتی که در این دسته قرار می گیرند عبارتند از PowerPlay Cognos، Andyne's PaBlo و Business Objects Mercury. بخش گران قیمت بازار توسط Acumate ES از Kenan Technologies، Express از Oracle، Gentium از Planning Sciences و Holos از سیستم های جامع ارائه می شود. آنها به قدری در توانایی های خود تفاوت دارند که هر یک از آنها را می توان با خیال راحت به یک دسته جداگانه تقسیم کرد. در نهایت، سیستمهای MDD خالص: Arbor Software's Essbase، Pilot Software's LightShip Server، و Sinper's TM/1 [N. رادن (بازار نرم افزار)].
دسته دوم ابزارهای OLAP - سیستم های OLAP رابطه ای(ROLA). در اینجا از DBMS های رابطه ای قدیمی برای ذخیره داده ها استفاده می شود و یک لایه ابرداده تعریف شده توسط مدیر سیستم بین پایگاه داده و رابط مشتری سازماندهی می شود. از طریق این لایه میانی، مؤلفه کلاینت می تواند با یک پایگاه داده رابطه ای مانند یک پایگاه داده چند بعدی تعامل داشته باشد. مانند ابزارهای درجه یک، سیستمهای ROLAP برای کار با انبارهای اطلاعاتی بزرگ به خوبی سازگار هستند، نیاز به هزینههای نگهداری قابل توجهی توسط متخصصان بخش اطلاعات دارند و عملیات چند کاربره را فراهم میکنند. محصولات این نوع عبارتند از IQ/Vision توسط IQ Software Corporation، DSS/Server و DSS/Agent توسط MicroStrategy و DecisionSuite توسط Information Advantage.
ROLAP - ابزارها توابع پشتیبانی تصمیم را در یک افزونه بر روی یک پردازنده پایگاه داده رابطه ای پیاده سازی می کنند.
چنین محصولات نرم افزاریباید تعدادی از الزامات را برآورده کند، به ویژه:
یک مولد قدرتمند SQL بهینه سازی شده با OLAP داشته باشید که به شما امکان می دهد از عبارات SQL SELECT چند پاسی و/یا سوالات فرعی مرتبط استفاده کنید.
ابزارهای به اندازه کافی توسعه یافته برای پردازش غیر پیش پا افتاده داشته باشید که رتبه بندی را تضمین می کند، تحلیل مقایسه ایو محاسبه درصد در یک کلاس.
ایجاد عبارات SQL بهینه شده برای DBMS رابطه ای هدف، از جمله پشتیبانی از برنامه های افزودنی این زبان موجود در آن.
مکانیسمهایی برای توصیف مدل داده با استفاده از ابرداده فراهم کنید و استفاده از این ابرداده را برای ساخت پرسوجوها در زمان واقعی فعال کنید.
مکانیزمی را بگنجانید که به شما امکان می دهد کیفیت ساخت جداول محوری را از نظر سرعت محاسبه، ترجیحاً با جمع آوری آمار در مورد استفاده از آنها، ارزیابی کنید.
سوم، نسبتا نوع جدید OLAP -ابزار - ابزارهای پرس و جو و گزارش دسکتاپ، همراه با توابع OLAP یا یکپارچه با ابزارهای خارجی که چنین عملکردهایی را انجام می دهند. این سیستمهای بسیار پیشرفته دادهها را از منابع اصلی استخراج میکنند، آنها را تبدیل میکنند و آنها را در یک پایگاه داده چند بعدی پویا قرار میدهند که روی رایانه شخصی کاربر نهایی اجرا میشود. این رویکرد، که امکان انجام بدون سرور پایگاه داده چند بعدی گران قیمت و لایه فراداده میانی پیچیده مورد نیاز برای ابزارهای ROLAP را فراهم می کند، در عین حال کارایی تجزیه و تحلیل کافی را فراهم می کند. این ابزارهای دسکتاپ برای کار با پایگاه داده های کوچک و به سادگی سازماندهی شده مناسب هستند. نیاز به نگهداری ماهرانه برای آنها کمتر از سایر سیستم های OLAP است و تقریباً با سطح محیط های پردازش پرس و جو مرسوم مطابقت دارد. از بازیگران اصلی این بخش بازار میتوان به Brio Technology با سیستم Brio Query Enterprise، Business Objects با محصولی به همین نام و Cognos با PowerPlay اشاره کرد.
تعداد محصولات OLAP سازگار با وب در حال حاضر در حال افزایش است.
یک مسئله مهم تطبیق OLAP با بقیه نرم افزارها است. اگرچه فروشندگان OLAP شروع به ارائه برخی راهها برای تعامل با SQL DBMS و سایر ابزارها کردهاند، با این حال، کاربران و تحلیلگران هشدار میدهند که سطح یکپارچهسازی متفاوت است و احتمالاً به مقدار قابل توجهی از کدنویسی، از جمله نوشتن پرسوجوهای SQL نیاز دارد. علاوه بر این، برای ادغام OLAP با بقیه نرم افزارشرکت ها هیچ استاندارد صنعتی وجود ندارد.
راه حل این مشکل ممکن است به شرح زیر باشد. به عنوان مثال، بسیاری از شرکتها پایگاههای داده OLAP را بهعنوان بخش جلویی انبارهای داده خود قرار میدهند. با این رویکرد، مخازن هسته OLAP چند بعدی را با نمونههای داده تغذیه میکنند که کاربران میتوانند بعداً برای اجرای سریع پرسوجوهای پیچیده به آنها دسترسی داشته باشند. هدف ایجاد یک محیط پرس و جو است که مکان داده ها را از کاربر پنهان کند. این محیط به طور خودکار پرس و جوهای پیچیده را در مقابل موتور پردازش چند بعدی اجرا می کند یا اطلاعات دقیق و پرس و جوهای ساده را در سرورهای رابطه ای جستجو می کند. برای شرکت هایی که نمی توانند این مسیر را طی کنند، شرکت های مشاوره نقش مهمی در ایجاد پیوند بین ابزارهای OLAP و سایر نرم افزارها دارند.
سیستم های OLTPبه عنوان یک وسیله بسیار کارآمد برای تحقق پردازش عملیاتی، معلوم شد که برای کارهای پردازش تحلیلی کاربرد کمی دارد. این ناشی از موارد زیر است:
1. با استفاده از سیستم های سنتی OLTP، می توانید یک گزارش تحلیلی و حتی پیش بینی هر پیچیدگی، اما از قبل تنظیم شده بسازید. هر گامی به کنار، هر نیاز غیرقانونی کاربر نهایی، به عنوان یک قاعده، مستلزم دانش ساختار داده و صلاحیت نسبتاً بالای برنامه نویس است.
2. بسیاری از قابلیت های لازم برای سیستم های عملیاتی برای کارهای تحلیلی اضافی هستند و در عین حال ممکن است حوزه موضوعی را منعکس نکنند. بیشتر کارهای تحلیلی نیاز به استفاده از ابزارهای تخصصی خارجی برای تحلیل، پیش بینی و مدل سازی دارند. ساختار پایگاه داده سفت و سخت اجازه دستیابی به عملکرد قابل قبول را در مورد انتخاب ها و مرتب سازی های پیچیده نمی دهد و بنابراین، سازماندهی دروازه ها به زمان زیادی نیاز دارد.
3. بر خلاف سیستم های تراکنش، سیستم های تحلیلی نیازی به ابزارهای پیشرفته برای اطمینان از یکپارچگی داده ها، پشتیبان گیری و بازیابی آنها ندارند. این نه تنها خود ابزارهای پیاده سازی را ساده می کند، بلکه سربار داخلی را کاهش می دهد و بنابراین، عملکرد را هنگام بازیابی داده ها بهبود می بخشد.
محدوده وظایفی که به طور موثر توسط هر یک از سیستم ها حل می شود، بر اساس ویژگی های مقایسه ای سیستم های OLTP و OLAP تعیین می شود (جدول 8).
سیستمهای OLTP و OLAP در بخش فرعی قبلی اشاره شد که برای نمایش مناسب حوزه موضوعی، سهولت توسعه و نگهداری پایگاه داده، روابط باید به شکل عادی سوم کاهش یابد (اشکال عادی سازی و سفارشات بالاتر وجود دارد، اما در عمل آنها به ندرت استفاده می شوند)، پس باید بسیار نرمال شوند. با این حال، روابط ضعیف نرمال شده نیز مزایای خود را دارند، که اصلی ترین آنها این است که اگر به پایگاه داده عمدتاً فقط با پرس و جو دسترسی داشته باشید، و اصلاحات و افزودن داده ها به ندرت انجام شود، انتخاب آنها بسیار سریعتر است. این با این واقعیت توضیح داده می شود که در روابط ضعیف نرمال شده اتصال آنها قبلاً برقرار شده است ، و زمان پردازشگر برای این کار صرف نمی شود. دو دسته از سیستم ها وجود دارد که روابط نرمال شده قوی و ضعیف برای آنها مناسب تر است. مدل های داده بسیار نرمال شده برای برنامه های OLTP - پردازش تراکنش های آنلاین (OLTP) - برنامه های پردازش تراکنش آنلاین به خوبی مناسب هستند. نمونههای معمولی از برنامههای OLTP سیستمهای کنترل موجودی، سیستمهای فروش بلیط، سیستمهای بانکی عملیاتی و غیره هستند. وظیفه اصلی چنین سیستم هایی انجام تعداد زیادی تراکنش کوتاه مدت است. تراکنش ها به خودی خود بسیار ساده هستند، اما مشکلات این است که تعداد زیادی از این تراکنش ها وجود دارد، آنها به طور همزمان اجرا می شوند و در صورت بروز خطا، تراکنش باید به عقب برگردد و سیستم را به حالت قبل از شروع تراکنش برگرداند. تقریباً تمام پرس و جوهای پایگاه داده در برنامه های OLTP شامل دستورات درج، به روز رسانی و حذف هستند. درخواست های انتخاب عمدتاً برای ارائه گزیده ای از داده ها از انواع مختلف دایرکتوری ها به کاربران در نظر گرفته شده است. بنابراین، بیشتر درخواست ها از قبل در مرحله طراحی سیستم شناخته می شوند. برای برنامههای OLTP، سرعت و قابلیت اطمینان انجام بهروزرسانیهای کوتاه داده ضروری است. هرچه سطح نرمال سازی داده ها در برنامه های OLTP بالاتر باشد، سریعتر و قابل اعتمادتر است. انحراف از این قانون زمانی رخ می دهد که در حال حاضر در مرحله توسعه، برخی از پرس و جوهای متداول شناخته شده باشند که نیاز به اتصال روابط دارند و سرعت اجرای آنها به طور قابل توجهی بر عملکرد برنامه ها تأثیر می گذارد. نوع دیگری از برنامه ها برنامه های OLAP - پردازش تحلیلی آنلاین (OLAP) - برنامه های کاربردی پردازش داده های تحلیلی آنلاین هستند. این یک اصطلاح تعمیم یافته است که اصول سیستم های پشتیبانی تصمیم را مشخص می کند - سیستم پشتیبانی تصمیم (DSS)، انبارهای داده - انبار داده، سیستم های داده کاوی - داده کاوی. چنین سیستم هایی برای یافتن وابستگی بین داده ها، انجام تجزیه و تحلیل پویا بر اساس اصل "چه می شود اگر ..." و کارهای مشابه طراحی شده اند. برنامه های OLAP بر روی حجم زیادی از داده ها، انباشته شده در سازمان یا گرفته شده از منابع دیگر، کار می کنند. چنین سیستم هایی با ویژگی های زیر مشخص می شوند: * داده های جدید نسبتاً به ندرت در بلوک های بزرگ به سیستم اضافه می شود، به عنوان مثال، یک بار در ماه یا سه ماهه. * داده های اضافه شده به سیستم، به عنوان یک قاعده، هرگز حذف نمی شوند. * قبل از بارگذاری، داده ها مراحل مختلف آماده سازی مربوط به آوردن آنها به فرمت های خاص و موارد مشابه را طی می کنند. * درخواست ها به سیستم غیرقانونی و کاملاً پیچیده است. * سرعت اجرای پرس و جو مهم است، اما حیاتی نیست. پایگاههای داده در برنامههای OLAP معمولاً بهعنوان یک یا چند ابر مکعب نشان داده میشوند که ابعاد آنها دادههای مرجع هستند و سلولهای خود هایپرمکعب مقادیر آن دادهها را ذخیره میکنند. از نظر فیزیکی، یک ابر مکعب را می توان بر اساس یک مدل داده چند بعدی خاص - OLAP چند بعدی (MOLAP) ساخته یا با استفاده از یک مدل داده رابطه ای - OLAP رابطه ای (ROLAP) نشان داد. در سیستمهای OLAP که از مدل دادههای رابطهای استفاده میکنند، توصیه میشود که دادهها را به شکل روابط نرمالشده ضعیفی که حاوی دادههای خلاصه اولیه از پیش محاسبهشده است ذخیره کنند. افزونگی داده ها و مشکلات مربوط به آن در اینجا وحشتناک نیستند، زیرا به ندرت به روز می شوند و همراه با به روز رسانی داده ها، مجموع ها دوباره محاسبه می شوند. ویژگی ها و دامنه وظایفی که به طور موثر توسط هر فناوری حل شده است در جدول مقایسه ای زیر توضیح داده شده است: ویژگی های OLTPOLAP هدف سیستم ثبت، جستجوی آنلاین و پردازش تراکنش ها، تجزیه و تحلیل تنظیم شده کار با داده های تاریخی، پردازش تحلیلی، پیش بینی، مدل سازی داده های ذخیره شده عملیاتی، تفصیلی پوشش یک دوره زمانی طولانی، انباشته (چند ماه) تاریخی (سال) و پیش بینی فراوانی به روز رسانی داده ها زیاد، در «تکه های کوچک» کوچک، در «تکه های بزرگ» سطح تجمیع داده ها داده های تفصیلی عمدتاً داده های انباشته شده عملیات غالب داده ها ورود، جستجو، به روز رسانی تجزیه و تحلیل داده ها نحوه استفاده از داده ها قابل پیش بینی غیرقابل پیش بینی تعامل کاربر در سطح تراکنش در سطح کل داده های پایگاه داده نوع فعالیت عملیاتی، تاکتیکی تحلیلی، استراتژیک اولویت ها عملکرد بالا در دسترس بودن انعطاف پذیری بالا استقلال کاربر دسته بندی کاربر تعداد زیادی از کارکنان اجرایی تعداد نسبتاً کمی کارمندان اجرایی مقایسه ویژگی های OLTP در مقابل Quo OLAPOLAP تراکنش های ساده تراکنش های پیچیده داده های ذخیره شده عملیاتی، دانه ای، بلندمدت، تجمیع شده نوع فعالیت تحلیلی، استراتژیک -GicData typeStructuredDifferenttypeSystem مشخصه سیستم حسابداری (OLTP) OLAPU تعامل در سطح تراکنش در سطح پایگاه داده در سطح گسترده پایگاه داده استفاده می شود زمانی که کاربر به اطلاعات زمانی که کاربر می تواند ثبت مجدد کند. استفاده از ماهیت StableDynamicData عمدتاً اولیه (پایین ترین سطح جزئیات) عمدتاً مشتق شده (مقادیر خلاصه) الگوهای دسترسی به پایگاه داده مسیرهای دسترسی از پیش تعریف شده یا ثابت و روابط داده مسیرهای دسترسی نامشخص یا پویا و روابط داده نوسانات داده بالا (داده ها با هر تراکنش به روز می شوند) کم (داده ها) به ندرت در طول یک پرس و جو به روز می شود) اولویت ها عملکرد بالا در دسترس بودن بالا انعطاف پذیری استقلال کاربر