view in publisher's site

Data Warehousing and Online Analytical Processing

Publisher SummaryThis chapter presents an overview of data warehouse and online analytical processing (OLAP) technology. This overview is essential for understanding the overall data mining and knowledge discovery process. Data warehouses generalize and consolidate data in multidimensional space. The construction of data warehouses involves data cleaning, data integration, and data transformation, and can be viewed as an important preprocessing step for data mining. Moreover, data warehouses provide OLAP tools for the interactive analysis of multidimensional data of varied granularities, which facilitates effective data generalization and data mining. Many other data mining functions, such as association, classification, prediction, and clustering, can be integrated with OLAP operations to enhance interactive mining of knowledge at multiple levels of abstraction. Hence, the data warehouse has become an increasingly important platform for data analysis and OLAP and will provide an effective platform for data mining. Therefore, data warehousing and OLAP form an essential step in the knowledge discovery process. The data cube, a multidimensional data model for data warehouses and OLAP, as well as OLAP operations such as roll-up, drilldown, slicing, and dicing are focused on. Data warehouse design and usage are also discussed followed by a discussion of Multidimensional data mining, a powerful paradigm that integrates data warehouse and OLAP technology with that of data mining. An overview of data warehouse implementation examines general strategies for efficient data cube computation, OLAP data indexing, and OLAP query processing. Finally, data generalization by attribute-oriented induction is studied. This method uses concept hierarchies to generalize data to multiple levels of abstraction.

پردازش داده و پردازش تحلیلی برخط

این فصل یک مرور کلی از انبار داده و فن‌آوری پردازش تحلیلی برخط (OLAP)را ارایه می‌دهد. این مرور کلی برای درک فرآیند اکتشاف کلی داده و فرآیند اکتشاف دانش ضروری است. انبارهای داده عمومیت دارند و داده‌ها را در فضای چندبعدی تثبیت می‌کنند. ساخت انبارهای داده شامل تمیز کردن داده‌ها، ادغام داده‌ها، و تبدیل داده، و می توان آن را به عنوان یک مرحله پیش‌پردازش مهم برای استخراج داده‌ها در نظر گرفت. علاوه بر این، انبارهای داده ابزار OLAP را برای تحلیل تعاملی داده‌های چندبعدی of مختلف فراهم می‌کنند که تعمیم داده‌های موثر و استخراج داده‌ها را تسهیل می‌کند. بسیاری از توابع داده کاوی مانند پیوستگی، طبقه‌بندی، پیش‌بینی، و خوشه‌بندی را می توان با عملیات OLAP ادغام کرد تا استخراج تعاملی دانش را در سطوح مختلف انتزاع، افزایش دهد. از این رو، انبار داده‌ها به یک پلت فرم بسیار مهم برای تحلیل داده‌ها و OLAP تبدیل شده‌است و یک پلت فرم موثر برای داده کاوی فراهم خواهد کرد. بنابراین، انبار داده‌ها و OLAP یک گام ضروری در فرآیند اکتشاف دانش محسوب می‌شوند. مکعب داده‌ها، یک مدل داده‌های چندبعدی برای انبارهای داده و OLAP، و همچنین عملیات OLAP مانند roll - up، drilldown، برش، و dicing بر روی آن متمرکز هستند. طراحی انبار داده و کاربرد نیز به دنبال بحث در مورد استخراج داده چند بعدی، یک نمونه قدرتمند که انبار داده‌ها و تکنولوژی OLAP را با استفاده از داده کاوی یکپارچه می‌کند، مورد بحث قرار گرفته‌اند. مروری بر اجرای انبار داده‌ها، استراتژی‌های عمومی برای محاسبه کارآمد مکعب داده، شاخص گذاری داده‌های OLAP و پردازش موج رادیویی را مورد بررسی قرار می‌دهد. در نهایت، تعمیم داده‌ها با استنتاج ویژگی گرا مورد مطالعه قرار می‌گیرد. این روش از سلسله‌مراتب مفهوم برای تعمیم دادن داده‌ها به چندین سطح انتزاع استفاده می‌کند.

ترجمه شده با

Download PDF سفارش ترجمه این مقاله این مقاله را خودتان با کمک ترجمه کنید
سفارش ترجمه مقاله و کتاب - شروع کنید

95/12/18 - با استفاده از افزونه دانلود فایرفاکس و کروم٬ چکیده مقالات به صورت خودکار تشخیص داده شده و دکمه دانلود فری‌پیپر در صفحه چکیده نمایش داده می شود.