فصل کتاب: چگونگی تلخیص داده ها (کاهش بعد) در فرآیند داده کاوی
فصل کتاب: چگونگی تلخیص داده ها (کاهش بعد) در فرآیند داده کاوی
مهمد کانتاردزیک1 مرتضی ذاکر2
1) استاد تمام داشگاه لیوزویل آمریکا
2) دانشجوی دکتری مهندسی نرم افزار و عضو هیت علمی دانشگاه
محل انتشار :
کنگره بین المللی علوم مهندسی و توسعه شهری پایدار - کپنهاگ(dtuconf.eu)
چکیده :
گامهای پیشپردازش به عنوان آمادهسازی دادهها برای دادهکاوی در مورد مجموعههای دادهای کوچك ومتوسط، كافی میباشند. برای مجموعههای دادهای بسیار بزرگ، امکان افزودن یک گام اضافی و میانی، تلخیص دادهها، که پیش از بهکارگیری فنون دادهکاوی بایستی انجام شود وجود دارد.زمانی که مجموعةهای دادهای بزرگ قابلیت ارائه نتایج بهتر دادهكاوی را دارند، هیچ تضمینی در مورد ارائه دانش بهترتوسط اینها نسبت به مجموعههای كوچك وجود ندارد. حال در مورد دادههای چند بعدی دادهشده، سئوال اصلی این است كه آیا میتوان قبل از جستوجوی تمامی راه حلهای مسأله دادهکاوی در تمامی ابعاد، قابلیت روش مذكور را برای كاوش و كشف در یك مجموعة تلخیص شده از دادهها تعیین كرد. یك راه حل بسیار متداول از یك زیر مجموعهای از حالات یا ویژگیهای قابل دسترس استنتاج شده، در صورت بزرگ شدن فضای جستوجو، این راهحل تغییری نخواهدكرد. موضوع اصلی برای پیادهسازی دادهها در این گام, تلخیص ابعاد میباشد و سئوال اصلی این است كه آیا میتوان برخی از این دادههای آماده و پیش پردازش شده را بدون لطمه زدن به كیفیت نتیجه حذف كرد؟ یك سئوال دیگر نیز در رابطه با فنون تلخیص دادهها مطرح میباشد. آیا دادههای آماده شده را میتوان بازنگری كرد و یك زیر مجموعة مناسب از نظر زمان و فضا پیدا كرد؟ اگر پیچیدگی الگوریتم تلخیص دادهها به صورت نمایی افزایش یابد، آنگاه تلخیص ابعاد در دادههای بزرگ بسیار اندک خواهد بود. در این مقاله، فنون پایهای و نسبتاً كارا برای تلخیص بـُعد كه در مسائل مختلف دادهكاوی کاربرد دارند را معرفی میکنیم.
کلمات کلیدی :
تلخیص(کاهش) ابعادی, آنتروپی و تحلیل مولفه ها, فنونادغام, رتبهبندی ویژگی , پیش پردازش فرآیند دادهكاوی.