سیستم مبتنی بر دانش براي کلاسبندي متن با استفاده از الگوریتم ID6NB

سیستم مبتنی بر دانش براي کلاسبندي متن با استفاده از الگوریتم ID6NB

محمدرضا بابایی1 آیدین ناصری فرد2 سارا سید اسماعیل صراف3

1) استادیار گروه مدیریت صنعتی، دانشگاه آزاد اسلامی واحد یادگار امام خمینی، شهر ری، تهران، ایران -
2) دانشجوی کارشناسی ارشد مدیریت فناوری اطلاعات، دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران، ایران -
3) دانشجوی کارشناسی ارشد مدیریت فناوری اطلاعات، دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران، ایران -

محل انتشار : دومین کنفرانس بین المللی پژوهش در علوم و تکنولوژی(2rstconf.com)
چکیده :
این مقاله یک الگوریتم جدید به نام ID6NB را برای توسعه درخت تصمیم ، معرفی می‌کند که شامل الگوریتم ID3 غیر افزایشی Quinlanاست. این الگوریتم راه‌حل‌هایی برای دو مشکل ذیل ارائه می‌کند: 1- وضعیتی که در آن رای گیری اکثریت تصمیم نادرست می‌دهد (یعنی ساخت دو نوع قانون متفاوت برای داده یکسان). 2- کاهش ابعاد در الگوریتم غیر افزایشی درخت تصمیم‌گیری، تخمین صفت مناسب برای یک گره جایی که دو یا چند صفت بهره اطلاعاتی یکسانی دارند. مشکل اکثریت به کمک الگوریتم Naive Bayes حل می‌شود. برای کاهش ابعاد نیز یک راه حل ارائه شده است. در نهایت، دقت طبقه بندی به شدت بهبود یافته است. آزمایش گسترده و گسترش یافته در تعدادی از مجموعه داده‌های واقعی و مصنوعی نشان می‌دهد که ID6NBیک الگوریتم دسته‌بندی state-of-the-art است که نسبت به سایر روش‌های یادگیری درخت تصمیم‌گیری، خروجی بهتری دارد.
کلمات کلیدی : داده کاوی کاهش ابعاد طبقه بندی درخت تصمیم رای اکثریت Naive Bayes