سیستم مبتنی بر دانش براي کلاسبندي متن با استفاده از الگوریتم ID6NB
سیستم مبتنی بر دانش براي کلاسبندي متن با استفاده از الگوریتم ID6NB
محمدرضا بابایی1 آیدین ناصری فرد2 سارا سید اسماعیل صراف3
1) استادیار گروه مدیریت صنعتی، دانشگاه آزاد اسلامی واحد یادگار امام خمینی، شهر ری، تهران، ایران -
2) دانشجوی کارشناسی ارشد مدیریت فناوری اطلاعات، دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران، ایران -
3) دانشجوی کارشناسی ارشد مدیریت فناوری اطلاعات، دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران، ایران -
محل انتشار :
دومین کنفرانس بین المللی پژوهش در علوم و تکنولوژی(2rstconf.com)
چکیده :
این مقاله یک الگوریتم جدید به نام ID6NB را برای توسعه درخت تصمیم ، معرفی میکند که شامل الگوریتم ID3 غیر افزایشی Quinlanاست. این الگوریتم راهحلهایی برای دو مشکل ذیل ارائه میکند: 1- وضعیتی که در آن رای گیری اکثریت تصمیم نادرست میدهد (یعنی ساخت دو نوع قانون متفاوت برای داده یکسان).
2- کاهش ابعاد در الگوریتم غیر افزایشی درخت تصمیمگیری، تخمین صفت مناسب برای یک گره جایی که دو یا چند صفت بهره اطلاعاتی یکسانی دارند. مشکل اکثریت به کمک الگوریتم Naive Bayes حل میشود. برای کاهش ابعاد نیز یک راه حل ارائه شده است. در نهایت، دقت طبقه بندی به شدت بهبود یافته است. آزمایش گسترده و گسترش یافته در تعدادی از مجموعه دادههای واقعی و مصنوعی نشان میدهد که ID6NBیک الگوریتم دستهبندی state-of-the-art است که نسبت به سایر روشهای یادگیری درخت تصمیمگیری، خروجی بهتری دارد.
کلمات کلیدی :
داده کاوی
کاهش ابعاد
طبقه بندی
درخت تصمیم
رای اکثریت
Naive Bayes