طبقه بندی دست نوشته فارسی با استفاده ازروش مبتنی برترکیب طبقه بندهای SVM و KNN

طبقه بندی دست نوشته فارسی با استفاده ازروش مبتنی برترکیب طبقه بندهای SVM و KNN

سمیه اسماعیلی راد1 امیر رجبی بهجت2 محمد علی باقری3

1) دانشجوی کارشناسی ارشد کامپیوتر گرایش هوش مصنوعی، دانشگاه آزاد اسلامی واحد
2) استاد یار دانشگاه آزاد اسلامی واحد رفسنجان،ایران
3) دانشجوی کارشناسی ارشد کامپیوتر گرایش هوش مصنوعی، دانشگاه آزاد اسلامی واحد

محل انتشار : کنفرانس بین المللی پژوهش در مهندسی، علوم و تکنولوژِی(restconf.com)
چکیده :
طبقه بندی در زمره روشهاي يادگيري ماشين مبتني بر محتوا قرار مي گيرد. طبقه بند معمولا در یک فرآیند یادگیری ساخته می شود.با توجه به افزایش چشمگیر حجم مطالب متنی ،ابزارهاو روش های خودکار برای مدیریت اسناد و مطالب متنی،مورد توجه بسیارزیادی قرار گرفته اند .از جمله این ابزارها می توان به طبقه بندی متن اشاره کرد که می تواند در این زمینه بسیار موثر باشداین ابزار کاربردهای فراوانی در سیستم های بررسی متون مانند موتورهای جستجو،سیستم های فیلترینگ،تشخیص هرزنامه ها،کتابخانه های دیجیتال و سایر سیتم های مشابه دارد.در این تحقیق بر روی پیکره همشهری برای ارزیابی متون فارسی استفاده شده است و با استفاده از ترکیب الگوریتم های SVM و KNN به طبقه بندی متون پرداخته است .اين طبقه بند را بوسيله540 متن فارسي كه ازپیکره همشهری گرفته شده بودآموزش داده و برروي70متن مشابه آزمايش كرديم.متن هابه7دسته تقسيم شده بودند كه دربين اين دسته ها،متن هاي متعلق به دسته هاي ورزشي،پزشكي وسياسي بهترازبقيه دسته بندي شدند.الگوریتم های استفاده شده براي اندازه گیری دقت ترکیب طبقه بندها دربهترين حالت براي متنهاي سیاسی به0.98رسيد.ونتايج آزمايشها برروي پیکره همشهری بااستفاده ازالگوریتم SVMو KNNنشان دادكه ترکیب الگوریتم هاروشهاي انتخاب ويژگي ضمن كاهش تعداد ويژگيها،موجب افزايش کارایی و دقت سیستم ترکیب طبقه بندها می شود.
کلمات کلیدی : طبقه بندی متون الگوریتمKNN الگوریتم SVM