استخراج قوانین کوتاه سازی جملات فارسی با سیستم Aleph ILP
استخراج قوانین کوتاه سازی جملات فارسی با سیستم Aleph ILP
زهرا کریمی1 محمدرضا ولی زاده2 علیرضا شوهانی3
1) کارشناسی ارشد مهندسی نرم افزار کامپیوتر، دانشگاه آزاد اسلامی واحد ایلام، ایران.
2) استادیار گروه مهندسی کامپیوتر، دانشگاه ایلام، ایران.
3) استادیار گروه زبان و ادبیات فارسی، دانشگاه ایلام، ایران.
محل انتشار :
سومین کنگره بین المللی مهندسی، فناوری و نوآوری(eticong.com/3rd)
چکیده :
خلاصهسازی خودکار متن یک عنوان تحقیقاتی فعال است که توجه بسیاری از محققان حوزه پردازش متن را به خود جلب نمودهاست. در این میان کوتاهسازی خودکار جملات نیز در جهت ارتقاء کیفیت خلاصهسازی خودکار متن و كاربردهاي آن مطرح شده که در بسیاری زبانهای غیرساختیافته از جمله زبان فارسی به این موضوع مهم پرداخته نشده است. ما در این مقاله روش جدیدی مطرح میکنیم که با الگو قرار دادن خلاصههای انسانی، قوانینی برای کوتاهسازی خودکار جملات فارسی استخراج میشوند. لذا در اين كار، منبعی مناسب از خلاصههای انسانی با استخراج و پردازش جملاتی از منابع متعدد خبری فراهم شد. سپس با تطابق واحدهای متنی جملات، ساختارهای متنی خاصی كه حاوي ويژگي هاي لغوي و نحوي اند، بطور خودکار انتخاب و به الگوهای یادگیری تبدیل شدند. نهایتاً از روش یادگیری رابطهای برنامهنویسی منطق استقرایی و سیستم Aleph ILP برای استنتاج قوانین استفاده شد. ارزیابیهای کمی و کیفی نتایج حاصل از اعمال قوانین تولید شده توسط این روش به جملات جدید نشان داد که این روشی مناسب در جهت کوتاهسازی خودکار جملات فارسی است. با این وجود هنوز مشکلاتی وابسته به زبان وجود دارند که نیازمند انجام کارها و تحقیقات بیشتری در آینده است.
کلمات کلیدی :
کوتاهسازی جمله
خلاصهسازی خودکار متن
پردازش زبان طبیعی
استنتاج قانون
برنامه نویسی منطق استقرایی
یادگیری ماشین