استخراج قوانین کوتاه سازی جملات فارسی با سیستم Aleph ILP

استخراج قوانین کوتاه سازی جملات فارسی با سیستم Aleph ILP

زهرا کریمی1 محمدرضا ولی زاده2 علیرضا شوهانی3

1) کارشناسی ارشد مهندسی نرم افزار کامپیوتر، دانشگاه آزاد اسلامی واحد ایلام، ایران.
2) استادیار گروه مهندسی کامپیوتر، دانشگاه ایلام، ایران.
3) استادیار گروه زبان و ادبیات فارسی، دانشگاه ایلام، ایران.

محل انتشار : سومین کنگره بین المللی مهندسی، فناوری و نوآوری(eticong.com/3rd)
چکیده :
خلاصه‌سازی خودکار متن یک عنوان تحقیقاتی فعال است که توجه بسیاری از محققان حوزه پردازش متن را به خود جلب نموده‌است. در این میان کوتاه‌سازی خودکار جملات نیز در جهت ارتقاء کیفیت خلاصه‌سازی خودکار متن و كاربردهاي آن مطرح شده که در بسیاری زبان‌های غیرساخت‌یافته از جمله زبان فارسی به این موضوع مهم پرداخته نشده است. ما در این مقاله روش جدیدی مطرح می‌کنیم که با الگو قرار دادن خلاصههای انسانی، قوانینی برای کوتاه‌سازی خودکار جملات فارسی استخراج می‌شوند. لذا در اين كار، منبعی مناسب از خلاصه‌های انسانی با استخراج و پردازش جملاتی از منابع متعدد خبری فراهم شد. سپس با تطابق واحد‌های متنی جملات، ساختارهای متنی خاصی كه حاوي ويژگي هاي لغوي و نحوي اند، بطور خودکار انتخاب و به الگوهای یادگیری تبدیل شدند. نهایتاً از روش یادگیری رابطه‌ای برنامه‌نویسی منطق استقرایی و سیستم Aleph ILP برای استنتاج قوانین استفاده شد. ارزیابی‌های کمی و کیفی نتایج حاصل از اعمال قوانین تولید شده توسط این روش به جملات جدید نشان داد که این روشی مناسب در جهت کوتاه‌سازی خودکار جملات فارسی است. با این وجود هنوز مشکلاتی وابسته به زبان وجود دارند که نیازمند انجام کارها و تحقیقات بیشتری در آینده است.
کلمات کلیدی : کوتاه‌سازی جمله‌ خلاصه‌سازی خودکار متن پردازش زبان طبیعی استنتاج قانون برنامه نویسی منطق استقرایی یادگیری ماشین