ارائهی یک سامانه پرسش و پاسخ برای متون فارسی
ارائهی یک سامانه پرسش و پاسخ برای متون فارسی
محمد ابراهیم شناسا1 بهروز مینایی بیدگلی2
1) دانشجوی دکتری مهندسی کامپیوتر گرایش نرم افزار، دانشگاه آزاد اسلامی واحد علوم و تحقیقات، ایران -
2) دانشیار دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، ایران -
محل انتشار :
چهارمین کنگره بین المللی مهندسی، تکنولوژی و علوم کاربردی - نیوزلند(etas2019.com)
چکیده :
امروزه با رشد اطلاعات، کاربران نیازمند آن هستند که پاسخ پرسش مورد نظر خود را از میان تعداد بی شماری متون بیابند. حوزه سامانههای پرسش و پاسخ تلفیقی از حوزههای پردازش زبان طبیعی و بازیابی اطلاعات محسوب میشوند. این سامانهها پرسش را به یک زبان طبیعی (مثلاً فارسی) دریافت کرده و جواب کوتاه و دقیق را در اختیار کاربر قرار میدهند.
یکی از مشکلاتی که در عموم سامانههای پرسش و پاسخ به چشم میخورد آن است که به واژههای مطرح شده توسط کاربر بسیار حساس هستند، بطوری که اگر کاربر سوال مورد نظر خود را با کمی تغییر در واژهها و نوشتن معادل معنایی آنها بیان کند، این سامانهها نمیتوانند پاسخ مورد نظر را بیابند.
در این مقاله یک سامانه دامنه نامحدود پرسش و پاسخ ارائه میشود که با بکارگیری یک هستانشناسی معنایی (وردنت فارسی) به دنبال معادل معنایی سوالات مطرح شده رفته و به این ترتیب دامنه پاسخهای دیده نشده توسط سامانههای معمول بازیابی اطلاعات را تا حد قابل توجهی افزایش میدهد. سامانه ارائه شده بر روی حدود 300 پرسش از مجموعه مستندات دانشنامه ویکی پدیا آزمایش شده و نتایج آن با سامانه ساده بازیابی مقایسه گردید. نتایج گویای آن است که سامانه ارائه شده پیشرفت قابل توجهی بر روی معیار فراخوانی داشته است و در عین حال دقت هر دو سامانه تقریبا بدون تغییر باقی مانده است.
کلمات کلیدی :
پردازش زبان طبیعی
بازیابی اطلاعات
متن کاوی
سامانههای پرسش و پاسخ