ارائه‌ی یک سامانه پرسش و پاسخ برای متون فارسی

محمد ابراهیم شناسا1 بهروز مینایی بیدگلی2

1) دانشجوی دکتری مهندسی کامپیوتر گرایش نرم افزار، دانشگاه آزاد اسلامی واحد علوم و تحقیقات، ایران -
2) دانشیار دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، ایران -

محل انتشار : چهارمین کنگره بین المللی مهندسی، تکنولوژی و علوم کاربردی - نیوزلند(etas2019.com)
چکیده :
امروزه با رشد اطلاعات، کاربران نیازمند آن هستند که پاسخ پرسش مورد نظر خود را از میان تعداد بی شماری متون بیابند. حوزه سامانه‌های پرسش و پاسخ تلفیقی از حوزه‌های پردازش زبان طبیعی و بازیابی اطلاعات محسوب می‌شوند. این سامانه‌ها پرسش را به یک زبان طبیعی (مثلاً فارسی) دریافت کرده و جواب کوتاه و دقیق را در اختیار کاربر قرار می‌دهند. یکی از مشکلاتی که در عموم سامانه‌های پرسش و پاسخ به چشم می‌خورد آن است که به واژه‌های مطرح شده توسط کاربر بسیار حساس هستند، بطوری که اگر کاربر سوال مورد نظر خود را با کمی تغییر در واژه‌ها و نوشتن معادل معنایی آنها بیان کند، این سامانه‌ها نمی‌توانند پاسخ مورد نظر را بیابند. در این مقاله یک سامانه دامنه نامحدود پرسش و پاسخ ارائه می‌شود که با بکارگیری یک هستان‌شناسی معنایی (وردنت فارسی) به دنبال معادل معنایی سوالات مطرح شده رفته و به این ترتیب دامنه پاسخ‌های دیده نشده توسط سامانه‌های معمول بازیابی اطلاعات را تا حد قابل توجهی افزایش می‌دهد. سامانه ارائه شده بر روی حدود 300 پرسش از مجموعه مستندات دانشنامه ویکی پدیا آزمایش شده و نتایج آن با سامانه ساده بازیابی مقایسه گردید. نتایج گویای آن است که سامانه ارائه شده پیشرفت قابل توجهی بر روی معیار فراخوانی داشته است و در عین حال دقت هر دو سامانه تقریبا بدون تغییر باقی مانده است.
کلمات کلیدی : پردازش زبان طبیعی بازیابی اطلاعات متن کاوی سامانه‌های پرسش و پاسخ