خوشه‌بندی معنایی متن با استفاده از تخصیص پنهان دیریکله و الگوریتم جستجوی فاخته

خوشه‌بندی معنایی متن با استفاده از تخصیص پنهان دیریکله و الگوریتم جستجوی فاخته

سعید شکری1 بهروز معصومی2

1)
2)

محل انتشار : پنجمین کنفرانس بین المللی علوم و مهندسی(5icesconf.com)
چکیده :
امروزه با توجه به رشد روزافزون حجم داده‌ها از جمله متون تحت وب، پيکره‌هاي متني، مقالات و نظاير آنها، خوشه‌بندی متون اهميت زيادي پيدا کرده است. خوشه‌بندی متون، شيوه‌اي کارآمد در زمینه بازیابی اطلاعات است و دادهکاوی متون براي مدیریت و سازماندهي مطالب مورد استفاده قرار می‌گیرد. در این مقاله یک روش خوشه بندی معنایی متون بر اساس تخصیص پنهان دیریکله و الگوریتم‌ جستجوی فاخته پیشنهاد شده است. در روش پیشنهادی برای استخراج ویژگی از داده‌های متنی، از مدل تخصیص پنهان دیریکله و برای خوشه‌بندی نیز از الگوریتم‌ جستجوی فاخته استفاده شده است. همچنین برای ارزیابی و مقایسه روش پیشنهادی با سایر روش‌ها نیز از مجموعه داده Ruters-21578 استفاده و نتایج بدست آمده بیان‌گر کارآیی روش ارایه شده نسبت به دیگر روش‌هایی می‌باشد که مورد مقایسه قرار گرفته‌اند.
کلمات کلیدی : خوشه‌بندی متن تخصیص پنهان دیریکله الگوریتم جستجوی فاخته