خوشه بندی معنایی متن با استفاده از الگوریتم ژنتیک و تخصیص پنهان دیریکله

خوشه بندی معنایی متن با استفاده از الگوریتم ژنتیک و تخصیص پنهان دیریکله

سعید شکری1 بهروز معصومی2

1)
2)

محل انتشار : چهارمین کنفرانس بین المللی پژوهش در علوم و تکنولوژی(4rstconf.com)
چکیده :
امروزه با توجه به رشد روزافزون حجم داده‌ها از جمله متون تحت وب، پيکره‌هاي متني، مقالات و نظاير آنها، خوشه‌بندی متون اهميت زيادي پيدا کرده است. خوشه‌بندی متون، شيوه‌اي کارآمد در زمینه بازیابی اطلاعات است و داده کاوی متون براي مدیریت و سازماندهي مطالب مورد استفاده قرار می‌گیرد. در این مقاله یک روش خوشه بندی معنایی متون بر اساس تخصیص پنهان دیریکله و الگوریتم‌ فراابتکاری ژنتیک پیشنهاد شده است. در روش پیشنهادی برای استخراج ویژگی از داده‌های متنی، از مدل تخصیص پنهان دیریکله و برای خوشه‌بندی نیز از الگوریتم‌ فراابتکاری ژنتیک استفاده شده است. همچنین برای ارزیابی و مقایسه روش پیشنهادی با سایر روش‌ها نیز از مجموعه داده Ruters-21578 استفاده و نتایج بدست آمده بیان‌گر کارآیی روش ارایه شده نسبت به دیگر روش‌هایی می‌باشد که مورد مقایسه قرار گرفته‌اند.
کلمات کلیدی : خوشه‌بندی متن تخصیص پنهان دیریکله الگوریتم ژنتیک