خوشه بندی معنایی متن با استفاده از الگوریتم ژنتیک و تخصیص پنهان دیریکله
خوشه بندی معنایی متن با استفاده از الگوریتم ژنتیک و تخصیص پنهان دیریکله
سعید شکری1 بهروز معصومی2
1)
2)
محل انتشار :
چهارمین کنفرانس بین المللی پژوهش در علوم و تکنولوژی(4rstconf.com)
چکیده :
امروزه با توجه به رشد روزافزون حجم دادهها از جمله متون تحت وب، پيکرههاي متني، مقالات و نظاير آنها، خوشهبندی متون اهميت زيادي پيدا کرده است. خوشهبندی متون، شيوهاي کارآمد در زمینه بازیابی اطلاعات است و داده کاوی متون براي مدیریت و سازماندهي مطالب مورد استفاده قرار میگیرد. در این مقاله یک روش خوشه بندی معنایی متون بر اساس تخصیص پنهان دیریکله و الگوریتم فراابتکاری ژنتیک پیشنهاد شده است. در روش پیشنهادی برای استخراج ویژگی از دادههای متنی، از مدل تخصیص پنهان دیریکله و برای خوشهبندی نیز از الگوریتم فراابتکاری ژنتیک استفاده شده است. همچنین برای ارزیابی و مقایسه روش پیشنهادی با سایر روشها نیز از مجموعه داده Ruters-21578 استفاده و نتایج بدست آمده بیانگر کارآیی روش ارایه شده نسبت به دیگر روشهایی میباشد که مورد مقایسه قرار گرفتهاند.
کلمات کلیدی :
خوشهبندی متن
تخصیص پنهان دیریکله
الگوریتم ژنتیک