الگوریتم جدیدی برای نمرهدهی به محتوای آنلاین پیش از انتشار
الگوریتم جدیدی برای نمرهدهی به محتوای آنلاین پیش از انتشار
بهراد کیانی1 محمد کاظمی فرد2
1) دانشجوی کارشناسی ارشد سیستم های چند رسانه ای، دانشگاه رازی کرمانشاه، ایران -
2) هئیت علمی گروه مهندسی کامپیوتر، دانشگاه رازی کرمانشاه، ایران -
محل انتشار :
چهارمین کنفرانس بین المللی پژوهش های کاربردی در علوم و مهندسی - دانشگاه وریج بروکسل(4carse.com)
چکیده :
در دو دهه اخیر حجمِ اطلاعات مختلف در بستر شبکه اینترنت رشد چشمگیری داشته است. با مطرح شدن تجارت الکترونیک، تبلیغات اینترنتی و همچنین زیاد شدن تعداد وبسایتها، موتورهای جستجو به منظور رفع نیاز اطلاعاتی کاربران در کمترین زمان ایجاد شدند. کاربران برای یافتن اطلاعات مورد نظرشان به موتورهای جستجو رجوع کرده و تنها نخستین نتایجی که موتورهای جستجو نمایش میدهد را مورد بررسی قرار میدهند. از این رو موتورهای جستجو و قرار گرفتن صفحات در نتایج نخست برای صاحبان وبسایتها حائز اهمیت شد. در این بین افرادی سعی در فریب دادن موتورهای جستجو برای قرار دادن صفحات سایت خود به صورت غیرمنصفانه در نتایج نخست داشتهاند. این تلاشها منجر به افزایش میزان اهمیت روشهای رتبه بندی در موتورهای جستجو گردید. تاکنون پژوهشهای زیادی برای تشخیص صفحات مرتبط با نیاز کاربر صورت گرفته است. با این حال این حوزه پژوهش هنوز هم دارای چالشهای زیادی میباشد که پژوهشگران روشهایی را برای مقابله با آنها ارائه میکنند. در این پایاننامه با ارائه یک الگوریتم ترکیبی مبتنی بر مدل فضای برداری، تلاش میشود صفحات با محتوای مناسب از سایر صفحات موجود در بستر وب، با کارایی بالا تمیز داده شود. استفاده از نتایج موتور جستجوی گوگل و محاسبه شباهت هر صفحه با صفحههای معیار گوگل، منجر به بهبود عملکرد روش پیشنهادی شده است. نتایج ارزیابیهای صورت گرفته و مقایسه آن با نتایج موتور جستجوی های مطرح بومی (یوز و پارسیجو) نشان دهنده کارایی بالای روش پیشنهادی میباشد.
کلمات کلیدی :
موتور جستجو
رتبهبندی
گوگل
مدل فضای برداری
یوز
پارسیجو