الگوریتم جدیدی برای نمره‌دهی به محتوای آنلاین پیش از انتشار

الگوریتم جدیدی برای نمره‌دهی به محتوای آنلاین پیش از انتشار

بهراد کیانی1 محمد کاظمی فرد2

1) دانشجوی کارشناسی ارشد سیستم های چند رسانه ای، دانشگاه رازی کرمانشاه، ایران -
2) هئیت علمی گروه مهندسی کامپیوتر، دانشگاه رازی کرمانشاه، ایران -

محل انتشار : چهارمین کنفرانس بین المللی پژوهش های کاربردی در علوم و مهندسی - دانشگاه وریج بروکسل(4carse.com)
چکیده :
در دو دهه اخیر حجمِ اطلاعات مختلف در بستر شبکه اینترنت رشد چشمگیری داشته است. با مطرح شدن تجارت الکترونیک، تبلیغات اینترنتی و همچنین زیاد شدن تعداد وب‌سایت‌ها، موتورهای جستجو به منظور رفع نیاز اطلاعاتی کاربران در کمترین زمان ایجاد شدند. کاربران برای یافتن اطلاعات مورد نظرشان به موتورهای جستجو رجوع کرده و تنها نخستین نتایجی که موتورهای جستجو نمایش می‌دهد را مورد بررسی قرار می‌دهند. از این رو موتورهای جستجو و قرار گرفتن صفحات در نتایج نخست برای صاحبان وبسایت‌ها حائز اهمیت شد. در این بین افرادی سعی در فریب دادن موتورهای جستجو برای قرار دادن صفحات سایت خود به صورت غیرمنصفانه در نتایج نخست داشته‌اند. این تلاشها منجر به افزایش میزان اهمیت روش‌های رتبه بندی در موتورهای جستجو گردید. تاکنون پژوهش‌های زیادی برای تشخیص صفحات مرتبط با نیاز کاربر صورت گرفته است. با این حال این حوزه پژوهش هنوز هم دارای چالش‌های زیادی می‌باشد که پژوهشگران روش‌هایی را برای مقابله با آنها ارائه می‌کنند. در این پایان‌نامه با ارائه یک الگوریتم ترکیبی مبتنی بر مدل فضای برداری، تلاش می‌شود صفحات با محتوای مناسب از سایر صفحات موجود در بستر وب، با کارایی بالا تمیز داده شود. استفاده از نتایج موتور جستجوی گوگل و محاسبه شباهت هر صفحه با صفحه‌های معیار گوگل، منجر به بهبود عملکرد روش پیشنهادی شده است. نتایج ارزیابیهای صورت گرفته و مقایسه آن با نتایج موتور جستجوی های مطرح بومی (یوز و پارسیجو) نشان دهنده کارایی بالای روش پیشنهادی می‌باشد.
کلمات کلیدی : موتور جستجو رتبه‌بندی گوگل مدل فضای برداری یوز پارسی‌جو