یک شناخت بدون آموزش در مورد حروفِ دستخطِ (خطی) فارسی / عربیِ با استفاده از عناصر ابتدایی

یک شناخت بدون آموزش در مورد حروفِ دستخطِ (خطی) فارسی / عربیِ با استفاده از عناصر ابتدایی

محمدمیثاق جواهریان1 علی برومندنیا2

1) دانشجوی کارشناسی ارشد دانشگاه ازاد
2) استادیار دانشگاه ازاد اسلامی

محل انتشار : دومین کنفرانس بین المللی مهندسی و علوم کاربردی(2iceasconf.com)
چکیده :
این مقاله با هدفِ بکارگیریِ عناصر ابتدایی برای نگاشتنِ حروف فارسی / عربی برای شناسایی حروف خطی برون خطی می باشد. برای انجام این کار، هشت عنصر ابتدایی استفاده می شود که با آنها همه ی حروف فارسی / عربی شکل گرفته اند. با متحمل شدنِ همه ی این تغییرات، حروف باریک تر شده و وارد فاز استخراج اولیه می شوند. در این مرحله از طریق بکارگیریِ حرکاتی، عناصر ابتدایی حروف استخراج شده و با ساخت بردار شناسایی حرکت (SIV) و سپس مقایسه با بردارهای شناخت شخصیت (CIV)، شناختی بدست آمده است. سپس تعداد و محل نقاط بر روی حروف و همچنین محل حروف به سمت خط پایه استخراج شد. طبقِ این روش، بر خلافِ روش شناخت معمولِ روش های دست نوشته، هیچ آموزشی مورد نیاز نیست و دو فرایند جدایی و شناخت به طور همزمان انجام شده است. این الگوریتم پایه قانون بوده و متعاقبا شناخت قانون انجام شده است. صحت و دقت این الگوریتم در شناخت رقم 98.8٪ است. همچنین شناخت در مورد کملاتِ فارسی / عربیِ جدا شده که تقریبا 50 درصدِ کلمات فرعی را در متون فارسی / عربی تشکیل می دهند 88.7 درصد برای کلماتِ فرعی دو حرفی است که حدود 32٪ از متن را تشکیل می دهند، 81.4٪ است، برای کلمه ی فرعی سه حرفی که تقریبا 12٪ از متون را تشکیل می دهد 73.6 درصد است و چهار حرفی که 5٪ متن را تشکیل می دهد، دقت 69.7٪ است.
کلمات کلیدی : OCR فارسی / عربی شناخت دست خط ابتدایی دست نوشته های مشترک.