یک شناخت بدون آموزش در مورد حروفِ دستخطِ (خطی) فارسی / عربیِ با استفاده از عناصر ابتدایی
یک شناخت بدون آموزش در مورد حروفِ دستخطِ (خطی) فارسی / عربیِ با استفاده از عناصر ابتدایی
محمدمیثاق جواهریان1 علی برومندنیا2
1) دانشجوی کارشناسی ارشد دانشگاه ازاد
2) استادیار دانشگاه ازاد اسلامی
محل انتشار :
دومین کنفرانس بین المللی مهندسی و علوم کاربردی(2iceasconf.com)
چکیده :
این مقاله با هدفِ بکارگیریِ عناصر ابتدایی برای نگاشتنِ حروف فارسی / عربی برای شناسایی حروف خطی برون خطی می باشد.
برای انجام این کار، هشت عنصر ابتدایی استفاده می شود که با آنها همه ی حروف فارسی / عربی شکل گرفته اند. با متحمل شدنِ همه ی این تغییرات، حروف باریک تر شده و وارد فاز استخراج اولیه می شوند. در این مرحله از طریق بکارگیریِ حرکاتی، عناصر ابتدایی حروف استخراج شده و با ساخت بردار شناسایی حرکت (SIV) و سپس مقایسه با بردارهای شناخت شخصیت (CIV)، شناختی بدست آمده است. سپس تعداد و محل نقاط بر روی حروف و همچنین محل حروف به سمت خط پایه استخراج شد. طبقِ این روش، بر خلافِ روش شناخت معمولِ روش های دست نوشته، هیچ آموزشی مورد نیاز نیست و دو فرایند جدایی و شناخت به طور همزمان انجام شده است. این الگوریتم پایه قانون بوده و متعاقبا شناخت قانون انجام شده است. صحت و دقت این الگوریتم در شناخت رقم 98.8٪ است. همچنین شناخت در مورد کملاتِ فارسی / عربیِ جدا شده که تقریبا 50 درصدِ کلمات فرعی را در متون فارسی / عربی تشکیل می دهند 88.7 درصد برای کلماتِ فرعی دو حرفی است که حدود 32٪ از متن را تشکیل می دهند، 81.4٪ است، برای کلمه ی فرعی سه حرفی که تقریبا 12٪ از متون را تشکیل می دهد 73.6 درصد است و چهار حرفی که 5٪ متن را تشکیل می دهد، دقت 69.7٪ است.
کلمات کلیدی :
OCR فارسی / عربی
شناخت دست خط
ابتدایی
دست نوشته های مشترک.