شناسه پست: 10844
بازدید: 439

طراحی سیستمهای مدرن اطلاعاتی بازشناسی خودکار الگوها

فهرست مطالب
فصل اول- مقدمه 3
1-1- شناسايي الگو 3
شکل1-1-نمودار بلوكي يك سيستم شناسايي الگو 4
1-2- كاربردهاي بازشناسي الگو 4
1-3- طرح پژوهش 5
فصل دوم- مروري بر سيتمهاي OCR 7
2-1-بخشهاي مختلف سيستمهاي ocr 7
2-1-1- بازشناسي نوري حروف 7
2-1-4- برخي ويژگي هاي متون چاپي فارسي از ديدگاه پردازش رايانه اي 10
شکل 2-1-4 . برخي از ويژگي هاي نگارش زبان فارسي :الف) كلمه خورشيد از سه زيركلمه تشكيل شده؛ ب) چهار شكل مختلف حرف «ع» با توجه به موقعيت آن در كلمه، ج) همپوشاني دو حرف «ح» و «ک» در کلمه «حکم»؛      د) اتصال حروف «ک» و «ا» در دو محل؛ ه)حروف متفاوت با بدنه مشابه؛ و)کشیدگی حرف«ب» در کلمه «با». 11
2-1-5-انواع سیستم های « اُسي آر » از لحاظ نوع الگوی ورودی 12
2-1-6- معرفي بخش هاي مختلف يك سيستم « اُسي آر » 13
شکل 2-1-6 نمودار بلوکی دیاگرام یک سیستم « اُسي آر » 13
كاهش نويز: 14
شکل 2-1-6-1 تصوير يك صفحه كه كج اسكن شده است 15
ب. نرماليزه كردن اريب شدگي : 16
د. هموارسازي كانتور: 16
شکل 2-1-6-2 عمليات نازك سازي بر روي يك تصوير متني نمونه 17
شکل 2-1-6-3 قطعه بندی يك كلمه به حروف 19
2-1-6-4- طبقه بندی و بازشناسی(با یک یا چند طبقه بندی کننده) 22
2-1-6-5- به کارگیری اطلاعات جانبی(پس پردازش) 22
2-2- روشهاي مختلف در حوزه بازشناسي اسناد 24
2-2-1- تبدیل سراسری(بسط سری) 24
1-1-2-2- تبدیلات فوریه(توصیف کننده های فوریه) 24
2-1-2-2- موجكها 25
شکل 2-2-1-2 27
3-1-2-2- تبديل گابور 28
شکل 3-1-2-2 29
4-1-2-2- ممانها(گشتاورها) 31
5-1-2-2 – بسط كارهونن لوئو( K-L ) 32
شکل 2-2-2 ویژگی های جهتی کانتور و ویژگی های نقاط خمش را نشان می دهد. 33
شکل 2-2-2 33
3-2-2- ويژگيهاي هندسي و توپولوژيكي 34
الف – ويژگيهاي توپولوژيكي 34
شکل 2-2-3 35
ب – ويژگيهاي هندسي 35
ج – كدگذاري 36
فصل سوم- تكنيك آناليز اجزاي اصلي 37
1-3- روشهاي كاهش ابعاد 37
3-1-1- روشهاي مبتني بر استخراج ويژگي 38
2-3 -تكنيك آناليز اجزای اصلي(PCA) 39
شکل 3-1 انتخاب محورهاي جديد براي داده هاي دو بعدي 40
1-2-3 مفاهيم مقدماتي مورد نياز در PCA 40
مفاهيم جبر ماتريسها 42
مرحله 2- كم كردن ميانگين از داده ها 43
مرحله 3- محاسبه ي ماتريس كواريانس 43
مرحله 5- انتخاب مؤلفه ها و ساختن Feature Vector 45
مرحله 6- بدست آوردن داده هاي جديد 46
شکل 3-4 داده های بدست آمده از تبدیل PCA با انتخاب مهمترین بردار ویژگی 46
شکل 3-5 داده های بازیابی شده از تبدیل PCA با انتخاب مهمترین بردار ویژگی 47
فصل چهارم- شبكه عصبي 48
1-4- شبكه عصبي چيست؟ 48
2-4- چرا از شبكه هاي عصبي استفاده مي كنيم؟ 50
3-4- شبكه عصبي MLP 51
1-3-4- قاعده فراگيري MLP 51
الگوريتم پرسپترون چند لايه اي 52
شكل4-8 توانايي پرسپترون ها را در تفكيك   فضاهاي دلخواه نشان مي دهد. 58
برخي تواناييها و ضعفهاي شبكه هاي عصبي 60
تحمل نقص 61
شکل 4-10 61
مشكلات آموزش 61
كاهش ضريب بهره 62
افزايش تعداد گره هاي داخلي 62
عبارت گشتاور 62
ساير مشكلات آموزش 63
فصل پنجم – پیاده سازی یک نرم افزار  تشخیص خودکار اعداد فارسی 64
شکل5-1-1 65
5-2- مرحله آموزش: 65
5-2-1- چند نکته در رابطه با آموزس شبکه: 65
5-4-نتایج 68
فصل ششم- مراجع 69
فصل اول- مقدمه
پيدايش علوم و فنون جديد، جوامع بشري را با شكلهاي مختلفي از اطلاعات روبرو نموده است. سطح توسعة يك جامعه را مي توان با مقدار اطلاعات و دانش توليد شده در آن ارزيابي كرد. توليد فزايندة اطلاعات به شكلهاي مختلف صورت مي گيرد و با درجات متفاوتي از پيچيدگي همراه ميباشد. در نتيجه نياز به سيستمهاي پردازش اطلاعات بصورت روزافزون افزايش مي يابد. يكي از مسائل مهم در طراحي سيستمهاي مدرن اطلاعاتي، بازشناسي خودكار الگوها است.
 1-1- شناسايي الگو
شناسايي الگو، شاخه اي از هوش مصنوعي  است كه با طبقه بندي و توصيف مشاهدات سروكار دارد.شناسايي الگو به ما كمك ميكند داده ها (الگوها) را با تكيه بر دانش قبلي يا اطلاعات آماري استخراج شده از الگوها، طبقه بندي نماييم. الگوهايي كه مي بايست طبقه بندي شوند، معمولاً گروهي از سنجش ها يامشاهدات هستند كه مجموعه نقاطي را در يك فضاي چند بعدي مناسب تعريف مي نمايند.يك سيستم شناسايي الگوي كامل متشكل است از يك حسگر  ،كه مشاهداتي را كه مي بايست توصيف يا طبقه بندي شوند جمع آوري مي نمايد، يك سازوكار براي استخراج ويژگي ها  كه اطلاعات عددي يا نمادين را از مشاهدات، محاسبه مي كند، (اين اطلاعات عددي را با يك بردار بنام بردار ويژگيها نمايش مي دهند)؛ ويك نظام طبقه بندي يا توصيف كه وظيفه اصلي طبقه بندي يا توصيف الگوها را با تكيه بر ويژگي هاي استخراج شده عهده داراست.
شکل 1-1 نمودار بلوكي يك سيستم شناسايي الگو را نشان مي دهد. همانطوري كه از پيكان هاي برگشتي مشخص است، اين بلوك ها لزوماً مستقل نيستند و بسته به نتايج حاصله گاهي لازم است كه
بلوك هاي اوليه مجدداً طراحي گردند تا راندمان كلي سيستم بهبود يابد.