پاورپوینت فيلترهاي گابور (pptx) 20 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 20 اسلاید
قسمتی از متن PowerPoint (.pptx) :
بنام خدا
عنوان ارائه :
فيلترهاي گابور
مقايسه ويژگي هاي مبتني بر فيلترهاي گابور و ارايه روشي جديد براي تعيين هويت نويسنده بر اساس دست نوشته فارسي
اغلب تحقيقات انجام شده در زمينه تعيين هويت نويسنده بر روي زبان انگليسي متمركز بوده و تاكنون مطالعاتي در زمينه متون دستنويس فارسي گزارش نشده است. بنابراين در اين مقاله روشي براي تعيين هويت نويسنده بر اساس متن دست نويس فارسي پيشنهاد شده كه به صورت برون خط و مستقل از متن انجام مي شود. بر اساس ايده مطرح شده در مطالعات قبلي، در روش پيشنهادي تصوير متن دست نويس به صورت يك بافت در نظر گرفته شده و پس از مرحله نرمال سازي، با كمك فيلترهاي گابور ويژگي هاي متن استخراج مي شود. ويژگي روش پيشنهادي استفاده از بانك فيلتري است كه با ساختار متون دستنويس فارسي و همچنين سيستم بينايي تناسب بيشتري دارد. علاوه بر اين روش جديدي جهت استخراج ويژگيها از خروجي فيلترهاي گابور پيشنهاد شده كه مبتني بر ويژگي انرژي گابور و گشتاورهاي هندسي است.
1- روشهاي برون خط (off line): در اين روشها فقط تصوير متن دستنويس در دسترس است و ويژگيها با توجه به كل تصوير يا ساختار كلمه ها و نويسه ها استخراج مي شوند. در اين روشها بسياري از اطلاعات ديناميكي كه مربوط به طرز نوشتن افراد است، از دست مي رود و اين امر كار را نسبت به روشهاي برخط مشكلتر مي سازد. روشهاي برون خط را مي توان به دو گروه كلي وابسته به متن و مستقل از متن نيز دسته بندي كرد. در روشهاي وابسته به متن، بايد متن ثابتي توسط نويسنده نوشته شود تا بتوان هويت وي را مشخص نمود اما در روشهاي مستقل از متن، با استفاده از هر نوع متني هويت نويسنده آن مشخص مي گردد.
2- روشهاي برخط (on line): در اين روشها علاوه بر ويژگيهاي برون خط از اطلاعات ديناميكي مثل فشار قلم، ترتيب نوشتن، سرعت نوشتن، فرم ضربه هاي قلم و غيره نيز استفاده مي شود. بنابراين بدليل داشتن اطلاعات بيشتر، تعيين هويت با دقت بيشتري انجام مي شود اما اين روشها كاربردهاي محدودتري را شامل مي شوند.
2- روش پيشنهادي
در اين روش از ايده مطرح شده در [8] استفاده شده و تصوير متن دست نويس بصورت يك بافت در نظر گرفته شده است. براي اين منظور ابتدا مراحل نرمال سازي بر روي تصوير متن انجام شده و سپس ويژگيهاي متن به كمك بانكي از فيلترهاي گابور استخراج مي شوند. با كمك اين ويژگيها و يك طبقه بندي كننده هويت متن دست نويس ورودي تعيين مي گردد. در ادامه به شرح هر يك از اين مراحل خواهيم پرداخت.
2-1- نرمال سازي تصوير
روشهاي تحليل بافت را نمي توان مستقيماً براي تصوير متن دست نويس به كار گرفت و ابتدا بايد تصوير را نسبت به تأثير عواملي مثل فاصله خطوط، كلمات و غيره نرمال سازي نمود تا بلوكي يكنواخت از متن دست نويس مورد نظر حاصل شود. مراحل نرمال سازي تصوير متن عبارتند از:
(الف) به منظور استخراج خطوط و كلمات موجود در متن، معمولاً از منحني نماي نيم رخ تصوير باينري استفاده مي شود [9]. در اين مقاله ما نسخه اي تغيير يافته از اين الگوريتم كه براي تصاوير سطوح خاكستري پيشنهاد شده [10]، را استفاده نموده ايم. ابتدا نماي نيم رخ افقي تصوير محاسبه شده و سپس با يك فيلتر پايين گذر گاسين هموارسازي مي شود. هموارسازي ماكزيمم هاي محلي را حذف نموده و حساسيت به نويز را كاهش مي دهد. در شكل 1 تصوير متن دستنويس، منحني نيم رخ افقي و منحني هموارسازي شده متناظر با آن را مشاهده مي كنيم. در اين منحني قله ها متناظر با فاصله بين خطوط و دره ها متناظر با مركز خطوط متن هستند كه براي يافتن قله ها يا خطوط در متن مي توان نقاط صفر در مشتق منحني را محاسبه نمود. به دليل خطي بودن كانولوشن، هموارسازي و مشتق گيري را مي توان در يك مرحله انجام داد. پس براي يافتن خطوط متن كافي است منحني نماي نيم رخ افقي را با مشتق تابع گاسين فيلتر نماييم.
(ب) هر يك از خطوط متن كه در مرحله قبل پيدا شدند، باينري شده و سپس نماي نيم رخ عمودي مربوط به آن محاسبه مي شود. با كمك اين منحني فاصله هاي بين كلمات را پيدا مي كنيم و فاصله هايي كه اندازه آنها از 5 نقطه بيشتر باشد را با مقدار 5 نقطه نرمال مي كنيم. بنابراين فاصله كلمات حداكثر 5 نقطه خواهد بود و فاصله هاي كمتر از 5 نقطه نيز بعنوان فاصله هاي بين حروف در نظر گرفته مي شوند. همچنين در صورتي كه انتهاي خط خالي باشد، با تكرار مجدد آنرا به حدي پر مي كنيم كه طول خط به اندازه مشخصي (در اين مقاله 256 نقطه) برسد. فاصله بين خطوط متن را نيز با مقدار مشخصي تنظيم مي كنيم. مرحله نرمال سازي فاصله بين كلمات، فاصله بين خطوط و پر كردن خطوط در شكل 2-الف ارايه شده است.
(ج) در صورت خالي بودن بخش انتهايي تصوير، آنرا با تكرار مجدد خطوط ابتدايي تصوير به نحوي پر مي كنيم كه طول تصوير به اندازه مشخصي (در اين مقاله 384 نقطه) برسد. در شكل 2-ب تصوير نرمال سازي شده نهايي ارايه شده است.