پاورپوینت نقش فناوری اُ. سی. آر. در کتابخانه های دیجیتالی (pptx) 22 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 22 اسلاید
قسمتی از متن PowerPoint (.pptx) :
نقش فناوری اُ. سی. آر. در کتابخانه های دیجیتالی
Optical Character Recognition
امروزه با توجه به پیشرفتهای حاصل شده در زمینه بازشناسی نوشتار، فناوری بازشناسی خودکار تحت عنوان بازشناسی نوری حروف (OCR) شکل گرفته است.
از لحاظ کاربردی، اُ. سی. آر. برنامهای است که با استفاده از روشهای گوناگون هوش مصنوعی، اسناد و مدارک، کتابها و اصولاً هر نوع ماده چاپی، تایپی و یا حتی دستنویس را به متون قابل ویرایش و یا قابل جستجو تبدیل میکند. (C. Liu & K. Nakashima, 2004)
مقدمه
در سال 1929، تاوشچ در آلمان و در سال 1933، هندلی در آمریکا ابداعاتی در زمینه سیستم
بازشناسی حروف ثبت نمودند.
از سال 1951، در آمریکا ایده اُ. سی. آر. به عنوان یک پدیده قابل پیادهسازی پذیرفته شد. از این به بعد تحقیقات گستردهای بر روی این فناوری انجام گرفته است و در نتیجه سیستمهای تجاری عرضه شده اند که دارای قابلیتهای خوبی هستند. سیستمهای تجاری عرضه شده را می توان به سه نسل زیر تقسیم بندی نمود. ( Gonzalez & Woods, 2002 )
تاریخچه سیستم های اُ. سی. آر.
1
سیستم های نسل اول:
در اوایل دهه 1960 به بازار آمدند
فقط قابلیت تشخیص کاراکترهای خاص با اندازه و فونت مشخصی را داشتند.
شاخص ترین سیستم این نسل، NCR 420 بود.(Gonzalez&Woods,2002 )
سیستم های نسل دوم:
در اواسط دهه 1960 به بازار آمدند
بعضی از کاراکترهای دست نویس مانند اعداد را تشخیص می دادند.
RETINA یکی از این سیستم ها بود.(Gonzalez&Woods,2002 )
سیستم های نسل سوم:
مربوط به اواخر دهه 1960هستند.
با هدف تشخیص کاراکترهایی با کییفیت چاپ پایین و همچنین متون دست نویس لاتین ساخته شدند.
هنگامی که یک سند متنی اسکن می شود، رایانه این متن را به صورت یک تصویر گرافیکی تشخیص می دهد. در نتیجه کاربران قادر نخواهند بود که متن موجود در تصویر سند را ویرایش کرده، مطالعه نموده و یا مورد جستجو قرار دهند. اینجاست که محتویات تصاویر قابل شناسایی شده و به صورت یک فایل در رایانه ذخیره می گردد.
معرفی باز شناسی نوری حروف
شکل 1- شمای کلی سیستم اُ. سی. آر
شکل 2
تصویر یک صفحه که کج اسکن شده است
کتابخانه دیجیتالی مجموعه ای از اطلاعات سازماندهی شده در قالب الکترونیکی است که در آن:
اطلاعات دیجیتالی باید مبتنی بر اصول مجموعه سازی، گردآوری یا تولید شده باشند.
اطلاعات دیجیتالی باید به صورت منسجم و مناسبی نظیر دیگر منابع اطلاعاتی در کتابخانه ها توسط استفاده کنندگان قابل دسترس و بازیابی باشند.
اطلاعات دیجیتالی باید در مدت زمان طولانی به مثابه منابع اطلاعاتی پایدار قابل دسترس باشند.
سیستم های اُ. سی. آر در کتابخانه های دیجیتالی
افزایش چشمگیر سرعت دسترسی به اطلاعات
کاهش فضای ذخیره سازی
امکان استفاده از قابلیتهای پیش پردازشی اطلاعات
امکان ویرایش و تغییر فرمت داده ها
عدم نیاز به مرتب سازی دستی
بهبود سرویس دهی به مراجعین
مزایای بکارگیری سیستم های اُ. سی. آر در کتابخانه های دیجیتالی