تشخیص متن از روی تصویر OCR در متلب

پروژه OCR در MATLAB

OCR چیست؟

OCR که کوچک شده عبارت Optical Character Reader است، تکنولوژی است که به شما این امکان را می‌دهد تا صفحات حاوی متنی که اسکن کرده‌اید را از فرمت عکس به متن تبدیل کنید. دانشجویان، مترجمان و… که مقالات و متون مختلفی را اسکن می‌کنند، به راحتی می‌توانند با تبدیل این فایل‌ها به متن از تایپ مجدد آنها رها شوند.

بعد از آنکه تصویر حاوی متن را اسکن می‌کنیم، رایانه پردازشی را بر روی تصویر انجام می‌دهد. ابتدا تصویر را به قسمت‌ها یا پارتیشن‌های مجزا تقسیم می‌کند. بعد با استفاده از الگوریتم‌های پردازش تصویر و هوش مصنوعی حروف کاراکترهایی را از درون متن استخراج می‌کند. اما ممکن است متن شما هنگام عکسبرداری چرخیده باشد. در نتیجه کامپیوتر عکس را چند درجه می‌چرخاند و باز عمل قبل را بر روی آن انجام می‌دهد و نتیجه را به دست می‌آورد. البته در اکثر موارد کار به همین راحتی که گفته می‌شود نیست و کلی عملیات پیچیده دیگر باید روی تصویر انجام بگیرد.

مزایای استفاده از تکنولوژی OCR چیست؟

پس از اینکه برای سوال تکنولوژی OCR چیست، پاسخی پیدا کردیم حالا در ادامه مزایای استفاده از این فناوری بررسی می‌شود. مهمترین مزیت استفاده از این تکنولوژی صرفه جویی در وقت، کاهش خطاها و تلاش کم است. همچنین امکاناتی را فراهم می‌کند که با کپی فیزیکی اسناد مانند فشرده سازی در فایل‌های ZIP، برجسته کردن کلمات کلیدی، ترکیب شدن در وب سایت و پیوست کردن به یک ایمیل امکان پذیر نیست. در حالی که گرفتن تصاویر از اسناد، بایگانی دیجیتالی آنها را امکان پذیر می‌سازد، این فناوری عملکرد اضافی شامل امکان ویرایش و جستجوی آن اسناد را فراهم می‌کند.

بسیاری از کسب و کارها، موسسات آموزشی و سازمان‌های دیگر از برنامه‌ها و نرم افزارهای آن برای سرعت بخشیدن به روند ورود اطلاعات خود استفاده می‌کنند. علاوه بر این، استفاده از این برنامه خطای انسانی را کاهش می‌دهد که می‌تواند هنگام ورود داده‌ها رخ دهد. با این حال، تبدیل در حالی که برنامه در حال اجراست باید با دقت کنترل شود تا کاراکترها، کلمات و جملات شناخته نشده شناسایی شوند.

با پیشرفت فناوری، این نرم افزار در چند سال گذشته بهبود یافته است. امروزه، این نرم افزار می‌تواند کاراکترها، کلمات و جملات را به راحتی تشخیص دهد و فرایند تبدیل عکس به نوشته را کاملا دقیق انجام دهد. همچنین، بیشتر نرم افزارها آن از میزان شناخت بالایی برخوردار هستند، اما اسناد حاوی تصاویر به همراه متون ممکن است هنوز به طور کامل تبدیل نشود و چالش‌هایی به همراه داشته باشد.

در قلب این سیستم‌ها سه اصل اساسی نهفته است: یکپارچگی، هدفمندی و سازگاری. اصل یکپارچگی می‌گوید که موضوع مشاهده شده همیشه باید به عنوان یک “کل” متشکل از بسیاری از بخش‌های درهم تنیده در نظر گرفته شود. اصل هدفمندی فرض می‌کند که هر گونه تفسیر از داده‌ها باید همیشه در خدمت هدف باشد. و اصل سازگاری بدان معنی است که برنامه باید توانایی یادگیری خود را داشته باشد

تصویر2

کاربرد OCR

برخی از کاربردهای نرم افزارهای نویسه خوان را در زیر شرح می دهیم:

  1. استخراج اطلاعات کلیدی از اسناد
  2. امکان جستجو و ویرایش در خروجی فایل های OCR شده
  3. فریب سامانه های آنتی ربات مثل گوگل ری کپچا
  4. کمک به نابینایان

نرم افزارهای OCR

شما می توانید از نرم افزار های زیر برای تبدیل تصاویر به فایل متنی استفاده کنید.

  1. Readiris
  2. ABBYY FineReader 14
  3. ابی فاین‌ریدر آنلاین
  4. Microsoft OneNote
  5. Free OCR

 

تصویر3

کد:

 

بخش دانلود

بخش دانلودتوضیحات

برای اطلاعات بیشتر به قسمت اول کارگاه آشنایی با متلب اولین پروژه مراجعه شود.

شامل موارد زیر:

  • کد متلب

منبع منبع
اشتراک در
اطلاع از
guest
0 دیدگاه
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها

این وبسایت جهت تقویت در خدمات، از کوکی های مرورگر شما استفاده می کند. قبول کردن

1
0
افکار شما را دوست داریم، لطفا نظر دهید.x
()
x