OCR چیست؟
OCR که کوچک شده عبارت Optical Character Reader است، تکنولوژی است که به شما این امکان را میدهد تا صفحات حاوی متنی که اسکن کردهاید را از فرمت عکس به متن تبدیل کنید. دانشجویان، مترجمان و… که مقالات و متون مختلفی را اسکن میکنند، به راحتی میتوانند با تبدیل این فایلها به متن از تایپ مجدد آنها رها شوند.
بعد از آنکه تصویر حاوی متن را اسکن میکنیم، رایانه پردازشی را بر روی تصویر انجام میدهد. ابتدا تصویر را به قسمتها یا پارتیشنهای مجزا تقسیم میکند. بعد با استفاده از الگوریتمهای پردازش تصویر و هوش مصنوعی حروف کاراکترهایی را از درون متن استخراج میکند. اما ممکن است متن شما هنگام عکسبرداری چرخیده باشد. در نتیجه کامپیوتر عکس را چند درجه میچرخاند و باز عمل قبل را بر روی آن انجام میدهد و نتیجه را به دست میآورد. البته در اکثر موارد کار به همین راحتی که گفته میشود نیست و کلی عملیات پیچیده دیگر باید روی تصویر انجام بگیرد.
مزایای استفاده از تکنولوژی OCR چیست؟
پس از اینکه برای سوال تکنولوژی OCR چیست، پاسخی پیدا کردیم حالا در ادامه مزایای استفاده از این فناوری بررسی میشود. مهمترین مزیت استفاده از این تکنولوژی صرفه جویی در وقت، کاهش خطاها و تلاش کم است. همچنین امکاناتی را فراهم میکند که با کپی فیزیکی اسناد مانند فشرده سازی در فایلهای ZIP، برجسته کردن کلمات کلیدی، ترکیب شدن در وب سایت و پیوست کردن به یک ایمیل امکان پذیر نیست. در حالی که گرفتن تصاویر از اسناد، بایگانی دیجیتالی آنها را امکان پذیر میسازد، این فناوری عملکرد اضافی شامل امکان ویرایش و جستجوی آن اسناد را فراهم میکند.
بسیاری از کسب و کارها، موسسات آموزشی و سازمانهای دیگر از برنامهها و نرم افزارهای آن برای سرعت بخشیدن به روند ورود اطلاعات خود استفاده میکنند. علاوه بر این، استفاده از این برنامه خطای انسانی را کاهش میدهد که میتواند هنگام ورود دادهها رخ دهد. با این حال، تبدیل در حالی که برنامه در حال اجراست باید با دقت کنترل شود تا کاراکترها، کلمات و جملات شناخته نشده شناسایی شوند.
با پیشرفت فناوری، این نرم افزار در چند سال گذشته بهبود یافته است. امروزه، این نرم افزار میتواند کاراکترها، کلمات و جملات را به راحتی تشخیص دهد و فرایند تبدیل عکس به نوشته را کاملا دقیق انجام دهد. همچنین، بیشتر نرم افزارها آن از میزان شناخت بالایی برخوردار هستند، اما اسناد حاوی تصاویر به همراه متون ممکن است هنوز به طور کامل تبدیل نشود و چالشهایی به همراه داشته باشد.
در قلب این سیستمها سه اصل اساسی نهفته است: یکپارچگی، هدفمندی و سازگاری. اصل یکپارچگی میگوید که موضوع مشاهده شده همیشه باید به عنوان یک “کل” متشکل از بسیاری از بخشهای درهم تنیده در نظر گرفته شود. اصل هدفمندی فرض میکند که هر گونه تفسیر از دادهها باید همیشه در خدمت هدف باشد. و اصل سازگاری بدان معنی است که برنامه باید توانایی یادگیری خود را داشته باشد
کاربرد OCR
برخی از کاربردهای نرم افزارهای نویسه خوان را در زیر شرح می دهیم:
- استخراج اطلاعات کلیدی از اسناد
- امکان جستجو و ویرایش در خروجی فایل های OCR شده
- فریب سامانه های آنتی ربات مثل گوگل ری کپچا
- کمک به نابینایان
نرم افزارهای OCR
شما می توانید از نرم افزار های زیر برای تبدیل تصاویر به فایل متنی استفاده کنید.
- Readiris
- ABBYY FineReader 14
- ابی فاینریدر آنلاین
- Microsoft OneNote
- Free OCR
کد:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
clc; % Clear command window. clear; % Delete all variables. close all; % Close all figure windows except those created by imtool. [folder,baseFileName,indx] = uigetfile('*.png'); fullFileName = fullfile( baseFileName,folder); rgbImage = imread(fullFileName); txt = ocr(rgbImage) ans=txt.Text fid = fopen('text.txt','wt'); % fprintf(fid, ans); fprintf(fid,' %s">%s</a>\n',ans); fclose(fid); winopen('text.txt') imshow(rgbImage); |
بخش دانلود
برای اطلاعات بیشتر به قسمت اول کارگاه آشنایی با متلب اولین پروژه مراجعه شود.
شامل موارد زیر:
- کد متلب