التعرف البصري على الأحرف(OCR)
OCR (التعرف البصري على الأحرف) هو استخدام التكنولوجيا للتمييز بين أحرف النص المطبوعة أو المكتوبة بخط اليد داخل الصور الرقمية للمستندات المادية ، مثل المستند الورقي الممسوح ضوئيًا. تتضمن العملية الأساسية لـ OCR فحص نص المستند وترجمة الأحرف إلى رمز يمكن استخدامه لمعالجة البيانات. يشار أحيانًا إلى التعرف الضوئي على الحروف أيضًا باسم التعرف على النص.
تتكون أنظمة التعرف الضوئي على الحروف من مجموعة من الأجهزة والبرامج المستخدمة لتحويل المستندات المادية إلى نص يمكن قراءته آليًا. يتم استخدام الأجهزة ، مثل الماسح الضوئي أو لوحة الدوائر المتخصصة لنسخ أو قراءة النص بينما يتعامل البرنامج عادةً مع المعالجة المتقدمة. يمكن أن تستفيد البرامج أيضًا من الذكاء الاصطناعي (AI) لتنفيذ أساليب أكثر تقدمًا للتعرف الذكي على الأحرف (ICR) ، مثل تحديد اللغات أو أنماط الكتابة اليدوية.
يتم استخدام عملية التعرف الضوئي على الحروف بشكل شائع لتحويل المستندات القانونية أو التاريخية إلى ملفات PDF. بمجرد وضعها في هذه النسخة الإلكترونية ، يمكن للمستخدمين تحرير المستند وتنسيقه والبحث فيه كما لو تم إنشاؤه باستخدام معالج النصوص.
كيف يعمل التعرف الضوئي على الحروف
تتمثل الخطوة الأولى في OCR في استخدام ماسح ضوئي لمعالجة الشكل المادي للمستند. بمجرد نسخ جميع الصفحات ، يقوم برنامج OCR بتحويل المستند إلى إصدار ثنائي اللون أو أبيض وأسود. يتم تحليل الصورة أو الصورة النقطية الممسوحة ضوئيًا للداخل بحثًا عن المناطق الفاتحة والمظلمة ، حيث يتم تحديد المناطق المظلمة كأحرف تحتاج إلى التعرف عليها ويتم تحديد المناطق الفاتحة كخلفية.
تتم معالجة المناطق المظلمة بعد ذلك للعثور على أحرف أبجدية أو أرقام رقمية. يمكن أن تختلف برامج التعرف الضوئي على الحروف في تقنياتها ، ولكنها عادةً ما تتضمن استهداف حرف واحد أو كلمة أو كتلة نصية في المرة الواحدة. ثم يتم تحديد الأحرف باستخدام إحدى الخوارزميتين:
التعرف على الأنماط – برامج التعرف الضوئي على الحروف هي أمثلة على نصوص بخطوط وتنسيقات مختلفة تُستخدم بعد ذلك لمقارنة الأحرف في المستند الممسوح ضوئيًا والتعرف عليها.
اكتشاف الميزات- تطبق برامج التعرف الضوئي على الحروف القواعد المتعلقة بميزات حرف أو رقم معين للتعرف على الأحرف في المستند الممسوح ضوئيًا. يمكن أن تتضمن الميزات عدد الخطوط الزاوية أو الخطوط المتقاطعة أو المنحنيات في حرف للمقارنة. على سبيل المثال ، يمكن تخزين الحرف الكبير “A” على هيئة خطين قطريين يلتقيان بخط أفقي عبر المنتصف.
عندما يتم التعرف على حرف ، يتم تحويله إلى رمز ASCII الذي يمكن أن تستخدمه أنظمة الكمبيوتر للتعامل مع مزيد من التلاعب. يجب على المستخدمين تصحيح الأخطاء الأساسية والتدقيق اللغوي والتأكد من التعامل مع المخططات المعقدة بشكل صحيح قبل حفظ المستند للاستخدام في المستقبل.
حالات استخدام التعرف البصري على الأحرف
يمكن استخدام OCR لمجموعة متنوعة من التطبيقات ، بما في ذلك:
مسح المستندات المطبوعة ضوئيًا إلى إصدارات يمكن تحريرها باستخدام معالجات النصوص ، مثل Microsoft Word أو محرر مستندات Google.
فهرسة المواد المطبوعة لمحركات البحث.
أتمتة إدخال البيانات واستخراجها ومعالجتها.
فك تشفير المستندات إلى نص يمكن قراءته بصوت عالٍ للمستخدمين ضعاف البصر أو المكفوفين.
أرشفة المعلومات التاريخية ، مثل الصحف والمجلات ودفاتر الهاتف ، في تنسيقات قابلة للبحث.
إيداع الشيكات إلكترونيًا دون الحاجة إلى صراف بنكي.
وضع المستندات القانونية المهمة والموقعة في قاعدة بيانات إلكترونية.
التعرف على النص ، مثل لوحات الترخيص ، بكاميرا أو برنامج.
فرز الرسائل لتسليم البريد.
ترجمة الكلمات داخل صورة إلى لغة محددة.
فوائد التعرف البصري على الحروف
تتمثل المزايا الرئيسية لتقنية التعرف الضوئي على الحروف في توفير الوقت وتقليل الأخطاء وتقليل الجهد. كما أنه يمكّن الإجراءات غير القادرة على النسخ الفعلية مثل الضغط في ملفات ZIP ، وإبراز الكلمات الرئيسية ، والدمج في موقع الويب وإرفاقه برسالة بريد إلكتروني.
أثناء التقاط صور للمستندات يمكن أرشفتها رقميًا ، يوفر OCR وظيفة إضافية تتمثل في القدرة على تحرير تلك المستندات والبحث فيها.