ماهو ال  OCR

رابط الموضوع في المنتدى للمناقشة والاستفسار
 

السلام عليكم

 

بما انه اني الان في صدد مشروع ارشفة الكترونية احببت ان اكتب اليكم
هذا الموضوع المتعلق بركن مهم من اركان الارشفة الالكترونية

 

الا وهية Optical Character recognition يرمز لها اختصارا ocr

 

اي التعرف الضوئي للحروف

 

وتاتي هذه الخدمة غاليا مع البرامج المرفقة بالسكنر الماسح الضوئي
ووضيفت يقوم بتحويل الوثيقة الورقية الى" وثيقة رقمية" قابلة للحياه

 

شنو يعني

 

السكنر المعروف عن عمله هو سحب المدخلات اليه الى الحاسوب بصيغة صور
يعني اكدر اجيب الصورة الفوتوغرافية واحولها الى صورة رقمية واقوم بالتعديلات عليها ببرامج
تحرير الصور كالفوتوشوب مثلا ....


 

لكن ما ذا عن الوثائق .... ان سحب الوثيقة بهيئة صورة سوف يحولها الى الحاسب وكانها صورة يمكن تحريرها كصورة فقط
لكن ماذا عن محتوياتها من كتابات هل من المنطقي ان ادخل وثيقة كتابيه الى برامج تحرير صور


 

طبعا لا .......من هنا ظهرت الحاجة الى الخدمة التي تستطيع تحويل الوثائق الى خامات قابلة للتعديل ببرامج تحرير النصوص كبرنامج محرر النصوص مايكروسوفت ورد مثلا

 

وبِشكل أدق هو ترجمة صورة الحرف إلى الترميز المحدد له (ASCII, Unicode)


 

وتسمى هذه العملية بعملية الرقمنة او ال digitization


 

في السابق كانت البرامج التي تقوم بهذا العمل تدرب باستخدام تقنيات الذكاء الصناعي وتعمل على فونت أو اثنين بتلقيمها الشكل الرئيسي للحرف


 

أما الأنظمة الحديثة فتستطيع تمييز فونات كثيرة وبدقة عالية، وبعض البرامج تستطيع تحويل ورقة من مجلة أجنبية مثلاً إلى نص قابل للتحرير مع الحفاظ على نوع الخط وترتيب الورقة وأماكن الصور وكأن شيئاً لم يحصل سوى أنها دبت الحياة بصورة الورقة


 

ظهرت برامج عديدة منها OmniPage ومنها فاين ريدر وهناك برنامج من شركة صخر لااعرفه صراحة وهل يلبي دعمه للغة العربية


 

لكن جميع هذه البرامج فاشلة ؟؟؟؟؟؟

 

في ماذا طبعا مامعقولة هاي الشركات فاشلة لكن فشلها مقصود لانها جميعها لاتهتم باللغة العربية
لانه مع الاسف اللغة العربية اخر ماتهتم به هذه الشركات

 

فنجد هذه البرامج فعالة مع اللغات الاخرى وتمكنك من اعادة تحرير الوثيقة المسحوبة بالماسح الضوئي السكنر



 

اقتباس:
OmniPage: وهو برنامج OCR يميز كل لغات العالم إلا اللغة العربية والعبرية وتقوم الشركة المنتجة له باستطلاع رأي لإدراج اللغة العربية على النسخة القادمة 16


 

اقتباس:

 
Microsoft Office Document Imaging: طبعاً من سياسة مايكروسوفت بحشر أنفها تقنياً بكل ما لايعنيها من برامج فقد أدرجت هذه الميزة على نسخ Office الجديدة فهي موجودة بنسخة 2002 و 2003 ولكنها قاصرة بالتمييز ولا تملك أدوات للغة العربية بعد





برنامج


Readiris Pro 11 Mr.Underground Edition
 

بعد تجربته الصراحة يقدم دعم بنسبة لاتقل عن 80% للغة العربية


 

يعني المهم يسحبلك الوثيقة بوجود بعض الاخطاء ببعض الاحرف
 
تكدر تعدلها خاصة باستخدام خاصية الاستبدال الي يوفرها مايكروسوفت ورد

 

الموضوع التالي

 

الفهرس

 

الموضوع السابق