ماهو ال OCR |
||
السلام عليكم
بما انه اني الان في صدد مشروع ارشفة الكترونية احببت ان اكتب اليكم
هذا الموضوع المتعلق بركن مهم من اركان الارشفة الالكترونية
الا وهية Optical Character recognition يرمز لها اختصارا ocr
اي التعرف الضوئي للحروف
وتاتي هذه الخدمة غاليا مع البرامج المرفقة بالسكنر الماسح الضوئي
ووضيفت يقوم بتحويل الوثيقة الورقية الى" وثيقة رقمية" قابلة للحياه
شنو يعني
السكنر المعروف عن عمله هو سحب المدخلات اليه الى الحاسوب بصيغة صور
يعني اكدر اجيب الصورة الفوتوغرافية واحولها الى صورة رقمية واقوم بالتعديلات عليها ببرامج تحرير الصور كالفوتوشوب مثلا ....
لكن ما ذا عن الوثائق .... ان سحب الوثيقة بهيئة صورة سوف يحولها الى الحاسب
وكانها صورة يمكن تحريرها كصورة فقط
لكن ماذا عن محتوياتها من كتابات هل من المنطقي ان ادخل وثيقة كتابيه الى برامج تحرير صور
طبعا لا .......من هنا ظهرت الحاجة الى الخدمة التي تستطيع تحويل الوثائق الى
خامات قابلة للتعديل ببرامج تحرير النصوص كبرنامج محرر النصوص مايكروسوفت ورد
مثلا
وبِشكل أدق هو ترجمة صورة الحرف إلى الترميز المحدد له (ASCII, Unicode)
وتسمى هذه العملية بعملية الرقمنة او ال digitization
في السابق كانت البرامج التي تقوم بهذا العمل تدرب باستخدام تقنيات الذكاء
الصناعي وتعمل على فونت أو اثنين بتلقيمها الشكل الرئيسي للحرف
أما الأنظمة الحديثة فتستطيع تمييز فونات كثيرة وبدقة عالية، وبعض البرامج
تستطيع تحويل ورقة من مجلة أجنبية مثلاً إلى نص قابل للتحرير مع الحفاظ على
نوع الخط وترتيب الورقة وأماكن الصور وكأن شيئاً لم يحصل سوى أنها دبت الحياة
بصورة الورقة
ظهرت برامج عديدة منها OmniPage ومنها فاين ريدر وهناك برنامج من شركة صخر
لااعرفه صراحة وهل يلبي دعمه للغة العربية
لكن جميع هذه البرامج فاشلة ؟؟؟؟؟؟
في ماذا طبعا مامعقولة هاي الشركات فاشلة لكن فشلها مقصود لانها جميعها
لاتهتم باللغة العربية
لانه مع الاسف اللغة العربية اخر ماتهتم به هذه الشركات
فنجد هذه البرامج فعالة مع اللغات الاخرى وتمكنك من اعادة تحرير الوثيقة
المسحوبة بالماسح الضوئي السكنر
اقتباس:
اقتباس:
بعد تجربته الصراحة يقدم دعم بنسبة لاتقل عن 80% للغة العربية
يعني المهم يسحبلك الوثيقة بوجود بعض الاخطاء ببعض الاحرف
تكدر تعدلها خاصة باستخدام خاصية الاستبدال الي يوفرها مايكروسوفت ورد
|