See attached image from a screenshot of Malayalam wiki and the OCRed text 
using traineddata from tessdata_best, tessdata_fast and tessdata 
To me it seems like recognition is 90+% correct.

On Sunday, March 14, 2021 at 6:09:17 AM UTC+5:30 shree wrote:

> You have not stated the version of tesseract that you are using.
>
> >We downloaded some online training data available for the language 
> Malayalam
>
> You have not mentioned from where you got it. Are these the official 
> traineddata files?
>
> >we found that few special characters in the language are not picked up by 
> the training data properly.
>
> Which characters?
>
> >Current achieved  60% accuracy
>
> With the LSTM engine, better results are expected.
>
> Please share a sample image with its expected result.
>
> You can also try
>
> https://ocr.sanskritdictionary.com/
>
>
>
> On Sun, Mar 14, 2021, 00:41 avinash singh <[email protected]> wrote:
>
>> Hello,
>>
>> We are working on a project for underprivileged kids, we need to build an 
>> OCR for the Malayalam language.
>>
>> We downloaded some online training data available for the language 
>> Malayalam,  the current accuracy is around 60%, we found that few special 
>> characters in the language are not picked up by the training data properly.
>>
>> So we wanted to fine-tune the current training data, we did some research 
>> and then downloaded Jtessbox editor for creating training data but we 
>> couldn't edit the incorrect character.
>>
>> then we tried the QT-Box editor, we were able to edit the incorrect 
>> letters but we couldn't generate the training data through the software 
>>
>> Finally, we tried Cygwin with the command line to generate the custom 
>> data but we failed to combine the training data 
>>
>> As this is for an NGO our company wants to close this project with the 
>> current achieved  60% accuracy, I really wish to complete this as the 
>> English translation is completely wrong can someone please guide us on how 
>> to train the data
>>
>> Any help would be much appreciated
>> Thanks in advance  
>>
>> -- 
>> You received this message because you are subscribed to the Google Groups 
>> "tesseract-ocr" group.
>> To unsubscribe from this group and stop receiving emails from it, send an 
>> email to [email protected].
>> To view this discussion on the web visit 
>> https://groups.google.com/d/msgid/tesseract-ocr/84a6fc1f-300a-4aac-85b8-99c47a7d88f4n%40googlegroups.com
>>  
>> <https://groups.google.com/d/msgid/tesseract-ocr/84a6fc1f-300a-4aac-85b8-99c47a7d88f4n%40googlegroups.com?utm_medium=email&utm_source=footer>
>> .
>>
>>

-- 
You received this message because you are subscribed to the Google Groups 
"tesseract-ocr" group.
To unsubscribe from this group and stop receiving emails from it, send an email 
to [email protected].
To view this discussion on the web visit 
https://groups.google.com/d/msgid/tesseract-ocr/778a7e9b-de29-4284-aa5d-d7099680b736n%40googlegroups.com.
കോവിഡ്‌-9 നിര്‍ണ്ണയം, രോഗബാധ തടയല്‍, ചികിത്സ എന്നിവ സംബന്ധിച്ച നിരവധി വ്യാജവും 
തെളിയിക്കപ്പെടാത്തതുമായ മെഡിക്കല്‍
ഉല്‍പ്പന്നങ്ങളും രീതികളും നിലവിലുണ്ട്‌. കോവിഡ്‌:-19 ഭേദപ്പെടുത്താം എന്ന 
അവകാശവാദത്തോടെ വില്‍ക്കുന്ന വ്യാജ മരുന്നുകളില്‍
അവകാശപ്പെടുന്ന ഘടകങ്ങള്‍ ഉണ്ടാവണമെന്നില്ല. മാത്രമല്ല, അവയില്‍ ദോഷകരമായ 
ചേരുവകള്‍ ഉണ്ടായേക്കുകയും ചെയ്യാം. വാക്സിനുകള്‍
വികസിപ്പിക്കുന്നതിന്‌ ലോകമെമ്പാടും ശ്രമങ്ങള്‍ നടക്കുന്നുണ്ട. ലോകാരോഗ്യസംഘടനയുടെ 
നേതൃത്വത്തിലുള്ള സോളിഡാരിറ്റി ട്രയല്‍ ഉള്‍പ്പെടെ
പല രാജ്യങ്ങളിലും ഗവേഷണം നടക്കുന്നുണ്ടെങ്കിലും 2020 മാര്‍ച്‌ വരെ ലോകാരോഗ്യ സംഘടന 
കോവിഡ്‌:9 ചികിത്സിക്കുന്നതിനോ
ചികിത്സിക്കുന്നതിനോ മരുന്നുകളൊന്നും ശുപാര്‍ശ ചെയുന്നില്ല.

കോവിഡ്‌-19 നിര്‍ണ്ണയം, രോഗബാധ തടയല്‍, ചികിത്സ എന്നിവ സംബന്ധിച്ച നിരവധി വ്യാജവും 
തെളിയിക്കപ്പെടാത്തതുമായ മെഡിക്കല്‍
ഉല്‍പ്പന്നങ്ങളും രീതികളും നിലവിലുണ്ട്‌. കോവിഡ്‌-159 ഭേദപ്പെടുത്താം എന്ന 
അവകാശവാദത്തോടെ വിൽക്കുന്ന വ്യാജ മരുന്നുകളില്‍
അവകാശപ്പെടുന്ന ഘടകങ്ങള്‍ ഉണ്ടാവണമെന്നില്ല. മാത്രമല്ല, അവയില്‍ ദോഷകരമായ 
ചേരുവകള്‍ ഉണ്ടായേക്കുകയും ചെയ്യാം. വാക്‌സിനുകള്‍
വികസിപ്പിക്കുന്നതിന്‌ ലോകമെമ്പാടും ശ്രമങ്ങള്‍ നടക്കുന്നുണ്ട്‌. 
ലോകാരോഗ്യസംഘടനയുടെ നേതൃത്വത്തിലുള്ള സോളിഡാരിറ്റി ട്രയൽ ഉള്‍പ്പെടെ
പല രാജ്യങ്ങളിലും ഗവേഷണം നടക്കുന്നുണ്ടെങ്കിലും 2020 മാർച്ച്‌ വരെ ലോകാരോഗ്യ സംഘടന 
കോവിഡ്‌-19 ചികിത്സിക്കുന്നതിനോ
ചികിത്സിക്കുന്നതിനോ മരുന്നുകളൊന്നും ശുപാര്‍ശ ചെയ്യുന്നില്ല.

കോവിഡ്-19 നിർണ്ണയം, രോഗബാധ തടയൽ, ചികിത്സ എന്നിവ സംബന്ധിച്ച നിരവധി വ്യാജവും 
തെളിയിക്കപ്പെടാത്തതുമായ മെഡിക്കൽ
ഉൽപ്പന്നങ്ങളും രീതികളും നിലവിലുണ്ട്. കോവിഡ്-19 ഭേദപ്പെടുത്താം എന്ന 
അവകാശവാദത്തോടെ വിൽക്കുന്ന വ്യാജ മരുന്നുകളിൽ
അവകാശപ്പെടുന്ന ഘടകങ്ങൾ ഉണ്ടാവണമെന്നില്ല. മാത്രമല്ല, അവയിൽ ദോഷകരമായ ചേരുവകൾ 
ഉണ്ടായേക്കുകയും ചെയ്യാം. വാക്‌സിനുകൾ
വികസിപ്പിക്കുന്നതിന് ലോകമെമ്പാടും ശ്രമങ്ങൾ നടക്കുന്നുണ്ട്. ലോകാരോഗ്യസംഘടനയുടെ 
നേതൃത്വത്തിലുള്ള സോളിഡാരിറ്റി ട്രയൽ ഉൾപ്പെടെ
പല രാജ്യങ്ങളിലും ഗവേഷണം നടക്കുന്നുണ്ടെങ്കിലും 2020 മാർച്ച് വരെ ലോകാരോഗ്യ സംഘടന 
കോവിഡ്-19 ചികിത്സിക്കുന്നതിനോ
ചികിത്സിക്കുന്നതിനോ മരുന്നുകളൊന്നും ശുപാർശ ചെയ്യുന്നില്ല.
കോവിഡ്‌-19 നിര്‍ണ്ണയം, രോഗബാധ തടയല്‍, ചികിത്സ എന്നിവ സംബന്ധിച്ച നിരവധി വ്യാജവും 
തെളിയിക്കപ്പെടാത്തതുമായ മെഡിക്കല്‍
ഉല്‍പ്പന്നങ്ങളും രീതികളും നിലവിലുണ്ട്‌. കോവിഡ്‌-159 ഭേദപ്പെടുത്താം എന്ന 
അവകാശവാദത്തോടെ വിൽക്കുന്ന വ്യാജ മരുന്നുകളില്‍
അവകാശപ്പെടുന്ന ഘടകങ്ങള്‍ ഉണ്ടാവണമെന്നില്ല. മാത്രമല്ല, അവയില്‍ ദോഷകരമായ 
ചേരുവകള്‍ ഉണ്ടായേക്കുകയും ചെയ്യാം. വാക്‌സിനുകള്‍
വികസിപ്പിക്കുന്നതിന്‌ ലോകമെമ്പാടും ശ്രമങ്ങള്‍ നടക്കുന്നുണ്ട്‌. 
ലോകാരോഗ്യസംഘടനയുടെ നേതൃത്വത്തിലുള്ള സോളിഡാരിറ്റി ട്രയൽ ഉള്‍പ്പെടെ
പലരാജ്യങ്ങളിലും ഗവേഷണം നടക്കുന്നുണ്ടെങ്കിലും 2020 മാർച്‌ വരെ ലോകാരോഗ്യ സംഘടന 
കോവിഡ്‌-19 ചികിത്സിക്കുന്നതിനോ
ചികിത്സിക്കുന്നതിനോ മരുന്നുകളൊന്നും ശുപാര്‍ശ ചെയ്യുന്നില്ല.


Reply via email to