Dear Dmitry and Sriranga, I am so confused now. :(
Maybe I should apply for internship with tesseract, but I am so engaged with my project here. Please find the attachment as KHtext in unicode for training sample. Best Regards, Sochenda 2011/1/19 Sriranga(78yrsold) <[email protected]> > Sochenda, > output of *lines viz.0ccb 8, 0cd5 8, 20c88 are appeared in vowel1.txt. So > we have to convert unicode numbers to Kannada Character(script) with help of > post-processor)* > -Regards, > -sriranga(78yrs) > > > On Wed, Jan 19, 2011 at 4:04 PM, Sriranga(78yrsold) < > [email protected]> wrote: > >> Sochenda, >> pleas see inline reply below. >> >> On Wed, Jan 19, 2011 at 12:58 PM, KHEM Sochenda >> <[email protected]>wrote: >> >>> Dear Dmitry and Sriranga, >>> >>> Thank you very much for you help. The reason why my output file is empty >>> because I put my person ID to the glyphs, isn't it? >>> >>> Dear Dmitry, >>> Please see the image attached, shall the image in the red box assigned to >>> a Unicode character or seperated as in the image? This glyph is composed of >>> two other glyphs-- one can be represented by a Unicode character, and the >>> other is a part of a vowel. >>> >>> Dear Sriranga, >>> >>> Are the several first lines in your unicharset files represent a >>> characters, or just any unicode character represent no any character. *These >>> lines viz.0ccb 8, 0cd5 8, 20c88 , 30ce0 are unicode number instead of >>> characters* *of Kannada* *to show you*. *Usually I am using >>> characters(Script) instead of unicode number for training purpose. I am >>> using tesseract 3.01 alpha(r-529) >>> * >>> Khmer font is also attached. Thanks but unable to type. However it >>> appeared in CharacterMap. >>> >> On receipt of your alphabets list I shall generated datafiles and >> forwarded to you. >> >>> >>> Best Regards, >>> Sochenda >>> >>> >>> >>> On Tue, Jan 18, 2011 at 8:27 PM, Dmitry Silaev <[email protected]>wrote: >>> >>>> Dear Sochenda, >>>> >>>> In addition to what Sriranga said I'd remind that you should do a lot of >>>> manual work: >>>> >>>> In pyTesseractTrainer check that no bounding boxes intersect glyphs; if >>>> some does - correct its BB coordinates manually. >>>> >>>> In cases of BB overlap you should space out participating glyphs in the >>>> training image (see the attached picture for examples). >>>> >>>> You should use manual spacing if participating glyphs are dependent >>>> characters (in your language - vowels) and the number of possible >>>> combinations is practically uncountable. Then you would assign every glyph >>>> its own code. Tess would consider these glyphs as separate characters and >>>> you should post-process the resulting code sequence to obtain a well-formed >>>> dependent Unicode pair (or triplet). >>>> >>>> If there can be only few such combinations - you can merge these BBs >>>> into one to encompass all the required glyphs and assign a single code to >>>> the entire glyph combination. Then during the post-processing you'll need >>>> to >>>> replace this single code with a predefined dependent Unicode pair. >>>> >>>> Hope I've managed to express myself clearly. >>>> >>>> Warm regards, >>>> Dmitry Silaev >>>> >>>> >>>> -- >>>> You received this message because you are subscribed to the Google >>>> Groups "tesseract-ocr" group. >>>> To post to this group, send email to [email protected]. >>>> To unsubscribe from this group, send email to >>>> [email protected]<tesseract-ocr%[email protected]> >>>> . >>>> For more options, visit this group at >>>> http://groups.google.com/group/tesseract-ocr?hl=en. >>>> >>> >>> -- >>> You received this message because you are subscribed to the Google Groups >>> "tesseract-ocr" group. >>> To post to this group, send email to [email protected]. >>> To unsubscribe from this group, send email to >>> [email protected]<tesseract-ocr%[email protected]> >>> . >>> For more options, visit this group at >>> http://groups.google.com/group/tesseract-ocr?hl=en. >>> >> >> > -- You received this message because you are subscribed to the Google Groups "tesseract-ocr" group. To post to this group, send email to [email protected]. To unsubscribe from this group, send email to [email protected]. For more options, visit this group at http://groups.google.com/group/tesseract-ocr?hl=en.
ក្រោយពីជំនួបជាមួយរដ្ឋមន្ដ្រីការបរទេសកូឡុំប៊ីលោកហោណាំហុង រដ្ឋមន្ដ្រីការបរទេសកម្ពុជាបានបញ្ជាក់ប្រាប់ទៅអ្នកសារព័ត៌ មានកាលពីព្រឹកថ្ងៃទី១៩ខែមករានេះថាកម្ពុជាគ្មានគំនិតចង់ធ្វើ អាក្រក់ជាមួយប្រទេសថៃហើយក៏ពុំមានការគុំកួនអ្វីជាមួយប្រ ជាជនថៃទេ ។ លោកឧបនាយករដ្ឋមន្ដ្រីរដ្ឋមន្ដ្រីការបរទេសកម្ពុជាបានរំលឹកឡើង វិញអំពីការជួបពិភាក្សាទ្វេភាគីរវាងលោកជាមួយនឹងលោកកាស៊ីត ភិរម្យ រដ្ឋមន្ដ្រីការបរទេសថៃនៅឯក្រៅកិច្ចប្រជុំរដ្ឋមន្ដ្រីការបរ ទេសអាស៊ានមិនចំហនៅប្រទេសឥណ្ឌូនេស៊ីកាលពីថ្ងៃទី១៧ ខែ មករាឆ្នាំ២០១១ដែលការពិភាក្សានោះបានផ្ដោតលើបញ្ហាកំពុង កើតមានជុំវិញការចាប់ខ្លួនជនជាតិថៃ៧នាក់ដែលបានឆ្លងដែនខុស ច្បាប់ចូលទឹកដីកម្ពុជាកាលពីថ្ងៃទី២៩ធ្នូឆ្នាំ២០១០។នៅទីនោះភា គីទាំងពីរបានឯកភាពគ្នាថាការចាប់ខ្លួនជនជាតិថៃ៧នាក់មិនបានធ្វើ ឱ្យប៉ះពាល់ដល់ទំនាក់ទំនងការទូតរវាងប្រទេសទាំងពីរទេ ។ លោកហោណាំហុងបានបញ្ជាក់ថា“យើងមានការឯកភាពគ្នាថាស ភាពការណ៍សព្វថ្ងៃនេះធ្វើយ៉ាងណាកុំឱ្យប៉ះពាល់ដល់ទំនាក់ទំនងដែលមានការរីកចម្រើនល្អមកហើយ“ ។ រឿងជនជាតិថៃ៧នាក់ឆ្លងដែនដោយខុសច្បាប់ចូលជ្រៅមកក្នុងទឹកដីកម្ពុជា ប្រមុខការទូតកម្ពុជាថារដ្ឋាភិបាលកម្ពុជាមិនអាចធ្វើអ្វី បានទេព្រោះរឿងនេះស្ថិតនៅក្នុងកណ្ដាប់ដៃរបស់តុលាការស្របពេលដែលរដ្ឋមន្ដ្រីការបរទេសថៃទទួលស្គាល់ការពិត និងគោរពនូវ ចលនាយុត្ដិធម៌របស់កម្ពុជា ។ លោកហោ ណាំហុង បានមានប្រសាសន៍ថា“កន្លងមកយើងធ្វើទៅតាមនីតិវិធីច្បាប់របស់តុលាការ និងច្បាប់អន្ដោប្រវេសន៍របស់កម្ពុជា តែប៉ុណ្ណោះ ។ កម្ពុជាគ្មានគំនិតចង់ធ្វើអាក្រក់ជាមួយប្រទេសថៃហើយក៏ពុំមានការគុំគួនអ្វីជាមួយប្រជាជនថៃទេ “ ។ លោកបានមានប្រសាសន៍ទៀតថា“លោកកាស៊ីត ក៏បានអរគុណចំពោះកម្ពុជាយើងដែលបានដោះលែងជនជាតិថៃប៉ុន្មាននាក់ឱ្យស្ថិត នៅក្រៅឃុំកន្លងមកនេះ។ រហូតមកដល់ថ្ងៃទី១៨ ខែមករា ឆ្នាំ២០១១នេះតុលាការកម្ពុជាបានសម្រេចឱ្យជនជាតិថៃ៦នាក់ក្នុងចំណោម៧នាក់ឱ្យស្ថិតនៅក្រៅ ឃុំលើកលែងម្នាក់ស្ថិតនៅក្នុងការឃុំខ្លួននៅឡើយ ។ រដ្ឋមន្ដ្រីការបរទេសថៃលោកកាស៊ីត ភិរម្យ ក៏បានអំពាវនាវឱ្យមានការចាប់ផ្ដើមយន្ដការជាច្រើនលើកិច្ចសហប្រតិបត្ដិការទ្វេភាគីរវាង កម្ពុជា ថៃ ដើម្បីផលប្រយោជន៍ទៅវិញទៅមក ។ គួររំលឹកដែរថាជនជាតិថៃ៧នាក់នេះបានរំលោភចូលទឹកដីកម្ពុជាចំនួន៣លើកមកហើយ គឺលើកទី១នៅខែកក្កដា លើកទី២នៅខែកញ្ញា ប៉ុន្ដែនៅពេលនោះគេចូលមិនជ្រៅពេកហើយអាជ្ញាធរកម្ពុជាក៏បានឃាត់ពួកគេហើយបញ្ជូនពួកគេត្រឡប់ទៅវិញ ។ នៅលើកទី៣ នេះគឺនៅថ្ងៃទី២៩ ខែធ្នូ ឆ្នាំ២០១០ គេចូលជ្រៅដល់ភូមិជោគជ័យប្រហែល៤០០ទៅ៥០០ម៉ែត្រពីព្រំដែន ។ អ្នកទាំង៧នាក់នេះដើរ ចូលមកគឺមិនដើរតាមផ្លូវត្រង់ទេ គឺដើរតាមច្រកបង្គោលព្រំដែនលេខ៤៦មកដល់ភូមិនេះមានចម្ងាយប្រមាណ១២០០ម៉ែត្រ ។ ដូច្នេះ ពួកគេមិនមែនវង្វេងមិនស្គាល់ព្រំដែននោះទេគឺគេមានចេតនាមកដល់ភូមិកម្ពុជា ។ នៅថ្ងៃទី៣០ខែធ្នូនេះតុលាការសាលាដំបូងរាជធានីភ្នំពេញបានចោទប្រកាន់ជនជាតិថៃ៧នាក់នោះពីបទឆ្លងដែនចូលទឹកដីកម្ពុជាដោយ ខុសច្បាប់ដែលនឹងត្រូវជាប់ពន្ធនាគារពី៣ខែទៅ៦ខែ និងចោទប្រកាន់ពីបទរំលោភចូលទីលានយោធាមានបំណងទុច្ចរិតដែលនឹងត្រូវ ជាប់ពន្ធនាគារពី៦ខែទៅ១ឆ្នាំ ។ ជុំវិញករណីនេះអ្នកនាំពាក្យក្រសួងការបរទេសកម្ពុជាបានគូសបញ្ជាក់ថាតុលាការកម្ពុជា នឹងដោះស្រាយបញ្ហានេះស្របទៅតាមច្បាប់ អន្ដោប្រវេសន៍កម្ពុជាដោយយោងទៅលើទំនាក់ទំនងល្អប្រសើររវាងប្រទេសកម្ពុជានិងថៃដែលមានក្នុងពេលបច្ចុប្បន្ននេះដោយពុំមាន គំនិតអាក្រក់គុំកួនចំពោះជនជាតិថៃទេ ។ (អត្ថបទដកស្រង់ពីកាសែតរស្មីកម្ពុជា)

