Dear Dmitry and Sriranga,

I am so confused now. :(

Maybe I should apply for internship with tesseract, but I am so engaged with
my project here.

Please find the attachment as KHtext in unicode for training sample.

Best Regards,

Sochenda

2011/1/19 Sriranga(78yrsold) <[email protected]>

> Sochenda,
> output of *lines viz.0ccb 8, 0cd5 8,  20c88 are appeared in vowel1.txt. So
> we have to convert unicode numbers to Kannada Character(script) with help of
> post-processor)*
> -Regards,
> -sriranga(78yrs)
>
>
> On Wed, Jan 19, 2011 at 4:04 PM, Sriranga(78yrsold) <
> [email protected]> wrote:
>
>> Sochenda,
>> pleas see inline reply below.
>>
>> On Wed, Jan 19, 2011 at 12:58 PM, KHEM Sochenda 
>> <[email protected]>wrote:
>>
>>> Dear Dmitry and Sriranga,
>>>
>>> Thank you very much for you help. The reason why my output file is empty
>>> because I put my person ID to the glyphs, isn't it?
>>>
>>> Dear Dmitry,
>>> Please see the image attached, shall the image in the red box assigned to
>>> a Unicode character or seperated as in the image? This glyph is composed of
>>> two other glyphs-- one can be represented by a Unicode character, and the
>>> other is a part of a vowel.
>>>
>>> Dear Sriranga,
>>>
>>> Are the several first lines in your unicharset files represent a
>>> characters, or just any unicode character represent no any character. *These
>>> lines viz.0ccb 8, 0cd5 8,  20c88 , 30ce0 are unicode number instead of
>>> characters* *of Kannada* *to show you*. *Usually I am using
>>> characters(Script) instead of unicode number for training purpose.  I am
>>> using tesseract 3.01 alpha(r-529)
>>> *
>>> Khmer font is also attached. Thanks but unable to type. However it
>>> appeared in CharacterMap.
>>>
>>   On receipt of your alphabets list I shall generated datafiles and
>> forwarded to you.
>>
>>>
>>> Best Regards,
>>> Sochenda
>>>
>>>
>>>
>>> On Tue, Jan 18, 2011 at 8:27 PM, Dmitry Silaev <[email protected]>wrote:
>>>
>>>> Dear Sochenda,
>>>>
>>>> In addition to what Sriranga said I'd remind that you should do a lot of
>>>> manual work:
>>>>
>>>> In pyTesseractTrainer check that no bounding boxes intersect glyphs; if
>>>> some does - correct its BB coordinates manually.
>>>>
>>>> In cases of BB overlap you should space out participating glyphs in the
>>>> training image (see the attached picture for examples).
>>>>
>>>> You should use manual spacing if participating glyphs are dependent
>>>> characters (in your language - vowels) and the number of possible
>>>> combinations is practically uncountable. Then you would assign every glyph
>>>> its own code. Tess would consider these glyphs as separate characters and
>>>> you should post-process the resulting code sequence to obtain a well-formed
>>>> dependent Unicode pair (or triplet).
>>>>
>>>> If there can be only few such combinations - you can merge these BBs
>>>> into one to encompass all the required glyphs and assign a single code to
>>>> the entire glyph combination. Then during the post-processing you'll need 
>>>> to
>>>> replace this single code with a predefined dependent Unicode pair.
>>>>
>>>> Hope I've managed to express myself clearly.
>>>>
>>>> Warm regards,
>>>> Dmitry Silaev
>>>>
>>>>
>>>>  --
>>>> You received this message because you are subscribed to the Google
>>>> Groups "tesseract-ocr" group.
>>>> To post to this group, send email to [email protected].
>>>> To unsubscribe from this group, send email to
>>>> [email protected]<tesseract-ocr%[email protected]>
>>>> .
>>>> For more options, visit this group at
>>>> http://groups.google.com/group/tesseract-ocr?hl=en.
>>>>
>>>
>>>  --
>>> You received this message because you are subscribed to the Google Groups
>>> "tesseract-ocr" group.
>>> To post to this group, send email to [email protected].
>>> To unsubscribe from this group, send email to
>>> [email protected]<tesseract-ocr%[email protected]>
>>> .
>>> For more options, visit this group at
>>> http://groups.google.com/group/tesseract-ocr?hl=en.
>>>
>>
>>
>

-- 
You received this message because you are subscribed to the Google Groups 
"tesseract-ocr" group.
To post to this group, send email to [email protected].
To unsubscribe from this group, send email to 
[email protected].
For more options, visit this group at 
http://groups.google.com/group/tesseract-ocr?hl=en.

ក្រោយពីជំនួបជាមួយរដ្ឋមន្ដ្រីការបរទេសកូឡុំប៊ីលោកហោណាំហុង 
រដ្ឋមន្ដ្រីការបរទេសកម្ពុជាបានបញ្ជាក់ប្រាប់ទៅអ្នកសារព័ត៌
មានកាលពីព្រឹកថ្ងៃទី១៩ខែមករានេះថាកម្ពុជាគ្មានគំនិតចង់ធ្វើ
អាក្រក់ជាមួយប្រទេសថៃហើយក៏ពុំមានការគុំកួនអ្វីជាមួយប្រ
ជាជនថៃទេ ។

លោកឧបនាយករដ្ឋមន្ដ្រីរដ្ឋមន្ដ្រីការបរទេសកម្ពុជាបានរំលឹកឡើង
វិញអំពីការជួបពិភាក្សាទ្វេភាគីរវាងលោកជាមួយនឹងលោកកាស៊ីត
ភិរម្យ រដ្ឋមន្ដ្រីការបរទេសថៃនៅឯក្រៅកិច្ចប្រជុំរដ្ឋមន្ដ្រីការបរ
ទេសអាស៊ានមិនចំហនៅប្រទេសឥណ្ឌូនេស៊ីកាលពីថ្ងៃទី១៧ ខែ
មករាឆ្នាំ២០១១ដែលការពិភាក្សានោះបានផ្ដោតលើបញ្ហាកំពុង
កើតមានជុំវិញការចាប់ខ្លួនជនជាតិថៃ៧នាក់ដែលបានឆ្លងដែនខុស
ច្បាប់ចូលទឹកដីកម្ពុជាកាលពីថ្ងៃទី២៩ធ្នូឆ្នាំ២០១០។នៅទីនោះភា
គីទាំងពីរបានឯកភាពគ្នាថាការចាប់ខ្លួនជនជាតិថៃ៧នាក់មិនបានធ្វើ
ឱ្យប៉ះពាល់ដល់ទំនាក់ទំនងការទូតរវាងប្រទេសទាំងពីរទេ ។

លោកហោណាំហុងបានបញ្ជាក់ថា“យើងមានការឯកភាពគ្នាថាស
ភាពការណ៍សព្វថ្ងៃនេះធ្វើយ៉ាងណាកុំឱ្យប៉ះពាល់ដល់ទំនាក់ទំនងដែលមានការរីកចម្រើនល្អមកហើយ“
 ។

រឿងជនជាតិថៃ៧នាក់ឆ្លងដែនដោយខុសច្បាប់ចូលជ្រៅមកក្នុងទឹកដីកម្ពុជា 
ប្រមុខការទូតកម្ពុជាថារដ្ឋាភិបាលកម្ពុជាមិនអាចធ្វើអ្វី
បានទេព្រោះរឿងនេះស្ថិតនៅក្នុងកណ្ដាប់ដៃរបស់តុលាការស្របពេលដែលរដ្ឋមន្ដ្រីការបរទេសថៃទទួលស្គាល់ការពិត
 និងគោរពនូវ
ចលនាយុត្ដិធម៌របស់កម្ពុជា ។

លោកហោ ណាំហុង បានមានប្រសាសន៍ថា“កន្លងមកយើងធ្វើទៅតាមនីតិវិធីច្បាប់របស់តុលាការ 
និងច្បាប់អន្ដោប្រវេសន៍របស់កម្ពុជា
តែប៉ុណ្ណោះ ។ 
កម្ពុជាគ្មានគំនិតចង់ធ្វើអាក្រក់ជាមួយប្រទេសថៃហើយក៏ពុំមានការគុំគួនអ្វីជាមួយប្រជាជនថៃទេ
 “ ។

លោកបានមានប្រសាសន៍ទៀតថា“លោកកាស៊ីត 
ក៏បានអរគុណចំពោះកម្ពុជាយើងដែលបានដោះលែងជនជាតិថៃប៉ុន្មាននាក់ឱ្យស្ថិត
នៅក្រៅឃុំកន្លងមកនេះ។

រហូតមកដល់ថ្ងៃទី១៨ ខែមករា 
ឆ្នាំ២០១១នេះតុលាការកម្ពុជាបានសម្រេចឱ្យជនជាតិថៃ៦នាក់ក្នុងចំណោម៧នាក់ឱ្យស្ថិតនៅក្រៅ
ឃុំលើកលែងម្នាក់ស្ថិតនៅក្នុងការឃុំខ្លួននៅឡើយ ។

រដ្ឋមន្ដ្រីការបរទេសថៃលោកកាស៊ីត ភិរម្យ 
ក៏បានអំពាវនាវឱ្យមានការចាប់ផ្ដើមយន្ដការជាច្រើនលើកិច្ចសហប្រតិបត្ដិការទ្វេភាគីរវាង
កម្ពុជា ថៃ ដើម្បីផលប្រយោជន៍ទៅវិញទៅមក ។

គួររំលឹកដែរថាជនជាតិថៃ៧នាក់នេះបានរំលោភចូលទឹកដីកម្ពុជាចំនួន៣លើកមកហើយ 
គឺលើកទី១នៅខែកក្កដា លើកទី២នៅខែកញ្ញា
ប៉ុន្ដែនៅពេលនោះគេចូលមិនជ្រៅពេកហើយអាជ្ញាធរកម្ពុជាក៏បានឃាត់ពួកគេហើយបញ្ជូនពួកគេត្រឡប់ទៅវិញ
 ។ នៅលើកទី៣
នេះគឺនៅថ្ងៃទី២៩ ខែធ្នូ ឆ្នាំ២០១០ 
គេចូលជ្រៅដល់ភូមិជោគជ័យប្រហែល៤០០ទៅ៥០០ម៉ែត្រពីព្រំដែន ។ អ្នកទាំង៧នាក់នេះដើរ
ចូលមកគឺមិនដើរតាមផ្លូវត្រង់ទេ 
គឺដើរតាមច្រកបង្គោលព្រំដែនលេខ៤៦មកដល់ភូមិនេះមានចម្ងាយប្រមាណ១២០០ម៉ែត្រ ។ ដូច្នេះ
ពួកគេមិនមែនវង្វេងមិនស្គាល់ព្រំដែននោះទេគឺគេមានចេតនាមកដល់ភូមិកម្ពុជា ។

នៅថ្ងៃទី៣០ខែធ្នូនេះតុលាការសាលាដំបូងរាជធានីភ្នំពេញបានចោទប្រកាន់ជនជាតិថៃ៧នាក់នោះពីបទឆ្លងដែនចូលទឹកដីកម្ពុជាដោយ
ខុសច្បាប់ដែលនឹងត្រូវជាប់ពន្ធនាគារពី៣ខែទៅ៦ខែ 
និងចោទប្រកាន់ពីបទរំលោភចូលទីលានយោធាមានបំណងទុច្ចរិតដែលនឹងត្រូវ
ជាប់ពន្ធនាគារពី៦ខែទៅ១ឆ្នាំ ។

ជុំវិញករណីនេះអ្នកនាំពាក្យក្រសួងការបរទេសកម្ពុជាបានគូសបញ្ជាក់ថាតុលាការកម្ពុជា 
នឹងដោះស្រាយបញ្ហានេះស្របទៅតាមច្បាប់
អន្ដោប្រវេសន៍កម្ពុជាដោយយោងទៅលើទំនាក់ទំនងល្អប្រសើររវាងប្រទេសកម្ពុជានិងថៃដែលមានក្នុងពេលបច្ចុប្បន្ននេះដោយពុំមាន
គំនិតអាក្រក់គុំកួនចំពោះជនជាតិថៃទេ ។

(អត្ថបទដកស្រង់ពីកាសែតរស្មីកម្ពុជា)

Reply via email to