pspad:
--------------------------------------------------------------------------------
To by Notepad++ musel umet pracovat se 4-bajtovým unicode kodovanim. Jinak by
nemohl ten znak ani udrzet v pameti - 4 bajtový znak do 2 bajtu nedostanes. A
kdyby to umel, pak by jej dovedl i zobrazit. Takze nevim, jak to Notepad++
dela.
--------------------------------------------------------------------------------


Zobrazeni nejspis zalezi na dostupnych fontech a pripadne se misto chybejicich
znaku pouzije nahrazovaci obdelnik - to dela i PSPad.

Zda se ale, ze problem neni ani v internim formatu pspadu, ten totiz i zmineny
znak nad BMP ulozi a pri opetovnem nacteni v PSPadu spravne zobrazi jakoby v
nastavenem kodovani utf8 - pri prekopirovani do jineho editoru s sirsim fontem
pres schranku se spravne zobrazi "lady beetle", prime otevreni takoveho
"pspadiho" souboru ale ostatni editory nezvladaji (stejne jako pspad spravne
neotevre jejich - se znakem nad FFFF).

Pokud ulozim v pspadu a notepadu++ text: a[lady beetle]b jako utf-8 bez BOM,
pouzita hexadecimalni sekvence mezi znaky "a" a "b" se lisi.
notepad++ standardne zakoduje primo u+1f41e do utf-8 jako F0 9F 90 9E
pspad zde myslim nekorektne pouzije
ED A0 BD  ED B0 9E
coz odpovida utf-8 zakodovani surogatu:
D83D DC1E
ktere predstavuji surogatovou verzi onoho vychoziho u+1f41e v utf-16.

Zda se tedy, ze pspad interne pracuje s utf-16 vcetne surogatu a umi tedy nejak
zpracovat i znaky nad BMP, pouzije ovsem nestandardni postup pri ukladani i
otevitrani - poklada surogaty za bezne znaky a tak je i jednotlive zakoduje
(takze ve "svych" souborech je schopen tyto "pokrocile" znaky i spravne
nacist).

Resenim by bylo pri ukladani identifikovat surogatove pary, prevest je na
odpovidajici znaky unicode a ty poslat k zakodovani (napr. pro utf-8 nebo
utf-32; utf-16 by snad melo byt automaticky v poradku);
pri nacitani by pak bylo treba najit znaky naf U+FFFF, prekodovat je pomoci
surogatu a predat je internimu utf-16.
(srov napr. vzorce
http://www.russellcottrell.com/greek/utilities/SurrogatePairCalculator.htm )

Nevim, nakolik jsou podobne upravy interniho prekodovani mozne, pripadne
nejde-li o uzavrene knihovny.

zdravim,
   vbr

-- 
<http://forum.pspad.com/read.php?1,60844,60997>
PSPad freeware editor http://www.pspad.com

Odpovedet emailem