Hi Albert, and Zhang Peng,

On 10/11/2008, at 6:39 AM, Albert Astals Cid wrote:

A Diumenge 09 Novembre 2008, zhang peng va escriure:
 I have set CMap files to the poppler data directory.

 It seems that the font can't display!  The file can't be displayed!

 Thanks!

Poppler 0.10.0 works here.

 pdftotext  worked fine for me,
   both with Poppler v0.8.2  and  Poppler v0.10.0

However there were problems with  readme.pdf
when using other software.

e.g.,  Adobe Reader v8.1.0 and v9.0.0
      both showed just blank pages;

       Adobe Acrobat Pro v8.1.2
      displayed the PDF just fine

       Preview (MacOS X, v10.4.11)
      displayed the PDF just fine


pdftohtml  translated the PDF to a 2-page HTML, with frames
   *but* there were some errors:
(files attached)

 readme.html   has junk in the <TITLE> tag
    looks like a 2-byte sequence hasn't been correctly
    translated into UTF-8

 readmes.html   has junk in both <LI> tags
    again it looks like some bytes (for page titles?)
    were not properly translated to UTF8.

Title: ��


<FRAMESET cols="100,*">
<FRAME name="links" src="readme_ind.html">
<FRAME name="contents" src="readmes.html">
</FRAMESET>

file:///C|/Documents and Settings/bob/桌面/readme.txt
内嵌PDF的方案比较:
目前我了解到几类可供我们直接使用的PDF插件(成品、产品)主要有两个:
1、      YCanPDF:
YCanPDF是国内工作室开发的一个PDF插件,网址是:http://www.ycanpdf.cn/ ,基本功能是:
1.      æ”¯æŒæŸ¥æ‰¾ã€ç¼©æ”¾ã€æ—‹è½¬ã€é¼ æ ‡æ‹–动、单页多页切换、目录、打印等功能;
2.支持内存和URL形式的PDF文件;
3.支持WEB调用,无需安装,直接通过浏览器阅读PDF文件;
4.支持中文以及加密(包括证书加密)的PDF;
5.控件可独立运行,无需任何其他环境支持。
我探索后发现的特点是:
1、      ç¬¬ä¸€æ¬¡å¦‚果打开的是某个文件,可能会暂时显示不正常,但以后就好了。――稳定性可能
稍有不足。
2、      å›½äººå¼€å‘、文档、交流容易。
3、      åŠŸèƒ½ç®€æ´ç²¾æ‚ï¼ŒåŸºæœ¬åŠŸèƒ½éƒ½æœ‰äº†ã€‚
4、      ä»·æ ¼åœ¨5000-8000,可提供少量的二次开发。
5、      ä¼°è®¡å’ŒçŒœæµ‹ï¼Œè¿™ä¸ªç³»ç»Ÿä¹Ÿæ˜¯åŸºäºŽä¸€äº›å¼€æºè½¯ä»¶ä¿®æ”¹è€Œæ¥ï¼Œå› ä¸ºç›®å‰æ®äº†è§£ï¼ŒPDF的解析除了
大公司外,都是基于一些库修改而来。
2、      FoxitPDF:
FoxitPDF是国外的一款PDF插件,据说微软等也都在用它。基本特点分析如下:
1、      ç‰¹åˆ«ç¨³å®šï¼Œæ®è¯´æ˜¯å¯ä»¥å®Œå…¨æ›¿ä»£Adobe PDF的一款软件
2、      é«˜ç«¯äº§å“ï¼Œè´¨é‡å¯é ï¼Œæ‰€ä»¥å®¢æˆ·ä¼—多。
3、      åŠŸèƒ½éžå¸¸é½å…¨ï¼Œç”šè‡³å¯ä»¥æ”¯æŒæ‰‹æœºã€åµŒå…¥å¼ç­‰å¹³å°ã€‚
4、      ç¼ºç‚¹ä¹Ÿæ¯”较明显,价格较高,具体还没谈定,邮件发送后响应缓慢,似乎国内的代理还需要
询问国外总公司,邮箱是总公司的邮件。估计价格要1000美元以上。
5、      æœåŠ¡æ”¯æŒå¯èƒ½å“åº”ç¼“æ…¢ï¼Œç¼ºå°‘ä¸­æ–‡æ–‡æ¡£ã€‚
还有一种方案是,基于xPDF或者sumatrapdf进行自己的开发,分析如下:
1、      sumatrapdf他们有一定的稳定性,但似乎稳定性不如YCanPDF,因为YCanPDF对测试的PDF文
件只是第一次显示不正常,以后就正常了。但sumatrapdf一直无法正常显示第17页。怀疑对某些文
件,特别是中文文件不很兼容。
2、      å¼€å‘周期可能较长,约需1-2个月的时间,然后还需测试和稳定。有一定的开发风险。
3、      ä¼˜ç‚¹æ˜¯ï¼šæœ‰æºç ï¼Œå¯æŽ§åˆ¶ã€‚以后不再受限制。
补充:
YCanPDF
如果是本地使用控件,需要的外部资源就不用从网络下载了,可以直接和控件一起安装,就不会出现
乱码问题了。
Foxit
file:///C|/Documents and Settings/bob/桌面/readme.txt(第 1/2 页)2008-10-24 13:43:07

file:///C|/Documents and Settings/bob/桌面/readme.txt
缺点:无法解析证书加密的PDF文件。
优点:显示效率是这三个产品中最好的,公司技术实力很强。
Sumatrapdf
这是个纯粹的西方语系产品,没有CJK(中日韩语言)处理机制,从技术上来说就是内部没有支持CJK,
对于没有内嵌的中文PDF,显示是乱码。(但是可以显示内嵌的中文字体)要增加完全的中文支持,需
要掌握PDF内部对type1、truetype等多种字体的处理机制,还要掌握直接从字体文件绘制字体的方法,
因为PDF显示字体不是用windows api,而是直接从字体文件解析,难度比较大。
file:///C|/Documents and Settings/bob/桌面/readme.txt(第 2/2 页)2008-10-24 13:43:07

Document Outline

  • þÿg,W0xÁvØ



 The bulk of the content in  readmes.html  looks fine.
 So it seems that the titles are not being subjected to the
 same translation routines as is the body of the document.
 Is this related to the CMap resources?  Quite possibly.



Or at least seems to work as i don't know if the printed chinese characters
make sense or not.

I've no reason to believe that there's any problem with these.
It's just that there are some bytes that should have been
translated to chinese characters, but were not.


Albert

I hope this report encourages someone to take a closer look
at  pdftohtml .


Cheers,

        Ross


------------------------------------------------------------------------
Ross Moore                                       [EMAIL PROTECTED]
Mathematics Department                           office: E7A-419
Macquarie University                             tel: +61 (0)2 9850 8955
Sydney, Australia  2109                          fax: +61 (0)2 9850 8114
------------------------------------------------------------------------



_______________________________________________
poppler mailing list
[email protected]
http://lists.freedesktop.org/mailman/listinfo/poppler

Reply via email to