Alek!
The problem is that of localization. Businesses which publish local
language wsdl's can not be understood by Axis2.
The following (attached) XML file written in chinese/japanese couldn't
be parsed by the MXParser. Parsing threw a XMLStreamException saying
"start tag unexpected character \ub9" the moment it encountered a
foreign character.
Other than yahoo group is their some kind of mailing list for stAX
community? I've some problem using yahoogroups
Thank you
Jayachandra
On 4/21/05, Aleksander Slominski <[EMAIL PROTECTED]> wrote:
> jayachandra wrote:
>
> >1. The MXParser doesn't seem to support the UTF-8 character set fully.
> >Japanese XML files weren't parsed properly. In future, this could
> >throw a serious problem. This can have it's effect on the SOAP message
> >processing of foreign web services.
> >
> >
> what is the problem? makes ure to send email about problems to
> http://groups.yahoo.com/group/stax_builders/
> and file bug report(s) in bugzilla for StAX RI
> (http://www.extreme.indiana.edu/bugzilla/buglist.cgi?product=STAX)
>
> >2. The DTDParser inside MXParser was failing to understand the DTD
> >declaration line(s) of several (complex?) DTDs. Though this might not
> >seem as a problem if you look at the SOAP message processing part of
> >it, but certainly with such a behaviour complete XML infoset support
> >can not be given to our OM.
> >
> >
> are you actually testing validating or non-validating parser?
> requirement for non-validating parser are different in regard to DTDs.
>
> moreover DTDs are to be rejected by SOAP processor anyway ...
>
> thanks,
>
> alek
>
> --
> The best way to predict the future is to invent it - Alan Kay
>
>
--
-- Jaya
<?xml version="1.0"?>
<!DOCTYPE 週報 SYSTEM "weekly-utf-8.dtd">
<!-- 週報サンプル -->
<週報>
<年月週>
<年度>1997</年度>
<月度>1</月度>
<週>1</週>
</年月週>
<氏名>
<氏>山田</氏>
<名>太郎</名>
</氏名>
<業務報告リスト>
<業務報告>
<業務名>XMLエディターの作成</業務名>
<業務コード>X3355-23</業務コード>
<工数管理>
<見積もり工数>1600</見積もり工数>
<実績工数>320</実績工数>
<当月見積もり工数>160</当月見積もり工数>
<当月実績工数>24</当月実績工数>
</工数管理>
<予定項目リスト>
<予定項目>
<P>XMLエディターの基本仕様の作成</P>
</予定項目>
</予定項目リスト>
<実施事項リスト>
<実施事項>
<P>XMLエディターの基本仕様の作成</P>
</実施事項>
<実施事項>
<P>競合他社製品の機能調査</P>
</実施事項>
</実施事項リスト>
<上長への要請事項リスト>
<上長への要請事項>
<P>特になし</P>
</上長への要請事項>
</上長への要請事項リスト>
<問題点対策>
<P>XMLとは何かわからない。</P>
</問題点対策>
</業務報告>
<業務報告>
<業務名>検索エンジンの開発</業務名>
<業務コード>S8821-76</業務コード>
<工数管理>
<見積もり工数>120</見積もり工数>
<実績工数>6</実績工数>
<当月見積もり工数>32</当月見積もり工数>
<当月実績工数>2</当月実績工数>
</工数管理>
<予定項目リスト>
<予定項目>
<P><A href="http://www.goo.ne.jp">goo</A>の機能を調べてみる</P>
</予定項目>
</予定項目リスト>
<実施事項リスト>
<実施事項>
<P>更に、どういう検索エンジンがあるか調査する</P>
</実施事項>
</実施事項リスト>
<上長への要請事項リスト>
<上長への要請事項>
<P>開発をするのはめんどうなので、Yahoo!を買収して下さい。</P>
</上長への要請事項>
</上長への要請事項リスト>
<問題点対策>
<P>検索エンジンで車を走らせることができない。(要調査)</P>
</問題点対策>
</業務報告>
</業務報告リスト>
</週報>
<!--
*************************************************************************
* *
* DPSD PDG週報用DTD weekly.dtd *
* *
* Copyright 1997 Fuji Xerox Information Systems Co.,Ltd. *
* *
*************************************************************************
-->
<!-- 変更履歴
Version 1.0 1997/10/29 作成 村田真
-->
<!ELEMENT 週報 (年月週, 氏名, 業務報告リスト)>
<!ELEMENT 年月週 (年度, 月度, 週)>
<!ELEMENT 年度 (#PCDATA)> <!-- 年度を表す数字 -->
<!ELEMENT 月度 (#PCDATA)> <!-- 月度を表す数字 -->
<!ELEMENT 週 (#PCDATA)> <!-- 何週目かを表す数字
-->
<!ELEMENT 氏名 (氏, 名)>
<!ELEMENT 氏 (#PCDATA)>
<!ELEMENT 名 (#PCDATA)>
<!ELEMENT 業務報告リスト (業務報告+)>
<!ELEMENT 業務報告 (業務名, 業務コード,
工数管理,
予定項目リスト,
実施事項リスト,
上長への要請事項リスト,
問題点対策?)>
<!ELEMENT 業務名 (#PCDATA)> <!--
業務コード一覧を参照 -->
<!ELEMENT 業務コード (#PCDATA)> <!--
業務コード一覧を参照 -->
<!ELEMENT 工数管理 (見積もり工数, 実績工数,
当月見積もり工数,
当月実績工数)>
<!ELEMENT 見積もり工数 (#PCDATA)> <!-- 単位は時間 -->
<!ELEMENT 実績工数 (#PCDATA)> <!-- 単位は時間 -->
<!ELEMENT 当月見積もり工数 (#PCDATA)> <!-- 単位は時間 -->
<!ELEMENT 当月実績工数 (#PCDATA)> <!-- 単位は時間 -->
<!ELEMENT 予定項目リスト (予定項目*)>
<!ELEMENT 予定項目 ((P | OL | UL)+)>
<!ELEMENT 実施事項リスト (実施事項*)>
<!ELEMENT 実施事項 ((P | OL | UL)+)>
<!ELEMENT 問題点対策 ((P | OL | UL)+)>
<!ELEMENT 上長への要請事項リスト (上長への要請事項*)>
<!ELEMENT 上長への要請事項 ((P | OL | UL)+)>
<!-- XMLであらかじめ定義された実体 -->
<!ENTITY lt "&#60;">
<!ENTITY gt ">">
<!ENTITY amp "&#38;">
<!ENTITY apos "'">
<!ENTITY quot """>
<!-- HTMLの汎用的なタグ -->
<!ELEMENT P (#PCDATA | EM | STRONG | A)*>
<!ELEMENT OL (LI)*>
<!ELEMENT UL (LI)*>
<!ELEMENT LI (#PCDATA | EM | STRONG | A)*>
<!ELEMENT EM (#PCDATA | EM | STRONG | A)*>
<!ELEMENT STRONG (#PCDATA | EM | STRONG | A)*>
<!ELEMENT A (#PCDATA | EM | STRONG)*>
<!ATTLIST A
name CDATA #IMPLIED
href CDATA #IMPLIED
>