|
Tak to je super :-) To se na to musim podivat. BTW: Netusite nekdo jestli existuje i nejaky XSLT engine, ktery jde pouzit na obrovske XML soubory? Dik Tom Filip Jirsák napsal(a): V dokumentaci dom4j stojí "event based proccessing mode to support for massive documents or XML streams", ve srovnání s jinými nástroji pro XML se také pyšní tím, že umí "Capable of processing massive documents". Takže by to umět mohlo. Ale prakticky jsem to nezkoušel. Podle dokumentace ale dom4j nemusí držet celý dokument v paměti - umí zpracovávat XML streamy. Ono dom4j jsou vlastně hlavně rozhraní, a pod nimi je na výběr z několika implementací - třeba i ukládání do JavaBeanů nebo XMLProxy - takže záleží na implementaci, co si drží v paměti - třeba ona implementace přes JavaBeany si asi sama v paměti nedrží nic, a záleží na Beanu, kde má data uložená.Filip Jirsák 2005/10/13, Tomas Hubalek <[EMAIL PROTECTED]>:Znamena to, ze muzu nacist do instance org.dom4j.Document i obrovsky soubor? To se mi nezda. Pokud by to tak bylo, tak by se mi to moc hodilo, ale mam obavu ze Dom4j drzi cely document v pameti :-( a ze SAX se pouziva pouze pro parsovani... Tom Ing. Jan Novotný napsal(a): My používáme v kodu Dom4J, umožňuje podsunout implementace jak pro DOM, tak i SAX. Je poměrně jednoduchý a dobře použitelný. Používáme ho sice zatím jen na jednoduché věci (konfigurace apod.), ale vyhovuje. Zkuste se kouknout ještě na něj. H.N. ________________________________ Ing. Jan Novotný analytik návrhář Corpus Solutions a.s. Telefon HK: +420 49 553 21 54 Telefon centrála: +420 24 102 03 33 Email: [EMAIL PROTECTED] WWW: http://www.corpus.cz ________________________________ Tomas Beranek napsal(a): ale jinak k tomu Digester, sice to nepotrebuju, ale chvilku jsem na to koukal a neprijde mi to moc slozite(nestudoval jsem detaily) zvlaste ne pro aplikaci na kterou to potrebuje Ales(tedy nacist a preulozit do DB). prijde mi to rychlejsi nez si to psat SAXem. je to rozhodne zajimavy a diky, ze jste to zde zminili. PS: tak tohle me fakt pobavilo :-) Videl jsem uz XML soubory, ktere by nevesly do pameti sebevetsiho Pecka ani jako Stringy. A takoveto soubory chteli nasi zakaznici posilat jako SOAPove zpravy ;-). A nakonec i poslali :-D ----- Original Message ----- From: "Oto Buchta" <[EMAIL PROTECTED]> To: "Java" <[email protected]> Sent: Thursday, October 13, 2005 12:28 PM Subject: Re: nacteni dat z velkeho xml souboru On Thursday 13 of October 2005 10:30, Ales wrote: Dobry den, resim nacteni dat z vetsiho (velkeho) xml souboru, jedna se cca o 20 MB. Uvedeny soubor vznikl exportem z MySQL databaze. Problem je v tom, ze i pri nastaveni Xms 30m mi vyhazuje OutOfmemory:Java heap space. Je nejake omezeni (nemyslim technicke, ale pro prakticke pouziti) , kdy jeste data ukladat do xml souboru a kdy jiz starost o data predat nejake databazi? Pro ukazku prikladam kod tridy, ve ktere se snazim nacist uvedeny soubor Musim se priznat, ze nacitat 20MB XMLcko do DOMu mi prijde trosku ulitnute, obzvlaste kdyz nemas nastavene -Xmx na alespon 512MB ;-) Videl jsem uz XML soubory, ktere by nevesly do pameti sebevetsiho Pecka ani jako Stringy. A takoveto soubory chteli nasi zakaznici posilat jako SOAPove zpravy ;-). A nakonec i poslali :-D Opravdu to vyznam ma a pracovat se s tim da. Jinak pokud znas dobre strukturu XMLcka a ma to byt jednoucelova aplikace, tak bych doporucoval reseni ala IBM a WS Interopy - StringTokenizer a Regex ;-) Pokud ale potrebujes plnou silu XML (entity, include,...), tak se neobejdes bez SAXu. A pro tento pripad mi prijde ucit se Digester jako studovat navod na sestaveni kanonu na vrabce... To se radeji nauc SAX;-) -- Oto 'tapik' Buchta, [EMAIL PROTECTED] Senior Engineer, Systinet Corp, http://www.systinet.com -- No virus found in this incoming message. Checked by AVG Anti-Virus. Version: 7.0.344 / Virus Database: 267.11.13/126 - Release Date: 9.10.2005-- Filip Jirsák [EMAIL PROTECTED] |
- Re: nacteni dat z velkeho xml souboru Tomas Hubalek
