no Lewis,
I'm sorry for missunderstanding!

But I dont's know this link, beacause this row, it's a fixed raow on my
website template.
And also if i see the source code of my html home page, I can't see this
row.

So, I can only read this link on my xml results from solr:
this is a snippet between my results:

-<leaf label="" id="VF162"> <webpage title="Nuove regole sulle slot
machine: la Grecia invia proposta alla Commissione Ue - GiocoNews - Tutto
su" rank="30" url="
http://www.gioconews.it/generale/nuove-regole-sulle-slot-machine-la-grecia-invia-proposta-alla-commissione-ue-23813.html";>
Nuove regole sulle slot machine: la Grecia invia proposta alla Commissione
Ue - GiocoNews - Tutto su casinò, poker, giochi online     Mercoledì Apr 04
parent"> Home NEWSLOT/VLT SCOMMESSE ONLINE ... LOTTERIE Politica Video Live
Score Home Esteri Generale Nuove regole sulle slot machine: la Grecia invia
proposta alla Commissione Ue HOT NEWS Turchi (Aams): “Scommesse, è far west
in Italia: m... » "Non ... ... Cronache Esteri Ippica Videogiochi Bingo
Normativa Gioco e Fisco Personaggi Flipper Sfoglia Rivista Nuove regole
sulle slot machine: la Grecia invia proposta alla Commissione Ue Scritto da
Sm Mercoledì 04 ... : #FF9900;
}//-->slot-machine-la-grecia-invia-proposta-alla-commissione-ue-23813.html"
target="_blank">Nuove regole ... sulle slot machine: la Grecia invia
proposta alla Commissione UeMercoledì 04 Aprile 2012© 2012 - <a href
</webpage> </leaf>




this is the row is that i don't want on m results: "GiocoNews - Tutto su
casinò, poker, giochi online Mercoledì Apr 04 parent"> Home NEWSLOT/VLT
SCOMMESSE ONLINE ... LOTTERIE "

thanx
alessio


Il giorno 07 aprile 2012 12:09, Lewis John Mcgibbney <
[email protected]> ha scritto:

> No I mean the URL that you are having trouble with not your solr server and
> port number plus search query...
>
> If you can provide the URL you wish to remove some particular HTML tag from
> then at least we can see what it is that you are having trouble with. Sorry
> if I've not made myself clear enough.
>
> Lewis
>
> 2012/4/6 alessio crisantemi <[email protected]>
>
> > or this:
> >
> > http://pc-alessio:8983/*WoWSolrWebApp/search?query=gioco&submit=Search*
> >
> >
> > ---------- Messaggio inoltrato ----------
> > Da: alessio crisantemi <[email protected]>
> > Date: 06 aprile 2012 22:42
> > Oggetto: Re: request about snippets (with attachement)
> > A: [email protected]
> >
> >
> >
> > that's can be good?
> > http://192.168.1.5:8983/WoWSolrWebApp/search?query=gioco&submit=Search
> > Il giorno 06 aprile 2012 22:29, Lewis John Mcgibbney <
> > [email protected]> ha scritto:
> >
> > It would be easier if you could provide an URL and people can see exactly
> > > what you are struggling with please?
> > >
> > >
> > > 2012/4/6 alessio crisantemi <[email protected]>
> > >
> > > > any suggestions for my cause?
> > > >
> > > > Il giorno 05 aprile 2012 23:20, alessio crisantemi <
> > > > [email protected]> ha scritto:
> > > >
> > > > > here a part of results:
> > > > >
> > > > >  [2] Live Score - GiocoNews - Tutto su casinò, poker, giochi
> online<
> > > > http://www.gioconews.it/live-score.html>  Live
> > > > > Score - *Gioco*News - Tutto su casinò, poker, giochi online
> Mercoledì
> > > Apr
> > > > > 04 Home NEWSLOT/VLT SCOMMESSE ONLINE LOTTERIE Politica Video Live
> > Score
> > > > > Home Live Score Questa opzione non funziona ... correttamente.
> > > > > Sfortunatamente, il tuo browser non supporta gli Inline Frame
> > > Visualizza
> > > > *
> > > > > Gioco*News sul tuo Smart Phone Detect Version | Versione Mobile |
> > > > > Versione Standard Ripristina configurazione standard ... ©
> Copyright
> > > 2012
> > > > > *Gioco*News.it powered by GNMedia s.r.l. P.iva 01419700552, Tutti i
> > > > > diritti riservati  http://www.gioconews.it/live-score.html    [3]
> > > Curcio
> > > > > (Sapar): "Sviluppo consapevole del gioco da parte di tutti gli
> > > > operatori" -
> > > > > GiocoNe<
> > > >
> > >
> >
> http://www.gioconews.it/generale/curcio-sapar-sviluppo-consapevole-del-gioco-da-parte-di-tutti-gli-operatori-23848.html
> > > >
> > > >  Curcio
> > > > > (Sapar): "Sviluppo consapevole del *gioco* da parte di tutti gli
> > > > > operatori" - *Gioco*News - Tutto su casinò, poker, giochi online
> > > > > Mercoledì Apr 04 parent"> Home NEWSLOT/VLT SCOMMESSE ... ONLINE
> > > LOTTERIE
> > > > > Politica Video Live Score Home NEWSLOT/VLT Generale Curcio (Sapar):
> > > > > "Sviluppo consapevole del *gioco* da parte di tutti gli operatori"
> > HOT
> > > > > NEWS Turchi (Aams): ?Scommesse, è far west in Italia ... , ...
> > > Serpelloni
> > > > > (Dip. Antidroga): ?Sul *gioco* necessarie... » Servono ?linee di
> > > > > indirizzo comuni a livello nazionale" per riuscire a monitorare il
> > > > fenom...
> > > > > Curcio (Sapar): "Sviluppo consapevole del *gioco* da... » ?Da ... ,
> > > > > ottenuto nei... Cronache Esteri Ippica Videogiochi Bingo Normativa
> > > > *Gioco*e Fisco Personaggi Flipper Sfoglia Rivista Curcio (Sapar):
> > > "Sviluppo
> > > > > consapevole del *gioco* da parte di tutti gli operatori" Scritto da
> > ...
> > > > > Sm Mercoledì 04 Aprile 2012 16:45 ?Da parte della commissione c?è
> > > > l?intento
> > > > > di approfondire i numeri in possesso e i dati del settore del
> > *gioco*.
> > > Da
> > > > > parte nostra abbiamo cercato di chiarire le cifre e
> > > > >
> > > >
> > >
> >
> http://www.gioconews.it/generale/curcio-sapar-sviluppo-consapevole-del-gioco-da-parte-di-tutti-gli-operatori-23848.html
> > > > > [4] Serpelloni (Dip. Antidroga): ?Sul gioco necessarie linee di
> > > indirizzo
> > > > > per la cura delle patologie? -<
> > > >
> > >
> >
> http://www.gioconews.it/generale/serpelloni-dip.-antidroga-sul-gioco-necessarie-linee-di-indirizzo-per-la-cura-delle-patologie-23847.html
> > > >
> > > >  Serpelloni
> > > > > (Dip. Antidroga): ?Sul *gioco* necessarie linee di indirizzo per la
> > > cura
> > > > > delle patologie? - *Gioco*News - Tutto su casinò, poker, giochi
> > online
> > > > > Mercoledì Apr 04 parent"> Home NEWSLOT ... /VLT SCOMMESSE ONLINE
> > > LOTTERIE
> > > > > Politica Video Live Score Home Politica Generale Serpelloni (Dip.
> > > > > Antidroga): ?Sul *gioco* necessarie linee di indirizzo per la cura
> > > delle
> > > > > patologie? HOT NEWS Turchi (Aams): ?Scommesse ... a tutti gli
> > eccessi,
> > > > ...
> > > > > Serpelloni (Dip. Antidroga): ?Sul *gioco* necessarie... » Servono
> > > ?linee
> > > > > di indirizzo comuni a livello nazionale" per riuscire a monitorare
> il
> > > > > fenom... Curcio (Sapar): "Sviluppo ... consapevole del *gioco*
> da...
> > »
> > > > > ?Da parte della commissione c?è l?intento di approfondire i numeri
> in
> > > > > possesso e i dati de... Scommesse sportive: il 9 aprile apertura
> > > > > anticipat... » Aams comunica che, per la ... montepremi complessivo
> > > delle
> > > > > vincite, ottenuto nei... Cronache Esteri Ippica Videogiochi Bingo
> > > > Normativa
> > > > > *Gioco* e Fisco Personaggi Flipper Sfoglia Rivista Serpelloni (Dip.
> > > > > Antidroga): ?Sul *gioco* necessarie
> > > > >
> > > >
> > >
> >
> http://www.gioconews.it/generale/serpelloni-dip.-antidroga-sul-gioco-necessarie-linee-di-indirizzo-per-la-cura-delle-patologie-23847.html
> > > > > [5] Generale - GiocoNews - Tutto su casinò, poker, giochi online<
> > > > http://www.gioconews.it/generale/index.php>  Generale
> > > > > - *Gioco*News - Tutto su casinò, poker, giochi online Mercoledì Apr
> > 04
> > > > > parent"> Home NEWSLOT/VLT SCOMMESSE ONLINE LOTTERIE Politica Video
> > Live
> > > > > Score Home Politica Generale HOT NEWS Turchi ... sensibili e
> attenti
> > a
> > > > > tutti gli eccessi, ... Serpelloni (Dip. Antidroga): ?Sul
> > > > *gioco*necessarie... » Servono ?linee di indirizzo comuni a livello
> > > > nazionale" per
> > > > > riuscire a monitorare il fenom... Curcio (Sapar ... ): "Sviluppo
> > > > > consapevole del *gioco* da... » ?Da parte della commissione c?è
> > > l?intento
> > > > > di approfondire i numeri in possesso e i dati de... Scommesse
> > sportive:
> > > > il
> > > > > 9 aprile apertura anticipat... » Aams comunica che ... previsto, il
> > > > > montepremi complessivo delle vincite, ottenuto nei... Cronache
> Esteri
> > > > > Ippica Videogiochi Bingo Normativa *Gioco* e Fisco Personaggi
> Flipper
> > > > > Sfoglia Rivista Generale Filtro Mostra # 5 10 15 20 25 ... 30 50
> 100
> > > > Tutti
> > > > > # Titolo articolo Autore 1 Decreto fiscale: via libera del Senato
> al
> > > > > maxiemendamento e a tutte le norme sui giochi Amr 2 Serpelloni
> (Dip.
> > > > > Antidroga): ?Sul *gioco* necessarie linee di
> > > > > http://www.gioconews.it/generale/index.php    [6] Video -
> GiocoNews
> > -
> > > > > Tutto su casinò, poker, giochi online <
> > > > http://www.gioconews.it/video.html>  Video
> > > > > - *Gioco*News - Tutto su casinò, poker, giochi online Mercoledì Apr
> > 04
> > > > > parent"> Home NEWSLOT/VLT SCOMMESSE ONLINE LOTTERIE Politica Video
> > Live
> > > > > Score Home Video HOT NEWS Turchi (Aams ... a tutti gli eccessi, ...
> > > > > Serpelloni (Dip. Antidroga): ?Sul *gioco* necessarie... » Servono
> > > ?linee
> > > > > di indirizzo comuni a livello nazionale" per riuscire a monitorare
> il
> > > > > fenom... Curcio (Sapar): "Sviluppo ... consapevole del *gioco*
> da...
> > »
> > > > > ?Da parte della commissione c?è l?intento di approfondire i numeri
> in
> > > > > possesso e i dati de... Scommesse sportive: il 9 aprile apertura
> > > > > anticipat... » Aams comunica che, per la ... Iori, presidente
> > Conagga,
> > > al
> > > > > convegno dedicato al *gioco*... Visualizzazioni: 238 Da: redazione
> > > > > Intervista a Francesco... Categoria: News - Interviste Intervista a
> > > > > Francesco Ginestra presidente di Asso ... Snai Visualizzazioni: 169
> > Da:
> > > > > redazione Il Presidente Udc Rocco... Categoria: News - Interviste
> Il
> > > > > Presidente Udc Rocco Buttiglione parla di *gioco* e
> regolamentazione
> > > > > Visualizzazioni: 192 Da: redazione *Gioco*
> > > > > http://www.gioconews.it/video.html
> > > > >
> > > > > Il giorno 05 aprile 2012 23:02, Lewis John Mcgibbney <
> > > > > [email protected]> ha scritto:
> > > > >
> > > > > I can't see any of your attachments as they're not permitted on
> list.
> > > > >>
> > > > >> Can you provide an URL?
> > > > >>
> > > > >> On Thu, Apr 5, 2012 at 9:56 PM, alessio crisantemi <
> > > > >> [email protected]> wrote:
> > > > >>
> > > > >> > Dear Lewis, thank you for your fast reply.
> > > > >> > But just thiat's my problem! I don't compred wich is the field
> > that
> > > > >> crates
> > > > >> > this raw.
> > > > >> >
> > > > >> > But I see a date (eg: "Mercoledì Apr 04") followed by the word
> > > > "parent"
> > > > >> > anche after ">" and the the ame of categories (Home NEWSLOT/VLT
> > > > >> SCOMMESSE
> > > > >> > ONLINE LOTTERIE Politica Video Live Score").
> > > > >> >
> > > > >> > Do you know wich field of default nutch configuration generate
> the
> > > > >> 'parent'
> > > > >> > raw.
> > > > >> >
> > > > >> > as you can see in the attachement, this raw is into the content
> > > field,
> > > > >> > between 'str' tags.
> > > > >> > ..
> > > > >> > suggestions?
> > > > >> > tx
> > > > >> > a.
> > > > >> >
> > > > >> > Il giorno 05 aprile 2012 22:45, Lewis John Mcgibbney <
> > > > >> > [email protected]> ha scritto:
> > > > >> >
> > > > >> > > Hi Alessio,
> > > > >> > >
> > > > >> > > You need to determine in which field the unwanted content
> > exists.
> > > > Once
> > > > >> > > you've done this you could write an indexing filter to remove
> > this
> > > > >> from
> > > > >> > > your document prior to indexing.
> > > > >> > >
> > > > >> > > Lewis
> > > > >> > >
> > > > >> > > On Thu, Apr 5, 2012 at 9:41 PM, alessio crisantemi <
> > > > >> > > [email protected]> wrote:
> > > > >> > >
> > > > >> > > >
> > > > >> > > >
> > > > >> > > > ---------- Messaggio inoltrato ----------
> > > > >> > > > Da: alessio crisantemi <[email protected]>
> > > > >> > > > Date: 05 aprile 2012 22:32
> > > > >> > > > Oggetto: request about snippets
> > > > >> > > > A: [email protected]
> > > > >> > > >
> > > > >> > > >
> > > > >> > > > Dear all,
> > > > >> > > > I configured my Nutch (1.4) for works with Solr (1.4.1) and
> I
> > > > crawl
> > > > >> and
> > > > >> > > > index with success my website.
> > > > >> > > >
> > > > >> > > > I have only a problem with the results of my researches.
> > > > >> > > > Into all results, the snippets have a raw with a string
> where
> > I
> > > > can
> > > > >> > read
> > > > >> > > > all the categories of my website. I attached a screen shot
> for
> > > > >> explain:
> > > > >> > > > here, the no good raw is "Mercoledì Apr 04 parent"> Home
> > > > NEWSLOT/VLT
> > > > >> > > > SCOMMESSE ONLINE LOTTERIE Politica Video Live Score ")
> > > > >> > > >
> > > > >> > > > This is a problem, because if solr read for any page the
> same
> > > raw,
> > > > >> when
> > > > >> > > my
> > > > >> > > > query is the same word of this raw (eg: 'ONLINe') I have all
> > my
> > > > solr
> > > > >> > > index
> > > > >> > > > like a result.
> > > > >> > > >
> > > > >> > > > When I can jump this raw during my crawling? Is possible
> > exclude
> > > > >> this
> > > > >> > > raw?
> > > > >> > > > thank you in adavande
> > > > >> > > > alessio
> > > > >> > > >
> > > > >> > > >
> > > > >> > >
> > > > >> > >
> > > > >> > > --
> > > > >> > > *Lewis*
> > > > >> > >
> > > > >> >
> > > > >>
> > > > >>
> > > > >>
> > > > >> --
> > > > >> *Lewis*
> > > > >>
> > > > >
> > > > >
> > > >
> > >
> > >
> > >
> > > --
> > > *Lewis*
> > >
> >
>
>
>
> --
> *Lewis*
>

Reply via email to