or this:

http://pc-alessio:8983/*WoWSolrWebApp/search?query=gioco&submit=Search*


---------- Messaggio inoltrato ----------
Da: alessio crisantemi <[email protected]>
Date: 06 aprile 2012 22:42
Oggetto: Re: request about snippets (with attachement)
A: [email protected]



that's can be good?
http://192.168.1.5:8983/WoWSolrWebApp/search?query=gioco&submit=Search
Il giorno 06 aprile 2012 22:29, Lewis John Mcgibbney <
[email protected]> ha scritto:

It would be easier if you could provide an URL and people can see exactly
> what you are struggling with please?
>
>
> 2012/4/6 alessio crisantemi <[email protected]>
>
> > any suggestions for my cause?
> >
> > Il giorno 05 aprile 2012 23:20, alessio crisantemi <
> > [email protected]> ha scritto:
> >
> > > here a part of results:
> > >
> > >  [2] Live Score - GiocoNews - Tutto su casinò, poker, giochi online<
> > http://www.gioconews.it/live-score.html>  Live
> > > Score - *Gioco*News - Tutto su casinò, poker, giochi online Mercoledì
> Apr
> > > 04 Home NEWSLOT/VLT SCOMMESSE ONLINE LOTTERIE Politica Video Live Score
> > > Home Live Score Questa opzione non funziona ... correttamente.
> > > Sfortunatamente, il tuo browser non supporta gli Inline Frame
> Visualizza
> > *
> > > Gioco*News sul tuo Smart Phone Detect Version | Versione Mobile |
> > > Versione Standard Ripristina configurazione standard ... © Copyright
> 2012
> > > *Gioco*News.it powered by GNMedia s.r.l. P.iva 01419700552, Tutti i
> > > diritti riservati  http://www.gioconews.it/live-score.html    [3]
> Curcio
> > > (Sapar): "Sviluppo consapevole del gioco da parte di tutti gli
> > operatori" -
> > > GiocoNe<
> >
> http://www.gioconews.it/generale/curcio-sapar-sviluppo-consapevole-del-gioco-da-parte-di-tutti-gli-operatori-23848.html
> >
> >  Curcio
> > > (Sapar): "Sviluppo consapevole del *gioco* da parte di tutti gli
> > > operatori" - *Gioco*News - Tutto su casinò, poker, giochi online
> > > Mercoledì Apr 04 parent"> Home NEWSLOT/VLT SCOMMESSE ... ONLINE
> LOTTERIE
> > > Politica Video Live Score Home NEWSLOT/VLT Generale Curcio (Sapar):
> > > "Sviluppo consapevole del *gioco* da parte di tutti gli operatori" HOT
> > > NEWS Turchi (Aams): ?Scommesse, è far west in Italia ... , ...
> Serpelloni
> > > (Dip. Antidroga): ?Sul *gioco* necessarie... » Servono ?linee di
> > > indirizzo comuni a livello nazionale" per riuscire a monitorare il
> > fenom...
> > > Curcio (Sapar): "Sviluppo consapevole del *gioco* da... » ?Da ... ,
> > > ottenuto nei... Cronache Esteri Ippica Videogiochi Bingo Normativa
> > *Gioco*e Fisco Personaggi Flipper Sfoglia Rivista Curcio (Sapar):
> "Sviluppo
> > > consapevole del *gioco* da parte di tutti gli operatori" Scritto da ...
> > > Sm Mercoledì 04 Aprile 2012 16:45 ?Da parte della commissione c?è
> > l?intento
> > > di approfondire i numeri in possesso e i dati del settore del *gioco*.
> Da
> > > parte nostra abbiamo cercato di chiarire le cifre e
> > >
> >
> http://www.gioconews.it/generale/curcio-sapar-sviluppo-consapevole-del-gioco-da-parte-di-tutti-gli-operatori-23848.html
> > > [4] Serpelloni (Dip. Antidroga): ?Sul gioco necessarie linee di
> indirizzo
> > > per la cura delle patologie? -<
> >
> http://www.gioconews.it/generale/serpelloni-dip.-antidroga-sul-gioco-necessarie-linee-di-indirizzo-per-la-cura-delle-patologie-23847.html
> >
> >  Serpelloni
> > > (Dip. Antidroga): ?Sul *gioco* necessarie linee di indirizzo per la
> cura
> > > delle patologie? - *Gioco*News - Tutto su casinò, poker, giochi online
> > > Mercoledì Apr 04 parent"> Home NEWSLOT ... /VLT SCOMMESSE ONLINE
> LOTTERIE
> > > Politica Video Live Score Home Politica Generale Serpelloni (Dip.
> > > Antidroga): ?Sul *gioco* necessarie linee di indirizzo per la cura
> delle
> > > patologie? HOT NEWS Turchi (Aams): ?Scommesse ... a tutti gli eccessi,
> > ...
> > > Serpelloni (Dip. Antidroga): ?Sul *gioco* necessarie... » Servono
> ?linee
> > > di indirizzo comuni a livello nazionale" per riuscire a monitorare il
> > > fenom... Curcio (Sapar): "Sviluppo ... consapevole del *gioco* da... »
> > > ?Da parte della commissione c?è l?intento di approfondire i numeri in
> > > possesso e i dati de... Scommesse sportive: il 9 aprile apertura
> > > anticipat... » Aams comunica che, per la ... montepremi complessivo
> delle
> > > vincite, ottenuto nei... Cronache Esteri Ippica Videogiochi Bingo
> > Normativa
> > > *Gioco* e Fisco Personaggi Flipper Sfoglia Rivista Serpelloni (Dip.
> > > Antidroga): ?Sul *gioco* necessarie
> > >
> >
> http://www.gioconews.it/generale/serpelloni-dip.-antidroga-sul-gioco-necessarie-linee-di-indirizzo-per-la-cura-delle-patologie-23847.html
> > > [5] Generale - GiocoNews - Tutto su casinò, poker, giochi online<
> > http://www.gioconews.it/generale/index.php>  Generale
> > > - *Gioco*News - Tutto su casinò, poker, giochi online Mercoledì Apr 04
> > > parent"> Home NEWSLOT/VLT SCOMMESSE ONLINE LOTTERIE Politica Video Live
> > > Score Home Politica Generale HOT NEWS Turchi ... sensibili e attenti a
> > > tutti gli eccessi, ... Serpelloni (Dip. Antidroga): ?Sul
> > *gioco*necessarie... » Servono ?linee di indirizzo comuni a livello
> > nazionale" per
> > > riuscire a monitorare il fenom... Curcio (Sapar ... ): "Sviluppo
> > > consapevole del *gioco* da... » ?Da parte della commissione c?è
> l?intento
> > > di approfondire i numeri in possesso e i dati de... Scommesse sportive:
> > il
> > > 9 aprile apertura anticipat... » Aams comunica che ... previsto, il
> > > montepremi complessivo delle vincite, ottenuto nei... Cronache Esteri
> > > Ippica Videogiochi Bingo Normativa *Gioco* e Fisco Personaggi Flipper
> > > Sfoglia Rivista Generale Filtro Mostra # 5 10 15 20 25 ... 30 50 100
> > Tutti
> > > # Titolo articolo Autore 1 Decreto fiscale: via libera del Senato al
> > > maxiemendamento e a tutte le norme sui giochi Amr 2 Serpelloni (Dip.
> > > Antidroga): ?Sul *gioco* necessarie linee di
> > > http://www.gioconews.it/generale/index.php    [6] Video - GiocoNews -
> > > Tutto su casinò, poker, giochi online <
> > http://www.gioconews.it/video.html>  Video
> > > - *Gioco*News - Tutto su casinò, poker, giochi online Mercoledì Apr 04
> > > parent"> Home NEWSLOT/VLT SCOMMESSE ONLINE LOTTERIE Politica Video Live
> > > Score Home Video HOT NEWS Turchi (Aams ... a tutti gli eccessi, ...
> > > Serpelloni (Dip. Antidroga): ?Sul *gioco* necessarie... » Servono
> ?linee
> > > di indirizzo comuni a livello nazionale" per riuscire a monitorare il
> > > fenom... Curcio (Sapar): "Sviluppo ... consapevole del *gioco* da... »
> > > ?Da parte della commissione c?è l?intento di approfondire i numeri in
> > > possesso e i dati de... Scommesse sportive: il 9 aprile apertura
> > > anticipat... » Aams comunica che, per la ... Iori, presidente Conagga,
> al
> > > convegno dedicato al *gioco*... Visualizzazioni: 238 Da: redazione
> > > Intervista a Francesco... Categoria: News - Interviste Intervista a
> > > Francesco Ginestra presidente di Asso ... Snai Visualizzazioni: 169 Da:
> > > redazione Il Presidente Udc Rocco... Categoria: News - Interviste Il
> > > Presidente Udc Rocco Buttiglione parla di *gioco* e regolamentazione
> > > Visualizzazioni: 192 Da: redazione *Gioco*
> > > http://www.gioconews.it/video.html
> > >
> > > Il giorno 05 aprile 2012 23:02, Lewis John Mcgibbney <
> > > [email protected]> ha scritto:
> > >
> > > I can't see any of your attachments as they're not permitted on list.
> > >>
> > >> Can you provide an URL?
> > >>
> > >> On Thu, Apr 5, 2012 at 9:56 PM, alessio crisantemi <
> > >> [email protected]> wrote:
> > >>
> > >> > Dear Lewis, thank you for your fast reply.
> > >> > But just thiat's my problem! I don't compred wich is the field that
> > >> crates
> > >> > this raw.
> > >> >
> > >> > But I see a date (eg: "Mercoledì Apr 04") followed by the word
> > "parent"
> > >> > anche after ">" and the the ame of categories (Home NEWSLOT/VLT
> > >> SCOMMESSE
> > >> > ONLINE LOTTERIE Politica Video Live Score").
> > >> >
> > >> > Do you know wich field of default nutch configuration generate the
> > >> 'parent'
> > >> > raw.
> > >> >
> > >> > as you can see in the attachement, this raw is into the content
> field,
> > >> > between 'str' tags.
> > >> > ..
> > >> > suggestions?
> > >> > tx
> > >> > a.
> > >> >
> > >> > Il giorno 05 aprile 2012 22:45, Lewis John Mcgibbney <
> > >> > [email protected]> ha scritto:
> > >> >
> > >> > > Hi Alessio,
> > >> > >
> > >> > > You need to determine in which field the unwanted content exists.
> > Once
> > >> > > you've done this you could write an indexing filter to remove this
> > >> from
> > >> > > your document prior to indexing.
> > >> > >
> > >> > > Lewis
> > >> > >
> > >> > > On Thu, Apr 5, 2012 at 9:41 PM, alessio crisantemi <
> > >> > > [email protected]> wrote:
> > >> > >
> > >> > > >
> > >> > > >
> > >> > > > ---------- Messaggio inoltrato ----------
> > >> > > > Da: alessio crisantemi <[email protected]>
> > >> > > > Date: 05 aprile 2012 22:32
> > >> > > > Oggetto: request about snippets
> > >> > > > A: [email protected]
> > >> > > >
> > >> > > >
> > >> > > > Dear all,
> > >> > > > I configured my Nutch (1.4) for works with Solr (1.4.1) and I
> > crawl
> > >> and
> > >> > > > index with success my website.
> > >> > > >
> > >> > > > I have only a problem with the results of my researches.
> > >> > > > Into all results, the snippets have a raw with a string where I
> > can
> > >> > read
> > >> > > > all the categories of my website. I attached a screen shot for
> > >> explain:
> > >> > > > here, the no good raw is "Mercoledì Apr 04 parent"> Home
> > NEWSLOT/VLT
> > >> > > > SCOMMESSE ONLINE LOTTERIE Politica Video Live Score ")
> > >> > > >
> > >> > > > This is a problem, because if solr read for any page the same
> raw,
> > >> when
> > >> > > my
> > >> > > > query is the same word of this raw (eg: 'ONLINe') I have all my
> > solr
> > >> > > index
> > >> > > > like a result.
> > >> > > >
> > >> > > > When I can jump this raw during my crawling? Is possible exclude
> > >> this
> > >> > > raw?
> > >> > > > thank you in adavande
> > >> > > > alessio
> > >> > > >
> > >> > > >
> > >> > >
> > >> > >
> > >> > > --
> > >> > > *Lewis*
> > >> > >
> > >> >
> > >>
> > >>
> > >>
> > >> --
> > >> *Lewis*
> > >>
> > >
> > >
> >
>
>
>
> --
> *Lewis*
>

Reply via email to