Hi - yes, we have seen that too at municipal and other government sites, maybe 
ignorance or whatever. Anyway, you besides URL filter checking you can add 
robots.txt to the list of what-is-going-on-reasons, or log at debug level, 
which i do not recommend.

Markus

 
 
-----Original message-----
> From:Jigal van Hemert | alterNET internet BV <[email protected]>
> Sent: Wednesday 1st October 2014 8:54
> To: [email protected]
> Subject: Re: Why are specific URLs not fetched?
> 
> Hi,
> 
> On 30 September 2014 11:29, Markus Jelsma <[email protected]> wrote:
> > Ah, check this out:
> >
> > markus@chillout:~$ curl http://lochem.raadsinformatie.nl/robots
> > User-agent: *
> > Disallow: /
> 
> Oh no <facepalm>. I never imagined that they would have set this on
> their own public site with information about city council meetings.
> But this explains the behaviour.
> 
> Would've been nice of course if there was a short notification in the
> Nutch log / output though.
> 
> Thanks for thinking about this obvious option!
> 
> -- 
> 
> Met vriendelijke groet,
> 
> 
> Jigal van Hemert | Ontwikkelaar
> 
> 
> 
> Langesteijn 124
> 3342LG Hendrik-Ido-Ambacht
> 
> T. +31 (0)78 635 1200
> F. +31 (0)848 34 9697
> KvK. 23 09 28 65
> 
> [email protected]
> www.alternet.nl
> 
> 
> Disclaimer:
> Dit bericht (inclusief eventuele bijlagen) kan vertrouwelijke
> informatie bevatten. Als u niet de beoogde ontvanger bent van dit
> bericht, neem dan direct per e-mail of telefoon contact op met de
> verzender en verwijder dit bericht van uw systeem. Het is niet
> toegestaan de inhoud van dit bericht op welke wijze dan ook te delen
> met derden of anderszins openbaar te maken zonder schriftelijke
> toestemming van alterNET Internet BV. U wordt geadviseerd altijd
> bijlagen te scannen op virussen. AlterNET kan op geen enkele wijze
> verantwoordelijk worden gesteld voor geleden schade als gevolg van
> virussen.
> 
> Alle eventueel genoemde prijzen S.E. & O., excl. 21% BTW, excl.
> reiskosten. Op al onze prijsopgaven, offertes, overeenkomsten, en
> diensten zijn, met uitzondering van alle andere voorwaarden, de
> Algemene Voorwaarden van alterNET Internet B.V. van toepassing. Op al
> onze domeinregistraties en hostingactiviteiten zijn tevens onze
> aanvullende hostingvoorwaarden van toepassing. Dit bericht is
> uitsluitend bedoeld voor de geadresseerde. Aan dit bericht kunnen geen
> rechten worden ontleend.
> 
> ! Bedenk voordat je deze email uitprint, of dit werkelijk nodig is !
> 

Reply via email to