hi, i use this command: bin/nutch parsechecker -dumpText http://www.irna.ir/News/30786427/سوء-استفاده-از-نام-كمیته-امداد-برای-جمع-آوری-رای-در-مناطق-محروم/سياسي/ and see log:
fetching: http://www.irna.ir/News/30786427/سوء-استفاده-از-نام-كمیته-امداد-برای-جمع-آوری-رای-در-مناطق-محروم/سياسي/ parsing: http://www.irna.ir/News/30786427/سوء-استفاده-از-نام-كمیته-امداد-برای-جمع-آوری-رای-در-مناطق-محروم/سياسي/ contentType: text/html --------- Url --------------- http://www.irna.ir/News/30786427/سوء-استفاده-از-نام-كمیته-امداد-برای-جمع-آوری-رای-در-مناطق-محروم/سياسي/--------- ParseData --------- Version: 5 Status: success(1,0) Title: Bad Request Outlinks: 0 Content Metadata: Date=Wed, 01 Feb 2012 10:04:04 GMT Content-Length=324 Connection=close Content-Type=text/html; charset=us-ascii Server=Microsoft-HTTPAPI/2.0 Parse Metadata: CharEncodingForConversion=us-ascii OriginalCharEncoding=us-ascii --------- ParseText --------- Bad Request Bad Request - Invalid URL HTTP Error 400. The request URL is invalid. i have Bad Request. why? how i fix this error? -- View this message in context: http://lucene.472066.n3.nabble.com/why-nutch-dosen-t-crawl-all-links-tp3702031p3706518.html Sent from the Nutch - User mailing list archive at Nabble.com.