hi, i use this command:

bin/nutch parsechecker -dumpText
http://www.irna.ir/News/30786427/سوء-استفاده-از-نام-كمیته-امداد-برای-جمع-آوری-رای-در-مناطق-محروم/سياسي/
 
 
and see log:

fetching:
http://www.irna.ir/News/30786427/سوء-استفاده-از-نام-كمیته-امداد-برای-جمع-آوری-رای-در-مناطق-محروم/سياسي/
parsing:
http://www.irna.ir/News/30786427/سوء-استفاده-از-نام-كمیته-امداد-برای-جمع-آوری-رای-در-مناطق-محروم/سياسي/
contentType: text/html
---------
Url
---------------
http://www.irna.ir/News/30786427/سوء-استفاده-از-نام-كمیته-امداد-برای-جمع-آوری-رای-در-مناطق-محروم/سياسي/---------
ParseData
---------
Version: 5
Status: success(1,0)
Title: Bad Request
Outlinks: 0
Content Metadata: Date=Wed, 01 Feb 2012 10:04:04 GMT Content-Length=324
Connection=close Content-Type=text/html; charset=us-ascii
Server=Microsoft-HTTPAPI/2.0 
Parse Metadata: CharEncodingForConversion=us-ascii
OriginalCharEncoding=us-ascii 
---------
ParseText
---------
Bad Request Bad Request - Invalid URL HTTP Error 400. The request URL is
invalid.



i have Bad Request. why? how i fix this error?

--
View this message in context: 
http://lucene.472066.n3.nabble.com/why-nutch-dosen-t-crawl-all-links-tp3702031p3706518.html
Sent from the Nutch - User mailing list archive at Nabble.com.

Reply via email to