[Nutch-dev] [jira] Commented: (NUTCH-339) Refactor nutch to allow fetcher improvements

2006-11-28 Thread Andrzej Bialecki (JIRA)
[ http://issues.apache.org/jira/browse/NUTCH-339?page=comments#action_12453820 ] Andrzej Bialecki commented on NUTCH-339: - This looks weird, if anything it rather seems caused by a bug in Hadoop - are you able to run readseg -dump on

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] 代理公司

2006-11-28 Thread zxcvbnm456a
安达成(深圳)贸易有限公司 您好! 本公司有额外发票代开: 详情:本公司有普通发票代开(商品销售、广告、运输、服务、 建筑、餐饮票等)。本公司发票以低点数向外代开,另有增值发 票、海关缴款书,可作帐或抵扣,欢迎客户来电洽谈。 由本公司代开发票可在网上或税务局验证 商祺: 联系人:张朝华 手 机:13691874765 邮 [EMAIL

[Nutch-dev] [jira] Commented: (NUTCH-233) wrong regular expression hang reduce process for ever

2006-11-28 Thread Sean Dean (JIRA)
[ http://issues.apache.org/jira/browse/NUTCH-233?page=comments#action_12453919 ] Sean Dean commented on NUTCH-233: - Could I suggest that this change, from .*(/.+?)/.*?\1/.*?\1/ to .*(/[^/]+)/[^/]+\1/[^/]+\1/ be committed to at least trunk for

[Nutch-dev] updating index without refetching

2006-11-28 Thread DS jha
Hi All, Is it possible to update the index without refetching everything? I have changed logic of one of my plugins (which also sets a custom field in the index) - and I would like this field to get updated without refetching everything - is it doable? Thanks,

[Nutch-dev] (no subject)

2006-11-28 Thread [EMAIL PROTECTED]
深圳市泰丰实业有限公司 您好!(首先,对我的冒昧来函向您致歉,但愿这封函对贵司有所帮助) 因我司进项较多,每个月有余剩的些票据可向外提供 ;互惠互益以解贵司业务运作补帐`作帐的燃眉之急;提供如下票据服务: ★普通国税.地税(商品销售,运输.广告. 餐饮,咨询服务.建筑安装票据及加工修理等代收1.5%-2%) ★(海关代征交款书代收5%)(增值类票据代收7%) *所有票据均为税务局领出或由企业直接开出,并可上网查询或税务验证后付款的方式与贵司合作. 欢迎来电咨询洽谈. 本信息长期有效并承诺可先验票后付款

[Nutch-dev] [jira] Commented: (NUTCH-407) Make Nutch crawling parent directories for file protocol configurable

2006-11-28 Thread Alan Tanaman (JIRA)
[ http://issues.apache.org/jira/browse/NUTCH-407?page=comments#action_12453932 ] Alan Tanaman commented on NUTCH-407: In our team we feel that this patch would have been beneficial in practical terms. In the context of the enterprise

Re: [Nutch-dev] updating index without refitting

2006-11-28 Thread DS jha
new field's data is also stored as a meta data - value is assigned during parse process and then during index, it reads meta-data field value and adds it to an index. Looks like, I will have to run parse and index again. Thanks much. On 11/28/06, Gal Nitzan [EMAIL PROTECTED] wrote: Hi, You

[Nutch-dev] [jira] Commented: (NUTCH-339) Refactor nutch to allow fetcher improvements

2006-11-28 Thread Sami Siren (JIRA)
[ http://issues.apache.org/jira/browse/NUTCH-339?page=comments#action_12453975 ] Sami Siren commented on NUTCH-339: -- perhaps thath exception is just a consequence of something other like this: 2006-11-27 07:35:09,434 INFO fetcher.Fetcher2 -

[Nutch-dev] [jira] Commented: (NUTCH-339) Refactor nutch to allow fetcher improvements

2006-11-28 Thread Andrzej Bialecki (JIRA)
[ http://issues.apache.org/jira/browse/NUTCH-339?page=comments#action_12453989 ] Andrzej Bialecki commented on NUTCH-339: - Ah, we are getting somewhere ... fetchQueues.totalSize=0 means that all input entries from the queues have been

[Nutch-dev] 资料

2006-11-28 Thread 金先生
业务简介: 本公司与多家公司企业有业务往来,可以为您提供税务代理代开发票相关 信息咨询,具体包括:普通国税商品销售业、运输业、建筑业、建筑安装 业、广告业、其它服务行业、餐饮业等。所有票据均可上网查询验证!欢 迎咨询! 贵企业(公司)若有以下情况请来电联系: 1.公司为一般纳税企业没有优惠政策而想减低税率的; 2.对外销售商品或提供技术服务而本公司暂未领正式发票的; 3.外出采购或公干而服务商没有提供可以报销的发票; 4.公司帐目进项与出项差额过大,需补充差额的。 5. 公司在做帐或进销存方面如需用到的。 所有票据均可上网查询验证!欢迎咨询!

[Nutch-dev] 资料

2006-11-28 Thread 金先生
业务简介: 本公司与多家公司企业有业务往来,可以为您提供税务代理代开发票相关 信息咨询,具体包括:普通国税商品销售业、运输业、建筑业、建筑安装 业、广告业、其它服务行业、餐饮业等。所有票据均可上网查询验证!欢 迎咨询! 贵企业(公司)若有以下情况请来电联系: 1.公司为一般纳税企业没有优惠政策而想减低税率的; 2.对外销售商品或提供技术服务而本公司暂未领正式发票的; 3.外出采购或公干而服务商没有提供可以报销的发票; 4.公司帐目进项与出项差额过大,需补充差额的。 5. 公司在做帐或进销存方面如需用到的。 所有票据均可上网查询验证!欢迎咨询!

[Nutch-dev] [jira] Commented: (NUTCH-339) Refactor nutch to allow fetcher improvements

2006-11-28 Thread Sami Siren (JIRA)
[ http://issues.apache.org/jira/browse/NUTCH-339?page=comments#action_12454045 ] Sami Siren commented on NUTCH-339: -- I am running with 300 thread, and in parsing mode thread dump shows: 191 threads waiting on condition at

[Nutch-dev] 资料

2006-11-28 Thread 金先生
业务简介: 本公司与多家公司企业有业务往来,可以为您提供税务代理代开发票相关 信息咨询,具体包括:普通国税商品销售业、运输业、建筑业、建筑安装 业、广告业、其它服务行业、餐饮业等。所有票据均可上网查询验证!欢 迎咨询! 贵企业(公司)若有以下情况请来电联系: 1.公司为一般纳税企业没有优惠政策而想减低税率的; 2.对外销售商品或提供技术服务而本公司暂未领正式发票的; 3.外出采购或公干而服务商没有提供可以报销的发票; 4.公司帐目进项与出项差额过大,需补充差额的。 5. 公司在做帐或进销存方面如需用到的。 所有票据均可上网查询验证!欢迎咨询!

[Nutch-dev] 资料

2006-11-28 Thread 金先生
业务简介: 本公司与多家公司企业有业务往来,可以为您提供税务代理代开发票相关 信息咨询,具体包括:普通国税商品销售业、运输业、建筑业、建筑安装 业、广告业、其它服务行业、餐饮业等。所有票据均可上网查询验证!欢 迎咨询! 贵企业(公司)若有以下情况请来电联系: 1.公司为一般纳税企业没有优惠政策而想减低税率的; 2.对外销售商品或提供技术服务而本公司暂未领正式发票的; 3.外出采购或公干而服务商没有提供可以报销的发票; 4.公司帐目进项与出项差额过大,需补充差额的。 5. 公司在做帐或进销存方面如需用到的。 所有票据均可上网查询验证!欢迎咨询!

[Nutch-dev] 资料

2006-11-28 Thread 金先生
业务简介: 本公司与多家公司企业有业务往来,可以为您提供税务代理代开发票相关 信息咨询,具体包括:普通国税商品销售业、运输业、建筑业、建筑安装 业、广告业、其它服务行业、餐饮业等。所有票据均可上网查询验证!欢 迎咨询! 贵企业(公司)若有以下情况请来电联系: 1.公司为一般纳税企业没有优惠政策而想减低税率的; 2.对外销售商品或提供技术服务而本公司暂未领正式发票的; 3.外出采购或公干而服务商没有提供可以报销的发票; 4.公司帐目进项与出项差额过大,需补充差额的。 5. 公司在做帐或进销存方面如需用到的。 所有票据均可上网查询验证!欢迎咨询!

[Nutch-dev] 资料

2006-11-28 Thread 金先生
业务简介: 本公司与多家公司企业有业务往来,可以为您提供税务代理代开发票相关 信息咨询,具体包括:普通国税商品销售业、运输业、建筑业、建筑安装 业、广告业、其它服务行业、餐饮业等。所有票据均可上网查询验证!欢 迎咨询! 贵企业(公司)若有以下情况请来电联系: 1.公司为一般纳税企业没有优惠政策而想减低税率的; 2.对外销售商品或提供技术服务而本公司暂未领正式发票的; 3.外出采购或公干而服务商没有提供可以报销的发票; 4.公司帐目进项与出项差额过大,需补充差额的。 5. 公司在做帐或进销存方面如需用到的。 所有票据均可上网查询验证!欢迎咨询!

[Nutch-dev] Indexing and Re-crawling site

2006-11-28 Thread Armel T. Nene
Hi guys, I have a few questions regarding the way nutch indexes and the best way a recrawl can be implemented. 1. Why does nutch has to create a new index every time when indexing, while it can just merge it with the old existing index? I try to change the value in the IndexMerger

[Nutch-dev] 资料

2006-11-28 Thread 金先生
业务简介: 本公司与多家公司企业有业务往来,可以为您提供税务代理代开发票相关 信息咨询,具体包括:普通国税商品销售业、运输业、建筑业、建筑安装 业、广告业、其它服务行业、餐饮业等。所有票据均可上网查询验证!欢 迎咨询! 贵企业(公司)若有以下情况请来电联系: 1.公司为一般纳税企业没有优惠政策而想减低税率的; 2.对外销售商品或提供技术服务而本公司暂未领正式发票的; 3.外出采购或公干而服务商没有提供可以报销的发票; 4.公司帐目进项与出项差额过大,需补充差额的。 5. 公司在做帐或进销存方面如需用到的。 所有票据均可上网查询验证!欢迎咨询!

Re: [Nutch-dev] implement thai language indexing and search

2006-11-28 Thread Jérôme Charron
i used an existing ThaiAnalyzer which was in lucene package. ok - i renamed the lucene.analysis.th.* to nutch.analysis.th.* - compiled and placed all class files in a jar - analysis-th.jar (do i need to bundle the ngp file in the jar as well ?) 1. You don't have to refactor the lucene analyzer.

[Nutch-dev] 资料

2006-11-28 Thread 金先生
业务简介: 本公司与多家公司企业有业务往来,可以为您提供税务代理代开发票相关 信息咨询,具体包括:普通国税商品销售业、运输业、建筑业、建筑安装 业、广告业、其它服务行业、餐饮业等。所有票据均可上网查询验证!欢 迎咨询! 贵企业(公司)若有以下情况请来电联系: 1.公司为一般纳税企业没有优惠政策而想减低税率的; 2.对外销售商品或提供技术服务而本公司暂未领正式发票的; 3.外出采购或公干而服务商没有提供可以报销的发票; 4.公司帐目进项与出项差额过大,需补充差额的。 5. 公司在做帐或进销存方面如需用到的。 所有票据均可上网查询验证!欢迎咨询!

[Nutch-dev] length deviate

2006-11-28 Thread Nicholas T. Martinez
Take a look at the results of a survey that claims everything from loyalty issues to generational differences as reasons why employees are unhappy in the workplace. When filter get applied to whole image, an new layer is generated. right click on the photobie icon there and select a capture