[
https://issues.apache.org/jira/browse/TIKA-1071?page=com.atlassian.jira.plugin.system.issuetabpanels:all-tabpanel
]
Tyler Palsulich resolved TIKA-1071.
-----------------------------------
Resolution: Fixed
Closing as fixed:
{code}
tika http://www.amf-france.org/documents/general/8091_1.pdf | grep "commeinclu"
{code}
has no output.
> Some spaces are omitted when merging two lines of a paragraph
> -------------------------------------------------------------
>
> Key: TIKA-1071
> URL: https://issues.apache.org/jira/browse/TIKA-1071
> Project: Tika
> Issue Type: Bug
> Components: parser
> Affects Versions: 1.3
> Reporter: Guillaume Vauvert
> Attachments: RG_AMF_Livre_IV_8091_1.pdf
>
>
> Tika 1.3 sometimes append two succesive lines without inserting a space,
> while Tika 1.2 does not make the error.
> Document :
> http://www.amf-france.org/documents/general/8091_1.pdf
> With Tika 1.3 :
> Page 2, Paragraph:4° La référence aux « membres du conseil d'administration
> ou directoire de la SICAV » doit s'entendre commeincluant, le cas échéant, le
> président de la société par actions simplifiée ou celui ou ceux de ses
> dirigeants que lesstatuts désignent pour exercer les attributions du conseil
> d'administration conformément aux dispositions de l'articleL. 227-1 du code
> de commerce.
> "commeincluant" should be "comme incluant"
> With Tika 1.2 :
> Page 2, Paragraph:4° La référence aux « membres du conseil d'administration
> ou directoire de la SICAV » doit s'entendre comme incluant, le cas échéant,
> le président de la société par actions simplifiée ou celui ou ceux de ses
> dirigeants que les statuts désignent pour exercer les attributions du conseil
> d'administration conformément aux dispositions de l'article L. 227-1 du code
> de commerce.
--
This message was sent by Atlassian JIRA
(v6.3.4#6332)