Ainsi parla Yann Cochard <[EMAIL PROTECTED]>, le 13 février de l'an de
grâce 2005 :
> J'ai bien sur plus de 2 mots, mais j'ai testé avec 2000, ça marche
> encore. Y a-t-il des précautions particulière à prendre si j'en mets
> plus ? Disons de quelques centaines à quelques milliers (max 5000) ?
Euh... Alors là, j'en sais trop rien, je n'ai pas la plus traître idée
du fonctionnement d'un analyseur d'expressions rationnelles. Ceci dit,
la doc (en l'occurrence, le README de la bibliothèque PCRE) contient les
avertissements suivants :
. When called via the POSIX interface, PCRE uses malloc() to get
additional storage for processing capturing parentheses if there
are more than 10 of them.
Jusque-là c'est bon, on n'en a que quatre.
. PCRE has a counter which can be set to limit the amount of
resources it uses. If the limit is exceeded during a match, the
match fails. The default is ten million.
Là, je sais pas vu qu'ils précisent pas ce que sont ces ressources. Je
subodore qu'il s'agit de la RAM allouée, mais bon...
. The default maximum compiled pattern size is around 64K.
Celui-ci peut poser problème (64 ko, c'est vite parti avec des milliers
de mots). Ceci dit, une solution facile pour contourner cette limitation
est de faire plusieurs itérations en prenant des bouts du tableau de
mots-clefs.
Voilà, désolé. Avec un peu de chance, quelqu'un sera plus au courant.
+++
--
Jacques Caruso | Administrateur système | Laissez-vous pousser
[EMAIL PROTECTED] | Webmaster, jeuxdroles.org | les dents. Ne marchez
(+33) 493 847 728 | Membre des Minotaures du Sud | pas sur les opossums.
PGP : 0x41F5C63D | Membre de Linux-Azur | Mangez des kiwis.
Linux-Azur : http://www.linux-azur.org
Désinscriptions: http://www.linux-azur.org/liste.php3
**** Pas de message au format HTML, SVP ****