Bonjour ptilou, je ne sais pas de quels moyens tu disposes pour traiter cela, mais en gros, je pense que c'est "indexable" via script par exemple. Ici tu parles de filtrer les avis favorables/défavorables. Donc, on se base sur le mot "avis favorable" pour savoir ça ? Est-ce que dans tous les documents, c'est orthographié de la même manière ? Que veux-tu trouver exactement dans tous ces articles ?
Je pense qu'un outil de recherche textuel conviendrait pas mal (en séparant les articles dans des documents différents - ce serait mieux). Au boulot, nous utilisons pour l'instant Coveo qui est très puissant. Un alternative gratuite serait peut-être lucene (d'apache) - pas encore testé ça ;). Pour établir un état des lieux en linux par exemple, un : grep -i -E "^Titre :|^Administration :|^Référence :|^Séance du :" <document-de-15000-lignes> te donnerais déjà un résultat avec toutes les lignes "intéressantes" mais après que peux-tu en faire ? Yves Le dim. 15 nov. 2020 à 11:39, philippe L <[email protected]> a écrit : > Bonjour, > > J'ai un kindle, et je ne sais pas au juste le nombre de documents, mais un > volume important (60 Go d'ecrit !) > > J'ai un fichier texte formé de 1500 pages qui sont les décisions de la > CADA, et je me pose la question afin d'être exploitable, avec le kindle qui > n'est pas un chars d'assaut en matière de calcul, de faire une table des > matière en vue d'une meilleurs exploitation des documents ? > > (c'est du droit !) > Voila la structure du fichier : > "Type : avis > > Administration : ministre de la culture (direction des archives de France) > > > Référence : 20050311 > > Séance du : 20/01/2005 > > La commission d'accès aux documents administratifs a examiné la > demande d'avis citée en objet dans sa séance du 20 janvier 2005 et > portant sur la possibilité de communiquer à Monsieur M.A., à titre > dérogatoire, le dossier Pierre Stibbe, conservé par le centre > historique des archives nationales sous la cote F/7/15495, lequel ne > deviendra librement communicable, en vertu de l'article L.213-2 du > code du patrimoine, qu'en 2027. > La commission a tenu compte du sérieux du projet de recherche du > demandeur, qui rédige une thèse sur la doctrine juridique des > professeurs de droit face à la qualification juive sous le régime de > Vichy (1940-1944), et de l'intérêt incontestable que présente la > communication de ces documents dans le cadre de cette recherche. Elle > a relevé par ailleurs que les archives demandées se rapportaient à des > faits largement connus. > Elle a, en conséquence, émis un avis favorable à la communication à > titre dérogatoire desdits documents." > > > Je me demande comment constituer la table des matières de quatre > éléments, qui sont en titre, je me demande si c'est exploitable, > est-ce que c'est utile ? > > est-ce que c'est pas mieux de chercher quelque chose qui créer des > abstraits ? > > Et pour faire des abstracts je suppose qu'il faut soit un "site" de > référence, par exemple en matiére judiciaires la Cours de cassation, > mais pour d'autre décision, j'ai l'idée de chercher dans des résultat > de recherche, enfin je suis perdu si quelqu'un à des idées , elles > sont les bienvenue ! > > Par exemple pour le document cité, chercher les avis favorable, et > mettre à contrario les non -favorable ! > > > -- > > ptilou > > -- > Envoyez un mail à [email protected] pour vous > désinscrire > Les archives de la liste sont disponibles à > https://listarchives.libreoffice.org/fr/users/ > Privacy Policy: https://www.documentfoundation.org/privacy > -- web site : http://www.molenbaix.com -- Envoyez un mail à [email protected] pour vous désinscrire Les archives de la liste sont disponibles à https://listarchives.libreoffice.org/fr/users/ Privacy Policy: https://www.documentfoundation.org/privacy
