Re: Suppression de sauts de ligne dans un fichier texte (sous conditions)
Bonjour à tous les utilisateurs et développeurs de Debian (et à David Prévot en particulier) : Tout d'abord, merci à David de m'avoir répondu à mon message (envoyé le 28/08/12 à 22:02). :-) Le 28/08/12 22:21, David Prévot a écrit : La documentation est traduite en français depuis la version 2.19. Étant donné que je suis sous Squeeze, la version de dctrl-tools est 2.14.5. Par contre, sous Wheezy, sa version passe à 2.22.2 et, d'après la page http://packages.debian.org/wheezy/amd64/dctrl-tools/filelist, elle inclue effectivement des pages de manuel en français. Seulement, je passerai à Wheezy quand elle deviendra la nouvelle distribution stable (peut-être au 1er trimestre 2013)... Cordialement et à bientôt, Stéphane. Une messagerie gratuite, garantie à vie et des services en plus, ça vous tente ? Je crée ma boîte mail www.laposte.net -- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/fr/FrenchLists Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe vers debian-user-french-requ...@lists.debian.org En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org Archive: http://lists.debian.org/1738390322.1237588.1346233311219.JavaMail.www@wwinf8311
Re: Suppression de sauts de ligne dans un fichier texte (sous conditions)
Bonjour à tous les utilisateurs et développeurs de Debian (et à David Prévot en particulier) : Tout d'abord, merci à David de m'avoir répondu à mon message (envoyé le 24/08/12 à 9:52). :-) Le 24/08/12 18:56, David Prévot a écrit : Pas la moindre idée de ce que tu veux en faire, mais as-tu jeté un œil du côté de dctrl-tools qui permet d'extraire ce genre de données de ce genre de fichier, et comme le dit la Charte [0], ses listes sont conformes à la RFC 5322, donc plutôt que de réinventer la roue, peut-être que ça vaut le coup d'utiliser des outils existants pour analyser ces champs normalisés. Hier matin, j'ai installé le paquet dctrl-tools (ainsi que ses éventuelles dépendances, recommandations et suggestions) à l'aide du logiciel Aptitude et j'ai consulté les pages de manuel des commandes grep-dctrl, join-dctrl, sort-dctrl et tbl-dctrl. D'après à ce que j'ai pu comprendre (car c'est en anglais et cette langue n'est pas vraiment mon fort), tbl-dctrl semble plutôt intéressante par rapport à ce que je compte faire avec le fichier Package. En effet, avec la commande suivante (par exemple) : tbl-dctrl -c 'Package=Package' -c 'Version=Version' -c 'Description=Description' -c 'Source=Source' -d ; Packages Packages2 On aura (en consultant le fichier Packages2) : Package;Version;Description;Source Nom du 1er paquet;sa version;sa description;son paquet source Nom du 2ème paquet;sa version;sa description;son paquet source Nom du 3ème paquet;sa version;sa description;son paquet source etc Par contre, si on fait : tbl-dctrl -c 'Package=Package' -c 'Tag=Tag' -d ; Packages Packages3 Le contenu du fichier Packages3 est très différent de ce qu'on devrait avoir. :-( Comme je l'ai déjà expliqué dans mon précédent message, pour certains paquets, les données du champ Tag s'étalent sur 2 ou 3 (voire plus) lignes et tbl-dctrl semble avoir du mal à bien interpréter les sauts de ligne. Bien sûr, une solution est de renoncer aux données Tag mais cela serait vraiment dommage car ce champ apporte, à priori, des informations intéressantes. Selon vous, qu'est-ce que je dois faire (avec tbl-dctrl ou autre commande) à partir du fichier initial Packages pour que dans un nouveau fichier Packages2, j'ai les données Tag correctement formatées ? Mon but final est de transformer Packages en un fichier de type CSV (avec les données des champs que j'aurai sélectionnés) afin que je puisse exporter dans le tableur OpenOffice Calc. Ainsi, je pourrai, entre autres, faire des filtres ou des tris parmi les données. ;-) Si vous souhaitez d'autres informations en lien avec mon problème, n'hésitez pas en me demander. :-) Je vous remercie d'avance pour vos réponses. Cordialement et à bientôt, Stéphane. Une messagerie gratuite, garantie à vie et des services en plus, ça vous tente ? Je crée ma boîte mail www.laposte.net -- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/fr/FrenchLists Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe vers debian-user-french-requ...@lists.debian.org En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org Archive: http://lists.debian.org/1100944143.815790.1346184160701.JavaMail.www@wwinf8228
Re: Suppression de sauts de ligne dans un fichier texte (sous conditions)
Le 28/08/2012 16:02, stephane.gargoly a écrit : Hier matin, j'ai installé le paquet dctrl-tools […] D'après à ce que j'ai pu comprendre (car c'est en anglais et cette langue n'est pas vraiment mon fort) La documentation est traduite en français depuis la version 2.19. Amicalement David P.-S.: Pas la peine de me mettre en copie, je lis la liste. signature.asc Description: OpenPGP digital signature
Suppression de sauts de ligne dans un fichier texte (sous conditions)
Bonjour à tous les utilisateurs et développeurs de Debian : Je suis un utilisateur de Debian depuis déjà plus d'un an (peu de temps après la sortie de Squeeze en fait) et c'est la première fois que j'envoie un message sur la liste de diffusion debian-user-french. :-) Il y a quelque jours, j'ai récupéré un fichier Packages.gz sur le site FTP ftp://ftp2.fr.debian.org/pub/debian/dists/wheezy/main/binary-amd64/. Wheezy est le futur successeur de Squeeze en tant que distribution stable. Ce fichier Packages, une fois décompacté, pèse plus de 25 Mo et contient les informations (de type Packages, Version, Maintainer ou Description entre autres) de tous les paquets Debian (autrement dit les fichiers *.deb). Il y en a pour environ 36'000 paquets...ce qui explique que le fichier soit si lourd. ;-) Parmi les types d'information, il y a un auquel je voudrais vous en parler et que je souhaite solliciter votre aide ou vos conseils : il s'agit de Tag Cette information de type Tag, présente pour environ 30'000 paquets, s'étale sur 1,2 ou 3 (éventuellement plus) lignes selon le paquet. Mon souhait est que toute l'information Tag soit contenue sur une seule ligne par paquet. Vous avez, sans doute, compris : il faudrait que je supprime les sauts de ligne si cela s'étale sur 2 (ou plus) lignes. Pour cela, j'ai utilisé les 2 commandes suivantes (l'une après l'autre) : sed '/^ / N;s/\n//g' Packages Packages2 sed '/^Tag: / N;s/\n//g' Packages2 Packages3 J'ai utilisé sed en raison, entre autre, de la taille de Packages. ;-) Malheureusement, cela donne des résultats qui ne me convient pas car : - soit cela supprime le saut de ligne entre Tag et Section ce que je ne souhaite pas, - soit il reste encore, au moins, un saut de ligne au sein de l'information Tag. Bien entendu, la principale difficulté est que le nombre de saut de ligne concernant Tag est variable (de 0 à plusieurs) selon le paquet dans le fichier Packages. :-( Selon vous, quel est le bon traitement (avec sed ou autre commande) à appliquer au fichier initial Packages pour que dans un nouveau fichier Packages2, j'ai Tag sur une seule ligne par paquet ? Informations (plutôt concises) sur la configuration matérielle, logicielle et réseau de mon ordinateur fixe : - (Matériel) processeur AMD Athlon 64 x2 3 GHz, mémoire vive 8 Go DDR2 800 MHz, deux disques durs SATA II de 1000 Go à 7200 tr/mn avec cache de 32 Mo, carte graphique PCI-Express 16x avec ATI HD3650 et 512 Mo. - (Logiciel) distribution Debian GNU/Linux 6.0 Squeeze version amd64 installée (à partir du 1er DVD et du réseau) avec les tâches, entre autres, Standard System et Desktop (avec KDE uniquement) et localisée en français et en anglais (pas de Dual Boot donc un seul système d'exploitation). - (Réseau) relié à l'Internet par ADSL2+ à l'aide d'un adaptateur-routeur DartyBox. Si vous souhaitez d'autres informations en lien avec mon problème, n'hésitez pas en me demander. :-) Je vous remercie d'avance pour vos réponse. Cordialement et à bientôt, Stéphane. Une messagerie gratuite, garantie à vie et des services en plus, ça vous tente ? Je crée ma boîte mail www.laposte.net -- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/fr/FrenchLists Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe vers debian-user-french-requ...@lists.debian.org En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org Archive: http://lists.debian.org/1051037693.992192.1345794771727.JavaMail.www@wwinf8223
Re: Suppression de sauts de ligne dans un fichier texte (sous conditions)
Salut, Le 24/08/2012 03:52, stephane.gargoly a écrit : Parmi les types d'information, il y a un auquel je voudrais vous en parler et que je souhaite solliciter votre aide ou vos conseils : il s'agit de Tag Pas la moindre idée de ce que tu veux en faire, mais as-tu jeté un œil du côté de dctrl-tools qui permet d'extraire ce genre de données de ce genre de fichier, et comme le dit la Charte [0], ses listes sont conformes à la RFC 5322, donc plutôt que de réinventer la roue, peut-être que ça vaut le coup d'utiliser des outils existants pour analyser ces champs normalisés. 0: http://www.debian.org/doc/debian-policy/ch-controlfields.html#s-controlsyntax Amicalement David signature.asc Description: OpenPGP digital signature
Re: Suppression de sauts de ligne dans un fichier texte (sous conditions)
Le 24/08/2012 03:52, stephane.gargoly a écrit : Parmi les types d'information, il y a un auquel je voudrais vous en parler et que je souhaite solliciter votre aide ou vos conseils : il s'agit de Tag Le Fri, Aug 24, 2012 at 12:55:38PM -0400, David Prévot a écrit : Pas la moindre idée de ce que tu veux en faire, mais as-tu jeté un œil du côté de dctrl-tools qui permet d'extraire ce genre de données de ce genre de fichier, et comme le dit la Charte [0], ses listes sont conformes à la RFC 5322, donc plutôt que de réinventer la roue, peut-être que ça vaut le coup d'utiliser des outils existants pour analyser ces champs normalisés. Bonjour à tous, petite remarque en passant. En fait, le format des fichiers de données de contrôle est inspiré de la RFC 822 et des suivantes (5322 étant la plus récente), mais si on s'en tient strictement aux RFCs, les deux syntaxes ne sont pas compatibles, par exemple parce que la RFC 5322 stipule que les fins de lignes sont signalés par un retour chariot suivi d'un passage à la ligne, alors que les fichiers de contrôle utilisent the format texte Unix qui n'a pas de retours chariot. Ceci dit, beaucoup d'outils ignorent cette différence, et les outils comme dctrl-tools sont écrits directement pour les données de contrôle. Amicalement, -- Charles Plessy Tsurumi, Kanagawa, Japan -- Lisez la FAQ de la liste avant de poser une question : http://wiki.debian.org/fr/FrenchLists Pour vous DESABONNER, envoyez un message avec comme objet unsubscribe vers debian-user-french-requ...@lists.debian.org En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org Archive: http://lists.debian.org/20120825023934.gb2...@falafel.plessy.net