Hello Thomas, thank you for your quick answer. We managed to run an rbh-find command with every metadata we need with the posix backend (we do not have mongo on the instance).
We are using a slave instance of the RBH database to run the commands to avoid interfering with the real time updates. We are looking into how to run several rbh-find in parallel, because with only 1 command we expected it to run for 25 days and lead to a 1.5To file. Would you advise to run several rbh-find commands in parallel to be quicker or do you think the database would be the bottleneck and run several commands would only make it worse ? best regards, Niels De: "Thomas LEIBOVICI" <thomas.leibov...@cea.fr> À: "Niels OGER" <niels.o...@meteo.fr>, robinhood-supp...@lists.sf.net Envoyé: Jeudi 18 Avril 2024 11:32:40 Objet: RE: Extraction des métadonnées atime et mtime de RBH ? Dear Niels, Please prioritize using English on this mailing list so that the community of other users can respond to you or benefit from the provided answers. Did you take a look at the “rbh-find –printf” option that potentially allows diplaying any attribute present in the robinhood’s database? For sure it can display all the attributes you mentioned (size, path, user, group …). See rbh-find –help or man rbh-find for more details. AFAIK, there is no existing GUI as you mention. It’s been a long time since this idea was mentioned, but nobody has coded it yet. There is still the Robinhood webUI that enables visualising some useful stats about usage, size, age, users, groups… I hope that helps. Best Regards, Thomas De : OGER Niels <niels.o...@meteo.fr> Envoyé : jeudi 18 avril 2024 09:32 À : robinhood-supp...@lists.sf.net Objet : [robinhood-support] Extraction des métadonnées atime et mtime de RBH ? Bonjour, nous commençons à exploiter les instances RBH déployées sur nos 2 clusters à Météo-France. Dans un premier temps nous souhaitons faire des statistiques sur la date de dernier accès en fonction de l'âge des fichiers pour estimer de manière plus objective des durées de rétention. La commande rbh-report nous semblait la plus prometteuse mais nous n'avons pas trouvé d'option pour récupérer le atime et le mtime (commande testé: rbh-report --dump-group xxx -c -f scratch). Les autres métadonnées du rbh-report nous intéressent aussi. Nous pourrions faire plusieurs rbh-find en spécifiant les atime et mtime mais nous manquerait la taille des fichiers (ou alors il faudrait combiner du rbh-report et des rbh-find). Est-ce qu'il existe une commande ou des options pour avoir la taille, le chemin, user/group et les atime+mtime pour les fichiers à partir de RBH ? On envisage d'aller jardiner dans le code de rbh-report pour ajouter ce que l'on veut ou faire des requêtes SQL directement dans les tables mais cela risque de ne pas être trivial. Autre question un peu annexe, est-ce que vous auriez connaissance d'un outil permettant d'avoir une vision de type "occupation du système de fichier Ubuntu" (= cercles concentriques selon la taille des répertoires) pour du Lustre (en s'appuyant sur RBH ou pas) ? merci d'avance, Niels -- ----- Météo-France ----- OGER NIELS DSI/D - Chef de projet Calcul Intensif [ mailto:niels.o...@meteo.fr | niels.o...@meteo.fr ] Fixe : +33 561078198 -- ----- Météo-France ----- OGER NIELS DSI/D - Chef de projet Calcul Intensif niels.o...@meteo.fr Fixe : +33 561078198
_______________________________________________ robinhood-support mailing list robinhood-support@lists.sourceforge.net https://lists.sourceforge.net/lists/listinfo/robinhood-support