# Réunion IN * Date : Samedi 24 janvier 2026 * Lieu : MB87 et Galène * Début : 16h * Fin : 18h40 ## Présent⋅es GaBo Pyjacpp RDB Lzebulon Rigobert Ordre du jour : [Maintenance/9 janvier] Voir si on a besoin de couper/reboot les serveurs adhérents. En principe non, mais y réfléchir. Relance de la comm' adhérents. CR: Obsolète [GaBo/Hachino/Lzebulon/Pyjac/RDB] INFO : salamèche a retrouvé la flamme (plutôt que la flemme) (et doc Gitlab mise à jour) [Hachino] Emprunter la boombox de la Nekorale quand on descend en SQ39 [GaBo] : budget boule quies (pour les descentes en SQ39) ([Hachino] Loulous suggère en rigolant d'en chiper à la Kfet.) [Lzebulon] On backup ft sur thot, c'est normal ? On retire ? CR: Pas grave [Hachino/Lzebulon] Accès au switch, ceux qui savent savent. CR: Accès via ethernet ? Se brancher en ethernet avec un simple telnet (plutôt que ssh + auth) donne les droits root. Pratique pour le manager. CR: Problèmes d'IPs ? À voir début février. Problèmes IP des ilos ? [Hachino] (02/12) Plusieurs serveurs avaient du swap utilisé, bizarre. [Lz] si on leur a mis du swap c'est pas etonnant qu'il soit utilisé CR: sécurité plutôt bien. Peut ralentir les VMs. Faire une étude ? Grafana/Règle Prometheus ? CR: RTC pas choqué [Pyjac] INFO : Le BDE peut faire ses comptes Vaultwarden avec des adresses @ens. Térence a dit qu'il allait commencer à jouer avec. [Lz] c'est fait [Pyjac] INFO : Anubis a été désactivé dans `/home//public/*`. Pas suffisant pour V.G. visiblement ? (Check.) CR: exception pour lui en attente d'une meilleure solution. Config à partir des robots.txt ? CR/ Config Anubis "à la demande", seulement en cas de grosse affluence. [Pyjac/Lzebulon/Hachino] Quelques passages sous Debian 13. Non, pas kiwi. (Et un point tocard bien mérité.) [Hachino] La config de borgmatic change un peu, certaines options sont dépréciées (cf roots@), il faudra faire une passe sur Ansible. MR en cours sur Nounous/Ansible [elle est pas bonne en l'état, ne pas merge] D'ailleurs, les anciennes modifs sur /cache et /security (cf IN du 29 novembre) n'ont pas survécu, remise à la main sur neree et owl. [Hachino] Dans le même genre, vérifier les configs/noms de modules Python (cf boeing, helloworld) [Lz] TODO: migrer sur nixos [Hachino] Pourquoi Debian tire par défaut python3-{sympy,scipy,tqdm,matplotlib...} ? Ça sert à rien pourtant. [Hachino] Breaking change au passage : format du fichier snmp.yml sur helloworld, à voir. CR: Pyjacpp a copié la config de fyre. Pour les ilos aussi ? [Hachino] Fichier d'origine backupé en local et nouveau tiré depuis Github (), "ça remarche" [Hachino] Même chose sur fyre, allez savoir. [Pyjacpp] Mailman3 est "réparé". Adresses mails supprimées manuellement dans la BDD. Changement de place d'humanize, à mettre dans ansible ? CR: Mise à jour loupée. Répartion à la main la DB. CR: paquets obsolétes à virer et migrer. Et thème à refaire. [Hachino/Tuxae] INFO : Le tunnel SSH fait son job, l'auth sur fonctionne. (Et ils sont prévenus de la coupure de janvier.) [Hachino] Ils ont une loop SSH qui a refonctionné à peine l'infra re-up, magnifique. [Hachino] Le DMARC report de Nanein (10 décembre, 06h01) indique un ARC fail lors du passage par lists.crans.org, on peut mettre ARC en place ? CR: se renseigner [Hachino] Quelques soucis sur adh de baux DHCP non accordés, 3 VM non rentrées dans le hosts et un physique HP à identifier (). EDIT : évidemment j'ai pas noté les noms des VM et ça fait un mois et demi... CR: Flush ? Problème de fond DHCP à régler. [Pyjacpp] Les mails borgmatic... [Hachino] INFO : VM Med passée de 2 Go à 4 Go de RAM pour soulager uwsgi, VM Roundcube passée de 1 à 2 Go (et ça va mieux omg) [Hachino/Lyes/Pyjacpp] INFO : le Cas remarche sur Mailman après application du fix [Pyjacpp] Proposition de doc par service pour mieux suivre ce type de correctif [Pyjacpp] django-allauth à virer un de ces quatre. [Hachino] Proposition : mettre kiwi.svg (aux couleurs du Crans) comme favicon de mediawiki.crans.org :> CR: Ok [Lyes] Idée : un dashboard dédié au monitoring du trafic purement externe (par interface avec IP publique) *par VM*. Une sorte de mélange de dashboard existants. CR: Ok (c'est long) [Pyjacpp] Cleanup nextcloud `nextcloud-occ preview:cleanup` existe Les previews prenaient 4Go. Certains dataient de septembre Option pour limiter leurs tailles / qualité ? Supprimer les plus vieux / moins utilisés ? [Pigeon] Je l'ai déjà fait plusieurs fois, mais ça ne règle pas le pb de manière durable CR: Séparation du ldap au profit gitlab/nixos ? CR: Sécurité de révéler les IPs ? CR: Centralisation de la documentation dans le repo de la documentation. [Pyjacpp] printer.lp.crans.org: cela semble être un problème de routage depuis fyre. CR: non problème snmp.yml. L'imprimante est mystique (c.à.d c'est une imprimante). [Pyjacpp] VM interq pour le BDA Ajout d'un club bda sur le ldap-adh (proprios: club-bda et pyjacpp) Création de la VM bda id 109 sur stich (8 GB, 1 cœur, 2GB de RAM) Installation de Debian Trixie (13) Users root et bda: sans mot de passe, accès seulement par clés ssh à root (pyjacpp et dans le home de club-bda). Ajout du nom de domaine interq.crans.org -> bda.adh.crans.org Pour info : Actuellement, la VM a pour seul objectif l'hébergement d'un site django (celui des interludes adaptée aux interq gitlab.crans.org/pyjacpp/interq-2026) [Hachino] Nix aime bien s'étaler dans son store, HowTo autoclean tout ça proprement ? [Pigeon] Les options sont très utiles CR: Lz pense avoir fait une MR. Ça serait bien d'avoir de la doc et il y en a. [Hachino] Mails chelous de Django sur roots@ (30 décembre, 15h54-56) CR: Erreurs de re2o ? CR: Projet : refaire le site de l'imprimante ;____; [Hachino] Kenobi qui OoM, fuite de mémoire ou VM sous-dimensionnée ? [Hachino] Gitlab OoM kill le 5/01 vers 3h. CR: Le CT note une recrudescence d'OoM. CR: de la marge de RAM mais pas trop non plus. (Si on coupe un hyperviseur adm, on est à 100% RAM sur les deux autres, donc ric-rac.) [Lyes/Samuel Allain] Ajout d'une application Nextcloud : Cospend et Notes (et réexamen des problèmes de perfs) [Hachino] Vieux thread Reddit relié : Et ça : (sous Arch btw) Et ça, plus récent : Proposition : inspecter le JS en direct pour voir les apps les plus gourmandes [Pigeon] Ça a déjà été fait avec korenstin. Conclusion : tout est lent, il faudrait juste passer la VM sur des SSD (oui je suis convaincu que ça fait une différence, cf zora) [Hachino] Bon bah ok, commande de SSD un jour™ j'imagine. CR: Fédération Nextcloud. Cospend : [Pyjacpp] comptes mails pas dans ré2o ? e.g zoecprl ? CR: Ancien comptes avec .forward mais pas de mail renseigné. [Hachino] INFO : Aplanos et ses scans, du DELETE bien gras. Et on avait 366 jobs d'impression latents, DELETE aussi. CR: suppression automatique des impressions ? Probablement des données dessus. [Pyjacpp] Pourquoi autant de OOM ? CR: déjà dit [Hachino] Manque de ressources sur Nextcloud et/ou Collabora ? Créer un .ods en local, l'upload sur Nextcloud, l'ouvrir (avec Collabora), se prendre un avertissement -> ressources matérielles insuffisantes [Pyjacpp] C'est Collabora il me semble CR: On peut le faire si besoin. [Hachino] Fait à l'instant. 2 Go -> 4 Go RAM, 1x2 coeurs -> 2x2 coeurs [Lzebulon/Pyjacpp] Ilo à Tealc sans Tealc ? CR: Problèmes ilo à tealc. Connexion de secours Sam -> ilo-tealc ? [Pyjacpp] Plan pour Ceph ? Reporté [All] La maintenance, ses succès et ce qu'il reste à faire Cameron est en mauvais états, les fibres ont disparu (ethernet d'urgence). Problème de driver carte réseau à mettre à jour ? Problèmes d'accès pour les switch Problèmes d'accès ilos [Hachino] Visiblement il faut mettre à jour la conf de Postfix (mail roots@, il spamme un peu). [Hachino] INFO : Augmentation subtile des ressources de la Note pour voir (passage à 2x2 coeurs au lieu de 1x2) [Hachino] INFO : Ajout de loulous27 comme admin de club-numens [Hachino] INFO : Nettoyage de club-bde (on enlève tout le monde et on met quark admin, il gère la suite). [Hachino] loulous27 demande à ce qu'on monitore la disponibilité du serveur photos (par Grafana). CR: Page status ? Ping Raito pour la Nixification de status.bytestall.info, ce serait un bon plan [Hachino] TODO : MàJ de la doc après la grosse maintenance. Et on a un peu de retard sur les CR de réunions. ;_; (Non merci, j'ai poney.) CR: Version de Debian., plein d'infos obsolètes après la MàJ, bref refaire une passe un jour. [GaBo] Détourner le pass pour y insérer de la doc "secrète", genre le plan du réseau, les IP importantes ? [Hachino] Si on fait ça, proposition de faire un dossier par thème et dedans, un fichier par serveur/VM important. [Lz] as-t-on besoin de cacher le plan du reseau ? les ip publics sont connues avec le DNS et en interne il faut avoir deja reussi a se connecter [Hachino] Dans ce cas, go for gitlab/documentation ? CR: déjà dit, c'est pas forcèment dangereux de la mettre en public. C'est mieux de centraliser sur la documentation. [Hachino] Finir la suppression des comptes (une vingtaine petite quarantaine de demandes latentes sur nounous@).(35 d'après mon décompte) [Hachino] Ansible c'est quand même plus sympa que taper des commandes sur chaque VM. Un jour. [shirenn] Ajouter une unit systemd pour sudo chmod 777 /run/screen, ça serait bien. ExecOnStart, un truc comme ça. [Hachino] Resilver sur sam et jack ? (Le disque de sam a été changé mais on a stop le resilver parce que trop lent, jack on a découvert l'absence de disque 2 mais ni vérifié à l'intérieur, ni changé.) CR: Done par pyjacpp & korenstin [korenst1 par Hachino] "hpasswd", mdp root Nix mais pas en clair, pas tout compris ou retenu. CR: mkpasswd hash -> agenix. CR: Ça casse les mdp root des vm NixOs e.g. nextcloud. [korenst1] Penser à mettre en place les backups de BDD par restic (pour l'instant seul borg le fait) CR: Ok. [All] INFO : Ajout d'interfaces auto pour les serveurs qui nous faisaient suer (au reboot) [Hachino] Pénible, je me fais régulièrement jeter par kexchange quand je veux me co à *.adm. :/ Quelqu'un comprend ? (Ah, ça a l'air calmé tiens.) [Hachino/Pyjacpp] kex_exchange_identification: read: Connection reset by peer CR: Resilver de sam ? Mise sous surveillance jusqu'à la prochaine IN. [Hachino] INFO : Prometheus-apache-exporter sur Zamok avait un format d'options obsolète, corrigé à la main (/etc/default/prometheus-apache-exporter). J'ai pas compris comment, mais en précisant une config j'ai refait vivre le mysql-exporter. (Probablement mal vu les logs d'erreurs.). [Pyjacpp] Remise à jour projets-apprentis CR: fait [Hachino] Mauvaise config du ssh tealc -> ilo-* ? Ajout de l'option HostKeyAlgorithms CR: un peu mieux. [Pyjacpp] Ajout d'une documentation sur comment gérer les disques, remplacement smartctl. Ajouter comment refaire un boot proxmox avec proxmox-boot-tool scsi vs ATA ? Cameron /dev/sdg emplacement 29 CR: Cameron a une config mix [Hachino] INFO : Fun fact : on a deux anciennes nounous. Et on a oublié RDB sur CransNounous. :( CR: à faire ? [Pyjacpp] Daniel attention erreur checksum ZFS égale à 2 ET Deuxième disque sans partition de boot. Attention pour corriger le second, on a besoin que le premier soit en bonne forme. CR: À faire si on a le temps. [Pyjacpp] le disque nvme-CT500P2SSD8_2212E61D5B50 est mystique sur sam cameron ? Non utilisé ? CR: SSD pour le boot CR: Reste de la centralisation des logs ? Partir en recherche d'archives ? CR: potentiellement un reliquat. [Pyjacpp] tealc et cameron ont perdu lvm ? Probablement du raid géré par mdadm CR: À checker un de ces quatre. [Pyjacpp/korenstin] Attention avec ansible, mise_a_niveau n'est pas merge dans main [Pyjacpp] Des disques de tealc sont en taille de secteurs 512/4096, c'est normal ? CR: À vérifier. [Pyjacpp] Compte Nextcloud ne fonctionnant pas : adam-c. CR: Réglé CR : point script suppression comptes, lien Nextcloud/LDAP, comptes "supprimés" invisibles dans nextcloud-admin (mais script pour les récupérer d'un coup) [Pyjacpp] Imprimante Beaucoup de bourrage papiers ces derniers temps Monitoring: réparé ? En copiant la config de fyre ? La config ansible est à jour ? Comment on fait pour générer snmp.yml ? Où est le generator.yml ? CR: aller voir du côté de fyre ? CR: À check avec les ilos. [Hachino] yson-partou pas reboot ? + gitzly à upgrade + nettoyage des vieux paquets post-maintenance [Pigeon] Tous les serveurs ont reboot, c'est pas possible qu'il ait été laissé tranquille [Hachino] Son noyau courant est en 6.1, alors qu'il a le 6.12 en magasin EDIT : sudo update-grub fait, "plus qu'à reboot" quand ça gêne personne CR: Potentiellement safe de reboot ? [Hachino] (23/01/2026) Helloworld en souffrance, ressources x2 et ça semble aller un peu mieux ? À surveiller. EDIT : 480 pages en une fois, ça fait mal cheffe. [Hachino] INFO : nettoyage des miettes laissées par la migration pgsql (monitoring notamment). Les alertes autovacuum/autoanalyse semblent inoffensives, osef/20. CR: recherche d'high availability des BDD [RDB] 2FA sur le pass ? [Pyjacpp] Mettre à jour backup-ft et ft ? [Pyjacpp] script de récupération / suppression: Avis sur un script se connectant en SSH avec des comptes nounous et lançant des commandes ? Avis sur le lancement de commandes sudo ? Avis sur une connexion directement avec le mot de passe root ? Avis pour une suppression semi-automatique (actuellement, la suppression doit se faire à la main) ? En particulier, le script devra faire des sudo rm -rf /home/pseudo (ce qui est terrifiant, mais à la main aussi ?). --> ajoute des --yes-i-want comme pour le mailall ? demander de taper le login pour vérifier ? [Lzebulon] bot renovate pour mise a jour auto du repo NixOS ? CR: bot qui met à jour les dépendances CR: avec signature de confiance ? [Lzebulon] les travaux pour 2026 : mises à jour inventaire du matos (comment ? excel ? outil specifique ?) (gitlab/documentation ? branche inventaire_materiel en MR) Calc sur Nextcloud avec partage aux groupes nounou et bureau (synchro NC/LDAP) nouveau wiki date.crans.org [Hachino] Quoi t'est-ce ? Framadate v2 ? Framaforms v2 ? pollaris (le nouveau framaform) [Hachino] Comprendre et corriger (ou faire taire si pertinent) les alertes sur Grafana un jour peut etre : ceph et donc : peertube un nouveau re2o serveurs de build nixos Partir de django cas (mails entre autre) Nouveaux serveurs [Pyjac] Plan Ceph Pyjac est nommé respo Ceph, mention bsahtek, félicitations. Résumé des TODOs personnels à court terme : Hachino : acheter SSD/HDD/câble port série; contacter Rennes pour camtar InterQ (pour l'imprimante), rédaction mail DPAT Lz: check snmp Pyjacpp: Séminaires, Suppression des comptes, Switchs/ilos, Imprimante, Wiki, Convention: affaire à suivre, Conférence, Ceph Quelqu'un : vérifier que l'imprimante est toujours au 0B (en principe oui, parce que le Crous)