Uptime Institute a annoncé aujourd’hui son nouveau label de qualité Management & Operations (M&O), leader sur le marché et adopté à l’échelle mondiale. Les améliorations substantielles renforceront la capacité des clients à répondre aux exigences croissantes imposées à leurs centres de données, à mieux gérer les complexités de l’infrastructure des centres de données, et à réduire les risques opérationnels en leur permettant d’identifier et de résoudre plus précisément les vulnérabilités des installations critiques. Les participants au nouveau programme M&O d’Uptime reçoivent un profil de risque opérationnel complet et des étapes concrètes qui favorisent la standardisation organisationnelle sur un site ou dans l’ensemble d’un portefeuille de centres de données, tout en mettant l’accent sur l’amélioration continue pour mieux faire face aux risques en constante évolution dans toutes les opérations des centres de données.
Le programme de labellisation M&O comprend une évaluation globale des pratiques en matière de personnel et d’organisation, des activités de maintenance et d’exploitation, ainsi que des protocoles de gestion et de planification spécifiques et adaptés à l’ensemble d’un portefeuille de centres de données ou à un seul établissement. Le programme M&O offre une feuille de route pour aligner des stratégies organisationnelles spécifiques afin d’aider les clients à atteindre des objectifs commerciaux critiques pour leur infrastructure numérique, tels que la réduction des risques, la limitation des interruptions de service, et l’amélioration de l’efficacité opérationnelle.
Dans le marché actuel, les programmes et procédures d’exploitation des centres de données doivent faire preuve de flexibilité et d’adaptabilité face à une prolifération de défis. Ceux-ci incluent des problèmes de chaîne d’approvisionnement et des problèmes liés au personnel, de nouvelles réglementations industrielles et gouvernementales, ainsi qu’une attention accrue sur la sécurité physique et cybernétique complète. Plus exigeant encore, il est nécessaire que les opérations des centres de données évoluent pour répondre aux demandes encore nébuleuses mais en croissance rapide associées à l’intégration de nouvelles technologies telles que l’intelligence artificielle (IA), l’adoption du refroidissement liquide, et la densité de puissance croissante des racks, qui influencent la manière dont les centres de données peuvent et doivent être exploités. Les équipes opérationnelles doivent être prêtes à anticiper et à répondre à ces changements rapides, et le nouveau programme de certification M&O dispose du cadre complet pour faire face au nombre croissant de défis et de risques concernant les installations critiques.
« Dans cet environnement plus complexe et exigeant, des opérations de centres de données efficaces et performantes sont plus cruciales que jamais », a déclaré Christopher Brown, directeur technique de Uptime Institute. « Pour atteindre une résilience opérationnelle durable, une approche complète et nuancée est nécessaire pour identifier les vulnérabilités potentielles, les faiblesses et les risques opérationnels des centres de données. La nouvelle certification M&O aborde à la fois les développements récents et les évolutions à travers les portefeuilles d’infrastructures numériques, avec des déploiements variés, qu’ils soient d’entreprise, HPC, cloud, ou colocation. »
Le nouveau programme Uptime M&O comprend une évaluation sur deux fronts principaux, la performance des opérations du centre de données et le personnel du centre de données. Dans chaque domaine, des protocoles Uptime éprouvés sont déployés pour identifier les risques à plusieurs niveaux et à travers une variété de voies claires pour remédier aux risques identifiés.
Le label de qualité M&O évalue les opérations des centres de données en mettant l’accent sur l’amélioration durable dans 7 segments clés des opérations : Gestion du personnel, maintenance, gestion et optimisation des installations, santé, sûreté et sécurité, préparation et réponse aux urgences, planification, coordination et gestion globale de la qualité.
La gestion du capital humain est essentielle pour améliorer la résilience opérationnelle. Avoir les bonnes personnes avec les bonnes compétences est crucial à chaque étape du cycle de vie d’un centre de données, de la planification à la conception, en passant par la construction et l’exploitation, afin de garantir la fiabilité et la disponibilité. L’enquête Uptime Resiliency de 2024 montre que 66 à 80 % des pannes sont encore dues à des erreurs humaines, l’un des principaux facteurs étant le non-respect des procédures par les individus. L’évaluation constante des risques humains spécifiques à un emplacement donné et à l’échelle d’un portefeuille d’opérations est le levier le plus puissant que les organisations peuvent utiliser pour identifier et combler les lacunes en matière de connaissances ou de confiance, qui peuvent entraîner des erreurs de jugement, des oublis et des défaillances sur le lieu de travail d’un centre de données.
Dans le programme M&O, le personnel opérationnel bénéficiera de l’accès au modèle exclusif d’évaluation des compétences et de la confiance (CCAM®) d’Uptime. Les résultats du CCAM permettront d’identifier les opportunités de formation et de développement pour chaque membre du personnel, que ce soit au moment du recrutement, de l’intégration ou de façon continue. Les managers pourront désormais identifier rapidement les risques associés à des individus spécifiques et les atténuer en fournissant une feuille de route personnalisée pour une formation ciblée. La combinaison du M&O et de CCAM® propose une évaluation complète, standardisée et reconnue mondialement, permettant aux équipes d’exploitation des centres de données de donner le meilleur d’elles-mêmes. De même, elle garantit que les inefficacités cachées, les lacunes en matière de compétences ou de compréhension, ainsi que les risques associés n’affectent pas l’organisation.
Les centres de données sont un système de plus en plus complexe et dynamique de composants actifs, avec une dépendance absolue à un personnel qualifié et bien formé pour assurer leur bon fonctionnement. Bien que les tâches opérationnelles soient trop souvent considérées comme un simple ensemble d’efforts tactiques variés, et les équipes comme une collection d’individus, assurer l’efficacité globale pour améliorer la résilience opérationnelle est l’investissement stratégique le plus important qu’on puisse faire pour protéger une entreprise numérique. Ne pas reconnaître et traiter l’élément humain comme une priorité permanente, peut compromettre toute la stratégie de prestation de services numériques d’une organisation.
En utilisant les principes de la norme mondialement reconnue Tier Standard of Operational Sustainability, Uptime Institute a déjà évalué plus de 1 000 programmes d’exploitation de centres de données dans le monde, aidant les organisations à valider de manière indépendante, l’efficacité de la gestion de leurs infrastructures critiques et des pratiques opérationnelles de leurs centres de données. Le nouveau programme M&O garantit que les organisations pourront être compétitives aujourd’hui et se préparer avec certitude à faire face aux problèmes croissants auxquels sont confrontés tous les centres de données et infrastructures numériques à l’échelle mondiale.