SRE – le concept de fiabilité

Date: 07/01/2022| Catégorie: Gestion des services informatiques (ITSM)|

Après avoir étudié ce qu’est la SRE, Fabio Mora, Software Engineer, Agile Coach, expert DevOps et auteur, approfondit dans cet article quelques aspects plus pratiques et techniques du métier de SRE et quelques concepts fondamentaux, notamment celui de la fiabilité.

Faire de la SRE

Faire de la SRE, c’est travailler sur la fonctionnalité la plus importante d’un système : la fiabilité, une « fonctionnalité » qui précède toute autre. Si vous n’êtes pas convaincu, imaginez que vous ayez besoin d’utiliser un service dont le fonctionnement repose, en tout ou en partie, sur les systèmes d’information, l’électronique, les télécommunications et autres industries connexes.

Prenez n’importe quel service en ligne, plus ou moins critique. Si l’assistant qui vous réveille le matin et diffuse votre radio préférée n’est peut-être pas indispensable, la qualité du smartphone qui permet d’interagir avec vos parents, amis, collègues, de gérer vos documents et vos rendez-vous, est peut-être plus critique. Si votre smartphone indique « non disponible » et que les applications de votre compte bancaire, Google, les réseaux sociaux et Wikipédia ne fonctionnent pas, des problèmes dans l’organisation de votre journée pourraient survenir. Avec diverses nuances de criticité, ce sont – sous le capot – des plates-formes très sophistiquées qui interagissent et fonctionnent les unes avec les autres, s’auto-équilibrent et se composent souvent de millions, voire de milliards de lignes de code et de périphériques matériels.

Mais à quoi bon toutes ces choses, si au contraire elles sont peu fiables, inaccessibles, pleines d’erreurs, d’inefficacités, ou ne réagissent pas aux pics de demandes ? Les fonctionnalités qu’elles offrent correspondent aux possibilités du monde réel ; l’idée est donc qu’elles restent performantes et réactives pour ceux qui les utilisent, avec une qualité de service à la hauteur des besoins.

Inconvénients possibles

Il y a beaucoup de choses qui peuvent mal tourner. Premièrement, les systèmes deviennent intrinsèquement instables avec le temps. En raison de leur incroyable complexité, ils ont tendance à se casser et il est nécessaire de travailler en continu pour que cela ne se produise pas. Les travaux sur les systèmes et leur mise à jour ne doivent pas être effectués uniquement lorsque des « accidents », ou des événements à caractère exceptionnel, surviennent, ils doivent s’inscrire dans le cadre du statu quo afin d’éviter l’inertie, l’obsolescence et la dette technique. Ces derniers sont tous des démons qui menacent non seulement la qualité des services, mais aussi la possibilité de continuer à y introduire des changements : si d’une part la tâche des SRE est de maintenir les systèmes stables, celle des programmeurs est de coder et maintenir les fonctionnalités des produits, avec des versions logicielles continues. Chaque version pourrait donc introduire de nouvelles erreurs et une complexité – l’autre caractéristique nécessaire, mais coûteuse, des systèmes en jeu.

Si télécharger un fichier depuis votre Drive peut apparaître comme un simple geste, derrière lui se cache une chaîne d’événements sans fin : depuis le réseau de radiotéléphonie mobile, le flux de données voyage encapsulé, crypté, dans une fibre optique, à travers des câbles transocéaniques, qui le transportent en quelques millisecondes dans un centre de données distant, et inversement. A leur tour, il existe des liaisons de données qui permettent à ces infrastructures de communiquer entre elles, de fournir des services réseau, du matériel, mais aussi de l’énergie et du gaz sur le réseau – encore plus en amont. Cela se passe également au niveau du paiement en magasin, des services de billetterie, des réseaux ferroviaires, autoroutiers, aéronautiques et de signalisation civile, de la chirurgie à distance, des diagnostics médicaux dans le cloud et bien d’autres encore. Ce sont toutes des plateformes pivots pour des secteurs entiers et pour la qualité de vie personnelle : industrie, communication, éducation, marketing, médias, santé, administration publique, processus démocratiques – presque tout le secteur des services – et plus encore.

Fiabilité

C’est pourquoi la fiabilité est la caractéristique en amont de tout système. Cependant, c’est aussi une caractéristique difficile à communiquer car, lorsqu’elle est présente, elle peut facilement être considérée comme allant de soi, et il est difficile de toujours donner la juste importance à ce thème. Pour corriger ce petit biais cognitif, les rôles et les structures organisationnelles des SRE sont souvent autonomes par rapport aux Software Engineers, qui construisent plutôt les produits.

La valeur attribuée au SRE est donc de maintenir ces produits stables sur les systèmes ; sans erreur, maintenable, utilisable par l’utilisateur – peu importe ce qui se passe.

La valeur qu’un SRE offre à son organisation et aux utilisateurs de ses produits est celle de garantir la stabilité des systèmes de production, la maintenabilité du logiciel et un haut niveau de qualité de service. Tout cela quelles que soient les conditions externes, qu’il s’agisse de pics de trafic ou de versions continues de nouvelles fonctionnalités.

Fabio Mora

Fabio Mora

Fabio Mora est un programmeur indépendant et coach Agile passionné par l’Extreme Programming et Linux. Attiré par l’open source, l’économie et de tout ce qui touche aux mathématiques et à la data science, il fonde d’abord une agence web puis travaille chez eBay en tant qu’ingénieur logiciel. Il aime la musique, l’ingénierie du son et la diffusion scientifique.

Suivez Fabio Mora sur LinkedIn

Partagez ce post, choisissez votre plateforme !

Newsletter

Abonnez-vous à la newsletter QRP International pour recevoir des articles, du contenu utile et des invitations pour nos événements à venir.

QRP International utilisera les informations que vous fournissez dans ce formulaire pour vous envoyer des e-mails. Nous aimerions continuer à vous tenir informé des dernières actualités et contenus innovants et informatifs. Ces contenus sont conçus pour vous aider à être plus efficace dans votre rôle et conserver, mettre à jour vos compétences professionnelles.

Vous pouvez vous désinscrire à tout moment en cliquant sur le lien qui se trouve en bas de chacun de nos e-mails ou en nous contactant à marketing@qrpinternational.com. Nous traiterons vos informations avec respect. Pour plus d'information sur notre politique de confidentialité, visitez notre site internet. En cliquant ci-dessus, vous acceptez que nous puissions traiter vos informations conformément à ces termes.

We use Mailchimp as our marketing platform. By clicking below to subscribe, you acknowledge that your information will be transferred to Mailchimp for processing. Learn more about Mailchimp's privacy practices here.