Data Insider

Qu’est-ce qu’un centre d'opérations du réseau (NOC) ?

Un centre d'opérations du réseau (NOC) est un lieu centralisé où les équipes IT peuvent superviser en continu les performances et la santé d’un réseau. Le NOC sert de première ligne de défense contre les perturbations et les pannes du réseau.

Grâce au NOC (prononcé « noque »), les entreprises obtiennent une visibilité totale sur leur réseau, ce qui leur permet de détecter les anomalies et de prendre des mesures pour prévenir les problèmes ou les résoudre rapidement lorsqu’ils se manifestent. Le NOC supervise l’infrastructure et l'équipement (du câblage aux serveurs), les systèmes sans fil, les bases de données, les pare-feux, les divers périphériques réseau (y compris les dispositifs IoT et les smartphones), les télécommunications, les tableaux de bord et les rapports. Ses services de gestion incluent également la supervision des appels des clients et des systèmes de tickets d'assistance clients, et ils s'intègrent aux outils de réseau des clients. On comprend donc que le NOC joue un rôle considérable pour la qualité de l’expérience client.

Le NOC peut être mis sur pied et hébergé à l’interne, souvent dans le datacenter, mais cette fonction peut aussi être sous-traitée à une société externe spécialisée dans la supervision et la gestion du réseau et des infrastructures. Quelle que soit l’approche de conception, le personnel du NOC a pour mission de détecter les problèmes et de prendre rapidement des décisions pour les résoudre.

Prédictions | Les technologies qui façonneront 2021

À quoi sert le NOC ?

Pour dire les choses simplement, l’objectif du NOC est de maintenir les performances et la disponibilité du réseau à un niveau optimal, et d'assurer son fonctionnement continu. Le NOC gère un large éventail d'activités stratégiques :

  • Supervision du réseau et détection des problèmes nécessitant une attention spéciale, notamment ceux qui proviennent de sources extérieures.
  • Gestion des serveurs, des réseaux et des appareils, en incluant l’installation, la mise à jour, le dépannage et la distribution des logiciels sur tous les périphériques.
  • Réponse aux incidents, gestion des pannes électriques et des problèmes des lignes de communication.
  • Sécurité : supervision et analyse des menaces, déploiement des outils, en conjonction avec les opérations de sécurité.
  • Sauvegarde, stockage et récupération en cas de sinistre.
  • Gestion des données d'emails, d'appels vocaux et vidéos.
  • Gestion des correctifs.
  • Gestion des pare-feux et des systèmes de prévention des intrusions, et gestion des antivirus.
  • Application des politiques.
  • Amélioration des services grâce à la collecte de commentaires et de recommandations d’utilisateurs.
  • Suivi des accords de niveau de service.
  • Gestion des fournisseurs, des travailleurs indépendants et des sous-traitants.

La gestion du réseau et la supervision des performances n’ont jamais été aussi difficiles à réaliser. Les entreprises d’aujourd’hui font face à des réseaux de plus en plus complexes : elles ont des bureaux dans le monde entier, des collaborateurs en télétravail et un nombre toujours plus considérable d'appareils à gérer et à superviser.

Le volume d’utilisateurs, le trafic web et les logiciels malveillants peuvent nuire aux performances du réseau, et le risque peut venir de partout. Même des problèmes apparemment mineurs peuvent entraîner des interruptions désastreuses pour la productivité et votre capacité à répondre aux besoins des clients.

Il y a quelques années, Gartner a publié un rapport indiquant qu’une minute d’arrêt pouvait coûter 5 600 $ à une entreprise. Les pannes de réseau nuisent aux revenus et à la productivité, et dégrade la réputation de votre équipe informatique et de l’entreprise dans son ensemble. Dans cette optique, les NOC sont spécialement conçus pour éviter les interruptions de service, pour que les clients et les utilisateurs finaux internes ne sachent même pas quand un incident ou une panne inévitables se produisent.

Quels sont les rôles principaux au sein du NOC ?

Dans le NOC, vous trouverez une équipe de techniciens – des ingénieurs, des analystes ou des opérateurs – et plusieurs chefs d'équipe et superviseurs. Le personnel du NOC doit posséder des compétences particulières en surveillance, en maintenance et en résolution rapide des problèmes de performance au sein du réseau. Ce niveau de connaissance dépasse généralement le bagage du professionnel IT non spécialisé. Les techniciens NOC possèdent généralement une expérience significative dans le domaine de la supervision du réseau et des outils associés. Beaucoup détiennent aussi des certifications avancées sur le sujet.

Comme il n’est pas toujours possible pour de nombreuses petites entreprises de dédier toute une équipe à la seule mission de surveiller les performances du réseau, des prestataires de services tiers proposent aussi des services de NOC comme alternative au NOC interne.

noc stock

Comment conçoit-on un NOC ?

Idéalement, le NOC doit avoir sa propre salle. On pourra couvrir un mur d'écrans vidéo offrant une visibilité en temps réel sur les performances du réseau, les incidents en cours et les alertes. Les écrans seront montés en grille et connectés de manière à pouvoir fonctionner comme une seule et même unité haute résolution. La taille de l’espace physique du NOC et de l'équipe dépend de celle de l’entreprise et du datacenter.

C’est sur le mur vidéo que les alertes apparaissent et montrent spécifiquement aux techniciens où se situent les problèmes, quel appareil ou quelle ligne est touchée. Les écrans peuvent également diffuser des actualités et des informations météorologiques qui permettent aux techniciens d'adapter leurs plans aux problèmes en cours pouvant affecter plus largement les opérations réseau. Le mur vidéo est également connecté aux différents postes de travail de la salle, où les techniciens ont pour mission de superviser une technologie ou une problématique particulière. Les techniciens peuvent ensuite explorer les problèmes connexes et suivre les protocoles mis au point pour résoudre l’incident.

Chaque poste de travail est équipé de plusieurs moniteurs pour faciliter et accélérer l’analyse des informations et rendre la réponse plus efficace. Chaque poste est également lié à un système PA qui permet aux techniciens de communiquer entre eux et de partager rapidement des informations. Les techniciens peuvent également envoyer des informations sur les alertes sur le mur vidéo pour qu’elles soient visibles de tous.

Dans les grandes entreprises, on aménage souvent une salle réservée à une équipe chargée de la gestion des incidents réseau graves.

Généralement, le NOC adopte une approche hiérarchique de la gestion des incidents. Les techniciens sont catégorisés en niveaux (3 niveaux la plupart du temps) selon leur compétence et leur expérience dans la résolution de problèmes particuliers. Lorsqu’un technicien NOC découvre un problème, il crée un ticket qui le place dans une catégorie en fonction du type et de la gravité de l'alerte, entre autres critères. Si le technicien NOC affecté à un niveau particulier ne parvient pas à résoudre rapidement le problème, celui-ci est transmis au niveau supérieur, et ainsi de suite jusqu’à résolution complète.

La combinaison d’un équipement puissant et d’un personnel hautement compétent agissant selon des protocoles très spécifiques permet au NOC de fonctionner sans interruption.

Quelle est la différence entre un NOC et un SOC ?

Si le NOC se concentre sur les performances et la disponibilité du réseau, le centre des opérations de sécurité (SOC) rassemble des outils et des professionnels qui supervisent, détectent et analyse la position de sécurité d’une entreprise 24h/24, 7j/7.

Les techniciens du NOC recherchent les problèmes susceptibles de dégrader la vitesse et la disponibilité du réseau, tandis que les techniciens du SOC ont pour mission de repousser les menaces de cybersécurité et réagir aux attaques. Le SOC se focalise également sur la protection des données des clients et de la propriété intellectuelle. Les NOC gèrent plutôt des événements réseau courants, qui se produisent naturellement, tandis que les SOC répondent presque toujours aux menaces externes qui ciblent le réseau de l’entreprise.

Le NOC comme le SOC assument des fonctions stratégiques pour l’organisation – identification, exploration et résolution des problèmes – et les deux s’efforcent de résoudre rapidement les problèmes avant qu’ils n’affectent les activités. De plus, les deux fonctionnent de façon similaire, partageant la même approche hiérarchique de la résolution des incidents. Mais les problèmes qu’ils traitent sont de natures très différentes. Par conséquent, les compétences, connaissances et pratiques du personnel des deux unités sont également différentes. Un technicien NOC doit comprendre les tenants et les aboutissants de la supervision et de la gestion des applications et du réseau, tandis qu’un analyste SOC va se concentrer exclusivement sur la sécurité.

Cela dit, les SOC et les NOC doivent collaborer pour démêler les incidents majeurs et résoudre les crises, donc les deux équipes ne doivent pas être isolées l’une de l’autre. On sera surpris d'apprendre que près d'un tiers des entreprises n’indiquent que peu ou pas de contact entre le NOC et le SOC, et qu’elles soient 20 % à dire que les équipes ne coopèrent que pendant les urgences, selon une étude de SANS. Les experts encouragent toutefois une meilleure intégration du NOC et du SOC. L’intégration des deux unités – même si elles restent essentiellement séparées au quotidien – commence par la mise en place de procédures opérationnelles, l’automatisation de certaines actions et l’adoption d’outils permettant la collecte et le partage des données de surveillance du réseau entre le NOC et le SOC.

Un NOC peut-il assumer les fonctions d’un SOC ?

Lorsqu’il n’est pas possible de mettre en place un NOC et un SOC distincts, le NOC peut superviser et résoudre les problèmes de sécurité, bien que ce ne soit pas idéal. Les NOC peuvent détecter les menaces de sécurité et le font effectivement, car elles affectent les performances du réseau, et un personnel formé peut leur apporter une réponse efficace. Ce dernier aspect est toutefois crucial. Les techniciens doivent rechercher les menaces de sécurité, et posséder les compétences nécessaires pour intervenir. Les professionnels aussi compétents dans le domaine des performances du réseau que dans celui de la sécurité sont rares.

Outre le bon ensemble de compétences, les NOC orientés sécurité doivent disposer des bons outils pour résoudre les incidents de sécurité. Par exemple, le système de gestion des événements et des informations de sécurité (SIEM), offrant une visibilité totale sur les activités en cours sur votre réseau, est un outil indispensable. Les SIEM collectent, lisent et catégorisent les données machine issues d’un large éventail de sources sur le réseau, puis les analysent pour vous permettre d'agir en temps réel. Pour résumer, le SIEM automatise une grande part de la charge de travail d’une équipe SOC classique. Il met au jour les incidents tout en réduisant les faux positifs, ce qui facilite la tâche d’un NOC chargé de garder un œil sur la sécurité.

Quelles sont les bonnes pratiques relatives au NOC ?

Les bonnes pratiques en lien avec un centre des opérations réseau donnent la priorité à la formation, s’appuient sur des rôles clairement définis et établissent des protocoles et des moyens de communication clairs.

Faites de la formation et du développement des connaissances une priorité : Votre équipe NOC doit avoir une expertise de haut niveau, spécifiquement dans la supervision, la gestion et la résolution des problèmes propres aux performances du réseau et à votre infrastructure IT. Assurez une formation robuste et fréquente sur les procédures et les protocoles associés à tous les événements, et tenez-vous à jour de l’évolution du paysage technologique et de votre environnement informatique. Donnez la priorité aux problèmes de performance du réseau mais ne négligez pas les procédures de collaborations avec le SOC sur les questions de sécurité. La question de quand "escalader" est une problématique de procédure essentielle. Veillez à ce que vos collaborateurs sachent quand et comment prendre la décision rapide de transmettre un problème qui grossit trop à un collègue plus expérimenté.

Définissez des rôles clairs : notre époque privilégie les hiérarchies plus plates. Face au rythme rapide du monde actuel de la surveillance du réseau, qui exige une action immédiate, il est justifié de donner de l’autonomie à chaque collaborateur plutôt que de s'attacher à un système rigide d'autorisations basées sur le rang ou le rôle. Pourtant, si les techniciens doivent avoir les connaissances et l’autorité nécessaires pour agir rapidement afin d'éviter les pannes, les niveaux d’escalades et les chefs d'équipe sont indispensables à la bonne administration du NOC.

Si les techniciens du NOC doivent avoir la liberté de faire leur travail et de proposer leurs éclairages – à l’abri de toute forme de micro-management, bien évidemment – il faut qu’un chef d'équipe répartisse le travail entre les techniciens selon leurs compétences, hiérarchise les tâches, prépare les rapports, veille à la bonne résolution des incidents et tienne les autres fonctions de l’entreprise informées des événements au besoin. De plus, chaque technicien doit savoir précisément quelles tâches sont attendues de lui, quel est son niveau et quelle est sa ligne hiérarchique s’il doit escalader ou prendre en charge un incident.

Mettez en place des communications robustes : il n’est pas forcément simple de garder les lignes de communication ouvertes entre le NOC, le SOC et les autres équipes externes. Il faut bien plus qu’une poignée de réunions régulières. Au contraire, il faut un effort concerté pour former le personnel aux modalités de partage des informations, et pour veiller à ce qu’ils s'acquittent de ces obligations. Un NOC solide a impérativement besoin d'avoir des opportunités régulières de collaboration et de coordination.

Mettez en place des directives et des protocoles clairs : assurez le bon déroulement des opérations en créant des politiques rigoureuses pour encadrer les activités suivantes :

  • Gestion des incidents : documentez les étapes que les techniciens doivent suivre pour gérer les incidents (par exemple, dans quelles circonstances le technicien peut prendre une décision, quand escalader la décision, quand informer ses collaborateurs, etc.).
  • Solutions : décrivez les procédures de prise en charge des problèmes courants et fournissez des méthodes immédiates de gestion des urgences.
  • Escalade : déterminez dans quelles conditions l’équipe doit escalader les problèmes, et à qui.
  • Hiérarchisation : identifiez les types d’incidents qui doivent être traités en priorité et quel niveau de techniciens doit traiter les plus importants. Les incidents doivent être classés en fonction de l’impact qu’ils peuvent exercer sur les activités.

Disposer de protocoles établis garantit que toutes les parties prenantes sont sur la même longueur d’onde, assure la cohérence des opérations à l'échelle de l’entreprise et renforce la responsabilisation du personnel du NOC. Certes, du personnel compétent et des processus solides forment d’excellentes fondations, mais le véritable travail ne peut se faire sans les bons outils.

Comment choisir les bons outils pour votre NOC ?

L’outil dans lequel vous devez investir dépend largement des besoins de votre entreprise, mais votre NOC doit disposer d’un outil ou d’un groupe d’outils offrant :

  • Une image complète de votre infrastructure : qu’elle soit physique, virtuelle ou dans le cloud.
  • L'automatisation : pour réduire les tâches répétitives, libérer le personnel de niveau 1 pour qu’il se concentre sur des problèmes plus importants et réduire le déluge d'alertes.
  • La gestion des tickets : pour voir les informations liées aux tickets ouverts, les tâches prioritaires et les techniciens auxquels elles sont affectées, afin de résoudre rapidement les problèmes internes et externes.
  • Le signalement des incidents : un outil délivrant des analyses visuelles et une représentation graphique des seuils, alarmes, indicateurs et tendances, facilite l’exploration des problèmes et leur documentation à des fins de référence future.
  • Une interface et un déploiement simples : vous voulez profiter des avantages de l’outil sans attendre ni devoir traverser un déploiement long et complexe, doublé d’une courbe d'apprentissage ardue.
  • L'évolutivité : il faut que votre NOC puisse gérer la croissance de votre entreprise.

L’outil que vous choisirez doit vous donner une visibilité complète sur tout votre réseau et vous permettre d’explorer les données et les problèmes ainsi qu'améliorer votre réponse aux incidents au fur et à mesure.

Pour résumer : n'attendez plus

Le centre d’opérations du réseau est l’une des équipes fonctionnelles les plus importantes de l’IT. Jour après jour, vos clients internes et externes se fient à vos services informatiques. Vous avez des accords de niveau de service (SLA) à respecter, la productivité de l’entreprise à assurer, et toute l’expérience numérique de vos clients à préserver.

Il est important d'avoir un NOC capable de maximiser la disponibilité de tous les services informatiques et d'éviter les pannes catastrophiques. De nombreuses entreprises se sont dotées d'un NOC mais parviennent difficilement à entretenir une équipe suffisamment nombreuse et formée, et à l’équiper des meilleurs outils et systèmes d'automatisation. Les entreprises qui ne parviennent pas à maintenir un NOC efficace auront sans doute plus de chances avec des prestataires de services tiers.