Plateforme matérielle

  • État Terminé
  • Pourcentage achevé
    100%
  • Type Incident
  • Catégorie Réseau → Switchs
  • Assignée à
    Aurélien PONCINI
  • Système d'exploitation All
  • Sévérité Basse
  • Priorité Très Basse
  • Basée sur la version 1.0
  • Due pour la version Non décidée
  • Échéance Non décidée
  • Votes
  • Privée
Concerne le projet: Plateforme matérielle
Ouverte par Aurélien PONCINI - 14.09.2015
Dernière modification par Aurélien PONCINI - 06.04.2016

FS#414 - Perte d'un switch

Notre routeur BGP principal pe1.ncp1.par.as199712.fr est actuellement down. Nous investiguons pour connaitre la raison. Le routeur PE2 assure une continuité de service. Aucun impact n'est normalement à prévoir. UPDATE 13H18 : après les premières investigations, il s'agit d'un stack de switchs dans notre baie qui est down à 50% entrainant une perte d'accès au routeur BGP ainsi qu'à beaucoup de liens vers nos équipements. La majorité de ces liens étant redondés, il n'y a pas d'impact client.

Admin
Aurélien PONCINI a commenté le 14.09.2015 11:46
Le switch 01a composant le stack 01 est toujours down et nous ne pouvons obtenir aucune information à distance. Tout le trafic passe par le switch 01b et sort donc pas le routeur pe2 et plus par pe1. Aucune incidence côté utilisateur tant que la situation ne se dégrade pas plus...
Admin
Aurélien PONCINI a commenté le 14.09.2015 12:03
Aurélien PONCINI se rends sur place immédiatement.
Admin
Aurélien PONCINI a commenté le 14.09.2015 14:24
Bien que le switch soit allumé, il semblerait que ce soit l'alimentation qui soit défectueuse. Nous ouvrons un case chez HP.
Admin
Aurélien PONCINI a commenté le 17.09.2015 15:53
Les investigations avec HP se poursuivent, l'alimentation n'est pas en cause. Les câbles de stack ont été testés et ne semblent pas en cause. Nous allons procéder au cours du week-end à une déconnexion du switch A afin d'effectuer un reset puis nous réinjecterons la configuration. Si cela fonctionne nous le remettrons dans le stack afin de voir si le souci provient des modules de stack. Aucune interruption n'est à prévoir, nous serons très précautionneux lors des débranchements de câbles ;)
Admin
Aurélien PONCINI a commenté le 21.09.2015 12:51
Nous attendons le remplacement du switch par HP.
Admin
Aurélien PONCINI a commenté le 22.09.2015 19:03
Le switch reçu ce jour de la part de HP est fonctionnel. Nous venons de procéder aux différents tests avec module 10GB et module de stack, le comportement est correct. Nous allons désormais procéder au remplacement dans la baie, opération très compliqué dans la mesure où les oreilles du switch sont derrière celles des PDU (quand on a la poisse...). Nous allons prendre toutes les précautions pour ne pas impacter le reste de l'infrastructure. SW-2920-48-01# show stacking Stack ID : 01007446-a05b8e80 MAC Address : xxxxxxxxxxxxxxx Stack Topology : Ring Stack Status : Active Split Policy : One-Fragment-Up Uptime : 454d 4h 0m Software Version : WB.15.13.0005 Mbr ID Mac Address Model Pri Status --- ------------- -------------------------------------- --- --------------- 1 6cc217-0c62c0 HP J9728A 2920-48G Switch 128 Standby 2 7446a0-5a71c0 HP J9728A 2920-48G Switch 130 Commander SW-2920-48-01#
Admin
Aurélien PONCINI a commenté le 22.09.2015 19:07
La config des éléments liés aux switch 01A ayant sauté nous allons d'abord procéder à une "reprogrammation". :(
Admin
Aurélien PONCINI a commenté le 03.11.2015 13:30
Une intervention sera programmée dans les jours qui viennent. Afin que l'information soit bien visible, une nouvelle tâche sera créer (un update de celle-ci ne serait pas vu par tout le monde).

Chargement...

Available keyboard shortcuts

Liste des tâches

Task Details

Task Editing