Utilisez cette procédure pour identifier les incidents sous
Linux.
En cas d'incident survenant sur votre système ou partition logique
Linux, essayez de recueillir des informations le concernant afin de le résoudre vous-même ou d'aider votre support technique ou prestataire de maintenance matérielle à le résoudre plus rapidement et efficacement.
Points à prendre en compte lors de l'identification d'incidents Linux :
- Le matériel a-t-il subi une panne électrique ou une baisse de tension momentanée ?
- La configuration matérielle a-t-elle changé ?
- Des logiciels système ont-ils été ajoutés ?
- Des programmes ou des mises à jour ont-ils été installés récemment ?
Vérifiez les connexions suivantes :
- Vérifiez que le cordon d'alimentation est branché.
- Vérifiez que vos câbles sont bien connectés.
Votre serveur a-t-il déjà été configuré avec une ou plusieurs partitions logiques ?
Le serveur n'a jamais été partitionné
et il n'y a pas de console HMC ou de programme Integrated Virtualization Manager
- Le serveur est-il sous tension ou pouvez-vous le mettre sous tension ?
- Non : Passez à l'étape 2.
- Oui : Vérifiez que le serveur est bien sous tension et passez à l'étape 4.
- Procédez comme suit pour vérifier que le serveur reçoit bien l'alimentation électrique :
- Si le serveur est protégé par un circuit de déconnexion d'urgence (EPO), vérifiez que l'interrupteur d'arrêt d'urgence n'est pas activé.
- Si vous disposez d'un dispositif d'alimentation de secours, vérifiez que les câbles sont correctement connectés au système et que le dispositif fonctionne.
- Lorsque le serveur est branché à une source d'alimentation en bon état de marche, l'un des événements suivants se produit :
- Si vous disposez d'un panneau de commande, la fenêtre Fonctions/Données du panneau de commande (opérateur) s'éclaire.
- Si vous ne possédez pas de panneau de commande, les voyants système du contrôleur BPC s'allument.
- Le panneau de commande (opérateur) est-il éclairé ?
- Oui : Démarrez le serveur en appuyant sur le bouton d'alimentation du panneau de commande (opérateur), puis passez à l'étape 4.
Remarque : Si le serveur s'arrête et qu'un code de référence s'affiche dans la fenêtre Fonctions/Données du panneau de commande (opérateur), notez ce code et toutes les éventuelles informations qui vont avec et allez à la section
Liste des codes de référence destinés aux clients.
La procédure est terminée.
- Non : Il y a un incident au niveau de l'alimentation. Vérifiez que la source d'alimentation serveur fonctionne correctement (par exemple, la prise murale fonctionne correctement et le cordon d'alimentation n'est pas défectueux). En cas de problème avec la source d'alimentation, prenez contact avec votre support technique ou votre prestataire de maintenance matérielle. La procédure est terminée.
- Le panneau de commande (opérateur) affiche-t-il un code de référence ?
- Oui : Passez à l'étape suivante.
- Non : Passez à l'étape 9.
- Le voyant d'avertissement sur le panneau de commande (opérateur) est-il éclairé ?
- Oui : Passez à l'étape 9.
- Non : Passez à l'étape suivante.
- D'autres messages relatifs à cet incident (indiquant, par exemple, une unité indisponible ou un signalement d'erreurs) sont-ils affichés sur la console système ou bien vous sont-ils envoyés via la messagerie
électronique à partir du système d'exploitation ?
- Oui : Passez à l'étape suivante.
- Non : Contactez votre support technique ou prestataire de maintenance matérielle.
- Notez toutes les informations complémentaires qui vous parviennent depuis le panneau de commande (opérateur), les écrans ou les messages électroniques du système d'exploitation.
- Conformez-vous aux éventuelles instructions contenues dans ces informations complémentaires.
L'incident est-il résolu ?
- Oui : La procédure est terminée.
- Non : Passez à l'étape suivante.
- Le système d'exploitation fonctionne-t-il ?
- Oui : Passez à l'étape suivante.
- Non : Procédez comme suit :
- Reportez-vous aux journaux d'erreurs/des événements ASMI pour obtenir une liste des entrées de ces journaux. Pour des informations supplémentaires, consultez la rubrique
Affichage des journaux d'erreurs et d'événements.
- Passez à l'étape 11.
- Exécutez les programmes de diagnostic autonomes eServer en mode identification d'incidents. Pour connaître les détails, voir Exécution des diagnostics autonomes eServer à partir d'un CD-ROM. Notez tous les SRN indiqués à l'écran ou dans des messages électroniques. Lorsque vous exécutez les programmes de diagnostic autonomes eServer en mode identification d'incidents, vous pouvez utiliser l'option de test de ressources détectées sur votre serveur dans les programmes de diagnostic. Veillez à vérifier la liste des ressources disponibles sur votre serveur, afin d'être certain que toutes les ressources installées sont également disponibles pour le test. Si vous découvrez qu'une ressource installée sur votre système n'est pas disponible pour le test, prenez note des informations que vous possédez sur la ressource manquante et vérifiez que la ressource manquante est installée correctement. Si vous ne parvenez pas à résoudre le problème associé à une ressource manquante, remplacez la ressource manquante (contactez votre fournisseur de services en cas de besoin).
- Notez tous les éventuels autres codes de référence que vous recevez sur le panneau de commande (opérateur)/ Pour plus d'informations, voir Collecte des codes de référence et des informations système.
- Voir Liste des codes de référence destinés aux clients.
Le serveur a été partitionné et il
existe une console HMC ou un programme Integrated Virtualization Manager.
Si
vous disposez d'une console HMC, elle doit être
connectée et doit fonctionner correctement.
- Choisissez l'une des options suivantes :
- Si vous disposez d'une console HMC, vérifiez que vous avez bien effectué les étapes de la section Démarrage de l'identification des incidents.
Reportez-vous à la présente rubrique si vous y êtes invité.
- Si vous utilisez un programme Integrated Virtualization Manager,
passez à l'étape suivante.
- Parvenez-vous à démarrer le serveur et au moins une de ses partitions logiques ?
- Non : Passez à l'étape 3.
- Oui : Passez à l'étape 5.
- Procédez comme suit pour vérifier que le serveur reçoit bien l'alimentation électrique :
- Si le serveur est protégé par un circuit de déconnexion d'urgence (EPO), vérifiez que l'interrupteur d'arrêt d'urgence n'est pas activé.
- Si vous disposez d'un dispositif d'alimentation de secours, vérifiez que les câbles sont correctement connectés au système et que le dispositif fonctionne.
- Lorsque le serveur est branché à une source d'alimentation en bon état de marche, l'un des événements suivants se produit :
- Si vous disposez d'un panneau de commande, la fenêtre Fonctions/Données du panneau de commande (opérateur) s'éclaire.
- Si vous ne possédez pas de panneau de commande, les voyants système du contrôleur BPC s'allument.
- Le panneau de commande (opérateur) ou le contrôleur BPC est-il éclairé ?
- Non : Il y a un incident au niveau de l'alimentation. Vérifiez que la source d'alimentation serveur fonctionne correctement (par exemple, la prise murale fonctionne correctement et le cordon d'alimentation n'est pas défectueux). En cas de problème avec la source d'alimentation, prenez contact avec votre support technique ou votre prestataire de maintenance matérielle. La procédure est terminée.
- Oui : Démarrez le serveur.
Remarque :
Si le serveur
s'arrête et qu'un code de référence s'affiche dans la fenêtre Fonctions/Données du
panneau de commande (opérateur) ou de la console HMC ou du programme Integrated Virtualization Manager, notez ce code et toutes les éventuelles informations qui vont avec, puis passez à la section Liste des codes de référence destinés aux clients pour plus
d'informations. La procédure est terminée.
- La fonction 11 s'affiche-t-elle sur le panneau de commande du serveur (opérateur), la console HMC ou le programme Integrated Virtualization Manager ?
Remarque : Si vous utilisez le panneau de commande, pour déterminer si cette fonction existe, parcourez la liste des fonctions à l'aide des boutons d'incrémentation et de décrémentation.
Vous pouvez passer alternativement du numéro de fonction aux données en appuyant sur Entrée.
Pour connaître les détails, voir
Collecte des codes de référence et des informations système.
- Oui : Passez à l'étape 10.
- Non : Passez à l'étape suivante.
- Le voyant d'avertissement système est-il allumé ?
- Oui : Passez à l'étape 10.
- Non : Passez à l'étape suivante.
- Avez-vous reçu un message concernant cet incident, que ce soit par messagerie ou par affichage sur la console HMC ou le programme Integrated Virtualization Manager ?
- Oui : Passez à l'étape suivante.
- Non : Contactez votre support technique ou prestataire de maintenance matérielle.
- Consignez les informations de message supplémentaires dans le rapport d'incident.
Pour connaître les détails, voir Utilisation des rapports d'incident. Suivez les instructions de reprise affichées dans la fenêtre d'informations supplémentaires sur le message. L'incident est-il résolu ?
- Oui : La procédure est terminée.
- Non : Passez à l'étape suivante.
- Notez tous les SRN indiqués à l'écran ou dans des messages électroniques.
Si vous ne disposez d'aucune information SRN, exécutez les programmes de diagnostic autonomes eServer en mode identification d'incidents. Pour connaître les détails, voir Exécution des diagnostics autonomes eServer à partir d'un CD-ROM et effectuez les actions de réparation.
- Procédez comme suit :
- Enregistrez tous les codes de référence que vous recevez sur le
panneau de commande (opérateur), la console HMC ou le Integrated Virtualization Manager. Pour connaître les détails, voir Collecte des codes de référence et des informations système.
- Voir Liste des codes de référence destinés aux clients.