Cette procédure permet d'effectuer l'identification des incidents sous AIX.
En cas d'incident survenant sur votre serveur ou sur votre
partition logique AIX,
tentez de recueillir davantage d'informations sur cet incident afin soit
d'y remédier, soit d'aider votre support technique ou votre prestataire de
maintenance matérielle à y remédier plus rapidement et avec une plus
grande précision.
Lors de la résolution d'incidents de serveur
AIX, gardez présents à l'esprit les points suivants :
- Le matériel a-t-il subi une panne électrique ou une baisse de tension momentanée ?
- La configuration matérielle a-t-elle changé ?
- Des logiciels serveur ont-ils été ajoutés ?
- Des programmes ou des mises à jour ont-ils été installés récemment ?
Vérifiez les connexions suivantes :
- Vérifiez que le cordon d'alimentation est branché.
- Vérifiez que tous vos câbles sont bien connectés.
Votre serveur a-t-il déjà été configuré avec une ou
plusieurs partitions logiques ?
Le serveur n'a jamais été
partitionné et il n'y a pas de console HMC ou de gestionnaire Integrated Virtualization Manager
- Le serveur est-il sous tension ou pouvez-vous le mettre sous tension ?
- Non : Passez à l'étape 2.
- Oui : Vérifiez que le serveur est bien sous tension et passez à l'étape 4.
- Procédez comme suit pour vérifier que le
serveur est correctement alimenté :
- Si le serveur est protégé par un circuit de déconnexion d'urgence (EPO), vérifiez que l'interrupteur d'arrêt d'urgence n'est pas activé.
- Si vous disposez d'un dispositif d'alimentation de secours, vérifiez que les câbles sont correctement connectés au système et que le dispositif fonctionne.
- Lorsque le serveur est relié à une source d'alimentation en bon état
de marche, l'une des situations suivantes se présente :
- Si vous disposez d'un panneau de commande, la fenêtre Fonctions/Données du panneau de commande (opérateur) s'éclaire.
- Si vous ne possédez pas de panneau de commande, les voyants système du contrôleur BPC s'allument.
- Le panneau de commande (opérateur) est-il éclairé ?
- Oui : Démarrez le serveur en appuyant sur le bouton d'alimentation du panneau de commande (opérateur), puis passez à l'étape 4.
Remarque : Si le serveur s'arrête et qu'un code de référence s'affiche dans la fenêtre Fonctions/Données du panneau de commande (opérateur), notez ce code et toutes les éventuelles informations qui vont avec et allez à la section
Liste des codes de référence destinés aux clients.
La procédure est terminée.
- Non : Un incident concernant l'alimentation s'est produit. Vérifiez que la source d'alimentation serveur fonctionne correctement (par exemple, la prise murale fonctionne correctement et le cordon d'alimentation n'est pas défectueux). Si vous ne parvenez pas à identifier d'incident sur la source
d'alimentation, prenez contact avec votre support technique ou avec votre
prestataire de maintenance matérielle. La procédure est terminée.
- Le panneau de commande (opérateur) est-il éteint ?
- Oui : Passez à l'étape 9.
- Non : Passez à l'étape suivante.
- Le voyant d'avertissement sur le panneau de commande (opérateur) est-il éclairé ?
- Oui : Passez à l'étape 9.
- Non : Passez à l'étape suivante.
- D'autres messages relatifs à cet incident sont-ils affichés sur
la console système ou bien vous sont envoyés via la messagerie
électronique à partir du système d'exploitation ?
- Oui : Passez à l'étape suivante.
- Non : Prenez contact avec votre support
technique ou avec votre prestataire de maintenance matérielle.
- Enregistrez toute information complémentaire disponible à
partir du panneau de commande (opérateur), des écrans joints ou de la messagerie électronique du système d'exploitation.
- Conformez-vous aux éventuelles instructions contenues dans ces informations complémentaires.
L'incident est-il résolu ?
- Oui : La procédure est terminée.
- Non : Passez à l'étape suivante.
- Le système d'exploitation fonctionne-t-il ?
- Oui : Passez à l'étape suivante.
- Non : Procédez comme suit :
- Reportez-vous aux journaux d'erreurs/des événements ASMI pour obtenir une liste des entrées de ces journaux. Pour des informations supplémentaires, consultez la rubrique
Affichage des journaux d'erreurs et d'événements.
- Passez à l'étape 11.
- Enregistrez toute information SRN affichée
par la messagerie électronique ou accessible à partir de cette dernière.
Remarque : Si vous ne disposez d'aucun SRN, il est possible d'en afficher un à l'aide du
système d'exploitation. Procédez comme suit pour afficher les résultats de précédents diagnostics effectués en ligne en mode simultané :
- Ouvrez une session AIX en tant que
superutilisateur ou utilisez l'identifiant du technicien de maintenance. Pour obtenir de l'aide, prenez contact avec l'administrateur système.
- Entrez la commande diag pour charger le contrôleur de
diagnostics et afficher les menus de diagnostic en ligne.
- Dans le menu Sélection de fonctions, choisissez Sélection d'une tâche.
- Dans le menu Liste de sélection des tâches, choisissez Affichage
des résultats de tests de diagnostic précédents.
- Dans le menu Résultats de tests de diagnostic précédents, sélectionnez Affichage du journal des diagnostics abrégé.
Un écran Affichage du journal des diagnostics s'affichera
avec une table chronologique des événements enregistrés dans le journal des erreurs. Recherchez dans la colonne T l'entrée S la plus récente. Appuyez sur la touche Entrée pour sélectionner la ligne dans la table, puis sélectionnez Validation. Le détail de cette entrée va s'afficher ; recherchez le SRN (vers la fin de l'entrée) et notez-le.
- Notez tous les éventuels autres codes de référence que vous recevez sur le panneau de commande (opérateur)/ Pour plus d'informations, voir Collecte des codes de référence et des informations système.
- Voir Liste des codes de référence destinés aux clients.
Le serveur a été partitionné et il
existe une console
HMCou un gestionnaire Integrated Virtualization Manager.
Si vous disposez d'une console
HMC, celle-ci doit
être connectée et doit fonctionner correctement.
- Choisissez l'une des options suivantes :
- Si vous disposez d'une console HMC, assurez-vous que vous avez exécuté
les étapes de la section Démarrage de l'identification des incidents.
Reportez-vous à la présente rubrique si vous y êtes invité.
- Si vous utilisez un gestionnaire
Integrated Virtualization Manager, passez à l'étape suivante.
- Parvenez-vous à démarrer le serveur et au moins une de ses partitions logiques ?
- Non : Passez à l'étape 3.
- Oui : Passez à l'étape 5.
- Procédez comme suit pour vérifier que le
serveur est correctement alimenté :
- Si le serveur est protégé par un circuit de déconnexion d'urgence (EPO), vérifiez que l'interrupteur d'arrêt d'urgence n'est pas activé.
- Si vous disposez d'un dispositif d'alimentation de secours, vérifiez que les câbles sont correctement connectés au système et que le dispositif fonctionne.
- Lorsque le serveur est relié à une source d'alimentation en bon état
de marche, l'une des situations suivantes se présente :
- Si vous disposez d'un panneau de commande, la fenêtre Fonctions/Données du panneau de commande (opérateur) s'éclaire.
- Si vous ne possédez pas de panneau de commande, les voyants système du contrôleur BPC s'allument.
- Le panneau de commande (opérateur) ou le contrôleur BPC est-il éclairé ?
- Non : Un incident concernant l'alimentation s'est produit. Vérifiez que la source d'alimentation serveur fonctionne correctement (par exemple, la prise murale fonctionne correctement et le cordon d'alimentation n'est pas défectueux). Si vous ne parvenez pas à identifier d'incident sur la source
d'alimentation, prenez contact avec votre support technique ou avec votre
prestataire de maintenance matérielle. La procédure est terminée.
- Oui : Démarrez le serveur.
Remarque :
Si le serveur
s'arrête et qu'un code de référence s'affiche dans la fenêtre Fonctions/Données du
panneau de commande (opérateur) ou de la console HMC ou
du gestionnaire Integrated Virtualization Manager,notez ce code et toutes les éventuelles informations qui vont avec, puis passez à la section
Liste des codes de référence destinés aux clients pour plus d'informations. La procédure est terminée.
- La fonction 11 s'affiche-t-elle sur le panneau de commande du serveur (opérateur), de la console
HMC ou du gestionnaire
Integrated Virtualization Manager ?
Remarque : Si vous utilisez le panneau de commande, servez-vous des
boutons d'incrément ou de décrément pour faire défiler les différentes
fonctions et déterminer si la fonction 11 existe.
Vous pouvez passer alternativement du numéro de fonction aux données en appuyant sur Entrée.
Pour connaître les détails, voir
Collecte des codes de référence et des informations système.
- Oui : Passez à l'étape 9.
- Non : Passez à l'étape suivante.
- Le voyant d'avertissement système est-il allumé ?
- Oui : Passez à l'étape 9.
- Non : Passez à l'étape suivante.
- Avez-vous reçu un message concernant cet incident, que ce soit par messagerie ou par affichage sur la console
HMC ou le gestionnaire Integrated Virtualization Manager ?
- Oui : Passez à l'étape suivante.
- Non : Prenez contact avec votre support
technique ou avec votre prestataire de maintenance matérielle.
- Consignez les informations supplémentaires fournies par message dans
le formulaire de rapport d'incident.
Pour connaître les détails, voir Utilisation des rapports d'incident. Suivez les instructions de reprise affichées dans la fenêtre d'informations supplémentaires sur le message. L'incident est-il résolu ?
- Oui : La procédure est terminée.
- Non : Passez à l'étape suivante.
- Procédez comme suit :
- Enregistrez tous les codes de référence que vous recevez sur le
panneau de commande (opérateur), la console HMC ou
le gestionnaire Integrated Virtualization Manager. Pour connaître les détails, voir Collecte des codes de référence et des informations système.
- Voir Liste des codes de référence destinés aux clients.