Panique sur m0le.net

Bonsoir à tous,

 

Certain l'auront peut-être remarqué, mais m0le.net était inaccessible depuis 12h55 environs, et ceux jusqu'à mon Hard Reboot du serveur (via la console OVH) vers 18h20...

Je n'explique pas ce qu'il s'est passé, pour la simple et bonne raison que je n'ai eu :

  • Aucun avis de OVH (OVH ping mon serveur en continu, et m'envoie un mail dès qu'il ne ping plus)
  • Aucun log depuis 12h55 dans tout mon /var/log/*
  • Nagios/shinken ne m'ont rien alerté du tout ...
  • Aucune partition pleine, ni en taille, ni en inode
  • Pas d'accès extérieur bizzare
  • Pas de drop firewall gargantuesque

 

Je ne sais plus quoi penser et ou regarder :s

Si vous avez des idées, ou si vous avez vous aussi rencontré ce type de problème, n'hésitez pas à en discuter en commentaire (ou par mail) à nono [at] m0le [dot] net

Comments

Comment by Alda on 2012-03-29 11:41:40 +0200

Hello,

Je viens de voir ton article parlant du plantage de ton serveur, j'ai eu le même problème il y a deux ans sur mon 1er kimsufi (et j'avais pas trouvé de solution à l'époque…) ainsi que sur mon second pas plus tard qu'en Janvier (résolu fin février…)
J'en parle ici en détail: http://aldarone.fr/la-configuration-par-defaut-ca-marche-jusqua-ce-que-ca-marche-plus/

Dans mon cas c'était un problème matériel je m'en suis rendu compte en trouvant le message: [Hardware Error]: Machine check events logged dans /var/log/kern.log après chaque reboot. Tu peux rebooter ton serveur en mode rescue pour tester RAM et CPU et aussi lancer mcelog pour voir si un problème matériel a été détecté par le noyau.

J'espère que ça t'aidera ^_^

A+

Comment by Nono on 2012-03-29 11:46:01 +0200

Merci de ton commentaire (et de ton mail 😉 ), je vais check ça à tête reposé 🙂

Comment by Arthur on 2012-03-29 23:31:38 +0200

Je n'ai jamais eu ce problème, mais par curiosité, je veux bien un retour si jamais tu trouves quelques chose. 🙂

Comment by Nono on 2012-03-30 19:28:20 +0200

pas de *error* dans mon /var/log/kern.log, j'ai "lu" tout le log, j'ai rien trouvé comme erreur :/

Comme c'est la première fois, je laisse le bénéfice du doute, j'y reviendrait plus tard si je trouve quelques chose d'anormal ...

Comment by H3 on 2012-03-31 14:12:20 +0200

Un stagiaire qui a renversé son café sur le serveur ? 😀

Comment by Nono on 2012-03-31 14:15:55 +0200

J'ai ri 🙂