|
Dans la série des coups de stress de l'administrateur système & réseau (ce qui est en définitive assez fréquent), une source de stress récurrente est OVH.
Sans faire de mauvaise pub, depuis le mois d'août, ils ont décidé de 'purifier' leur architecture. Grand bien leur fasse car il est vrai que pas mal de Spammeurs, Hackeurs et "Gars-qui-feraient-mieux-de-rester-en-mutualisé" se sont empressés de se jeter sur l'offre Kimsufi, qui selon moi et pas mal de monde, venait concurrencer Dedibox sur le marché jusqu'ici monolithique des serveurs dédiés.
Avant de revenir au sujet qui est 'Votre Serveur OVH boote pas' décrivons la problématique des fournisseurs de serveurs Low-cost. En même temps, le marché ayant évolué je trouve que finalement ce sont les autres fournisseurs qui sont High-cost mais bon passons....
Donc le problème est assez simple : les Spammeurs adorent ce type d'offres car ça leur permet d'avoir des IPs pas cher pour spammer. Conséquence : en fonction de votre chance du moment, vous pouvez tomber sur une plage d'IP chez Dedibox ou OVH qui est blacklistée... par Hotmail (Gmail est plûtot efficace contre le spam, Yahoo! : euh SpamAssassin fait définitivement mieux !!).
Dans le cas des hackeurs, disont globalement que ce sont des "utilisateurs" qui paient pas, il hackent une machine et l'utilise pour spammer, scanner les machines voisines, ou tout simplement héberger des contenus illicites à votre insue..... Brrrrr...
Et puis ben ils reste les "Gars-qui-feraient-mieux-de-rester-en-mutualisé", ben comme leur nom l'indique, ce sont les victimes des hackeurs. Pour la simple raison qu'il font un calcul assez simple :
"Mon mutualisé me coute x par mois par site, et comme je veux monter 120 sites/blogs (ou alors un gros forum sur War Of Warcraft dont aucun mutualisé ne veut), je me dit que je me prend un serveur à20 ou30 par mois et c'est tout benef !!"
Le calcul est bon, mais uniquement dans le Monde merveilleux des bisounours ! Parce que un mutualisé il y 1 ou plusieurs admins qui s'occupent des machines et les chouchoute, un dédié faut se le chouchouter soit même, et il faut lui faire ce qu'il aime sinon il boude (ou boote pas !).
Euh, tu devais pas parler de serveur OVH qui boote pas ?? On y arrive !! Donc chez OVH on prend tout ça au sérieux, et ils ont raison !! Du coup ils ont mis en place des régles de filtrage au niveaux de leur routeurs. La dernière qui m'a causé un accroissement de stress inutile c'est la protection contre les Scans SSH.
Je développe : Redjuice gère une vingtaine de serveurs répartis sur plusieurs fournisseurs(Dedibox, OVH, RackSpace, Staminus, IPT,....) et continents (Europe et USA), pour gérer tout ce petit monde capricieux je me suis codé quelques scripts qui me permettent d'avoir une vision globale de notre infrastructure. Ces scripts utilisent des Clefs SSH pour s'authentifier auprès des serveurs qu'ils manipulent. Et donc ces scripts lancent en parralèle des commandes SSH sur ces 20 serveurs. Et c'est la que le bas blesse, OVH on décidés il y a quelques jours de limiter le nombre de connections par serveur, visiblement ça serait 1 toutes les 30 secondes, ce qui me semble être ridicule ! Et donc mon serveur vient de se faire arrêter accompagné d'un mail m'expliquant qu'ils me laissait un accès FTP en lecture seule pour récupérer mes données !!
Après les avoir appelés plusieurs fois leur avoir fait un topo complet sur ma vie, mon oeuvre, mes scripts shell, j'arrive à récupérer mon serveur. Je leur explique que ce sont mes IPs, que ma machine est pas hackée, que j'ai dessus portsentry (détection de scan de ports), mod_security(firewall applicatif HTTP), chkrootkit (un peu d'imagination ?), rkhunter (pour Rootkit Hunter), et que en plus les sites hébergés dessus ne sont pas super sensibles au intrusions.
Me voila donc avec un accès SSH en mode rescue (un genre de mode sans échec windows....un genre). Consciencieux je regarde mes logs, passe 2-3 outils pour vérifier que des fichiers "malveillants" ne sont pas apparus... brrrrr..... Enfin tout bien quoi !
Je reboote la machine et ...ta-tan !! Pas de ping ! A ce stade il est vendredi soir, et j'ai pas envie de passer la nuit avec la machine....Par contre je sens bien que ça ne lui déplairait pas la bougresse !! Mais non ma cocotte je suis pas motivé ! Va falloir que je trouve un moyen rapide de te regler ton compte en 15 minutes chrono et pis partir loin de toi..... boire quelques bières. C'est vendredi soir....
A cet instant une illumination me traverse la tête : chroot la un grand coup et elle va te lacher !!!
Sans rentrer dans les considérations profondes de chroot, disons que c'est le truc magique qui se décrit en une phrase simple 'Change Root'. L'idée c'est que sous linux on peut changer la racine du système de fichier. Donc en gros en mode rescue le disque original est pas monté, on peut le monter la ou on veut par exemple, soyons fous, dans /mnt :
mount /dev/sda1 /mnt
en faisant un ls /mnt le dique est là et intacte.
ensuite on chroot la machine :
chroot / /mnt
En clair : la racine maintenant c'est /mnt. Ensuite reste plus qu'a démarrer apache, mysql, bind et ce qui est vital. Faut aussi monter /proc et puis on est bien. Chrootée en 15 minutes elle est calmée et je peux enfin m'évader....
Je laisse le week-end passer et je me motive pour résoudre le problème avec OVH. 1 fois sur 6 je tombe sur un gars, je pense que c'est le même d'ailleurs, un gars qui aime ça. On sentait bien qu'il était assez offusqué de voir que cette machine de voulait pas démarrer, on à exploré de multitude de pistes pendant 2 bonnes heures. Après les avoir toutes explorées on en arrive à la conclusion qu'il va falloir que quelqu'un du datacenter aille voir physiquement la machine démarrer afin de voir ce qu'affiche l'ecran. Mais pour ça il y a un genre de procédure qui implique que je coupe la machine, et que entre 2 et 4 heures plus tard quelqu'un allait aller voir.
C'est exactement ce que j'ai fait et au bout de 1h45 elle a fini par booter sans encombre et en mode normal et ce, bien que le RAID ai été reconstruit et que les disques avaient été vérifiés.
Pour l'info c'est un quadri duo core, 12Go de RAM, avec 2 disques de 750Go RAID1 en reiserfs.
|