Après un peu plus de 24h de coupure le serveur 3 est de nouveau fonctionnel. Ce dernier servant aux séries archivées, c'est à dire des séries terminés ou qui n'ont pas eu le succès escompté, beaucoup de séries étaient durant ces dernières heures impossible à télécharger.
De même, le forum qui se trouvait sur ce même serveur a lui aussi subit cette panne.
Tout comme le top-sites.
Il est vrai que regrouper autant de services importants d'o-a sur une machine est risqué, on en a eu la preuve. Mais cependant ça reste le meilleur compromis financier tant ce serveur est un gouffre financier mais aussi une machine bourré de puissance.
Concrètement il s'est passé quoi ?
C'est simple, encore une fois (car oui c'est la 3ème fois), un disque nous a laché. En théorie perdre un disque c'est le cauchemard de n'importe qui mais pas le notre ! En effet toutes nos machines possèdent ce qu'on appel un raid, pour résumé simplement, le raid permet d'avoir exactement les même données sur deux ou 3 ou 4 disques. En gros quand vous mettez un fichier sur la machine il est toujours doublé, triplé, ...
L'utilité de ce système est de pouvoir vite repartir en cas de casse d'un disque, voir que cela soit transparent, en effet le disque mirroir devient principal, on prépare l'intervention, on coupe la machine 10min on met le nouveau disque, il se synchronise avec l'autre (il copie ses données) et c'est repartie (en fonction du volume de données la synchro peut durer longtemps, le volume du serveur 3 se compte en TO, d'où les 6h d'attente pour que les deux disques se synchronisent.
Oui mais si ça doit être transparent pourquoi il y a eu une coupure de plus de 24h ?
Car ce serveur 3 est particulier, il possède plusieurs disques et on a voulu utiliser dessus le raid 5, un compromis entre sécurité et stockage. Car le problème du raid c'est qu'en faisant un disque miroir du principal vous le rendez en quelque sorte inutile, vous n'aurez au final en stockage concret que l'espace d'un disque. Là vu qu'on en avait plusieurs on a trouvé un compromis. Mais si un disque casse, il faut agir au plus vite car il peut en entrainer d'autres (disques) avec lui. On a donc privilégié la sécurité des données et on a coupé le serveur 3 le temps de changer le disque, on a ainsi éviter l'écriture de nouvelles données sur les disques.
Le problème que l'on constate avec le raid 5 est qu'il diminue grandement dans notre utilisation la durée de vie des disques, on en perd environ 1 tous les 6 mois ... Mais bon ca reste un excellent compromis.
Et là encore par sécurité, Johann garde un backup sur une machine à lui de l'intégralité des serveurs, 3 To ! On est jamais trop prudent
Désolé pour cette coupure qui n'aurait du durer que quelques heures si l'hébergeur avait été plus réactif mais bon c'est comme ça ^^
Merci aussi à Johann, qui lui a pour le coup été extrêmement réactif

Aide
















