Newsoo & K-Net : venez tester !

Démarré par Optix, 22 Juillet 2014 à 22:23:15

« précédent - suivant »

0 Membres et 4 Invités sur ce sujet

Youtube sera en cache

Google dit que la réduction est de l'ordre de 80%
J'ai ouie dire par Boris que la réduction chez Bytel était de 90%
Mes propos sont le fruit exclusif de mon cerveau, et ne sont pas soumis au maître esprit.

90% ... wahoo ... donc tout le monde regarde la meme chose. (qui a dit pensée unique...? )

Citation de: jack le 19 Août 2014 à 09:23:25
Youtube sera en cache

Google dit que la réduction est de l'ordre de 80%
J'ai ouie dire par Boris que la réduction chez Bytel était de 90%

CA doit demander des caches immenses,  non ?


Merci Optix bon courage :)

j'espère que ca va aussi regler le prob d'authentification qui dure + de 2min ^^

J'ai trouvé ça

Il parait donc que le minimum de serveur soit de 3 (6ru)
Avec 12 disques par serveur, 2 ou 3TB par disque, cela fait une capacité minimale de 72 (ou 108) TB

Y'a de quoi en mettre des commentaires g+ et des photos de chat!


on a du mieux 4/10 bots :)
l'authentification est un peu plus rapide

#66
Hellow.

Je reviens vers vous pour vous signaler que SBG vient de repartir.

On dispose d'un nouveau serveur de stockage (Sto3) pour faire monter l'ensemble à 120 To. On a également profité de l'intervention pour rajouter de la RAM à Sto2 qui s'emballait facilement. La weathermap a été actualisée et vous voyez que la charge se réparti bien : les performances devraient être au RDV pour les fibrés :)

A noter qu'on a perdu une journée de feed à peu près, mais on peut compenser en ajoutant de nouveaux groupes supplémentaires, dont les Big8 et quelques alt.* dans la foulée :)

(https://pbs.twimg.com/media/Bvdl-67IIAAqC-T.jpg:large)
(https://pbs.twimg.com/media/BvdmA5PIcAE5tzo.jpg:large)
(https://newsoo.fr/cacti/weathermap.png)

Passez une excellente soirée !

merci Optix

par contre bizarrement on est tjrs bloqué a 2 voir 3 bots et tjrs autant de temps pour s'authentifier 

Citation de: Nash le 20 Août 2014 à 22:37:24par contre bizarrement on est tjrs bloqué a 2 voir 3 bots et tjrs autant de temps pour s'authentifier
Pénible ce truc.

En fait, tu as ce comportement, car tu me demandes un article que je ne possède pas en local, du coup je me connecte en arrière-plan à mon provider actuel pour lui demander et te le refiler. Malheureusement, ce dernier a beaucoup de mal à suivre mon rythme et remonte les erreurs à ton client.

D'où l'intérêt de monter notre réseau et d'investir à fond. Pour ton contenu, on stocke déjà ces dates là :
(http://i.imgur.com/RmQR60u.png)
Si la date de POST correspond à l'un de nos dossiers et que l'article est toujours indispo, ça signifie qu'il nous manque le groupe en feed (ce qui est tout à fait possible, on ajoute des groupes au fur et à mesure). Il faut nous donner le nom et je demande à nos peers de nous mettre en feed dessus :)

Je vais quand même tenter un truc ce weekend, à base de "haproxy" pour taper sur le backend qui répond favorablement (car il y a différentes IP, pour l'instant je mitraille qu'une seule). Ca devrait beaucoup moins merder après :)

EN tout cas je constate un mieux sur les requêtes, j'ai quasiment plus les phases d'enregistrement entre les paquets et les 10 connexions sont actives, ce qui n'était pas toujours le cas! ;-) ;D

Rapport d'incident
=================================

SBG.Newsoo.Fr a été indisponible durant le 21 et 22 août 2014 pour un problème de stockage.

Cause :
==========
Sto3 a été installé et mis en production le 20 août 2014. Il a été configuré en RAID5 avec 1 disque manquant (car en panne dès le début). Le serveur tournait donc en mode dégradé (càd on avait la pleine capacité, mais qu'il y a risque de perte de données si panne supplémentaire).

Un nouveau disque dur neuf a tout de suite été racké le 21 août (le lendemain). Le système a commencé à reconstruire le RAID pour revenir en mode "sain" et tolérer une nouvelle panne. Malheureusement, un autre disque a lâché pile pendant cette phase ultra critique. Mode dégradé + panne supplémentaire = tout est pété !

Sachant que le stockage géré par FhgFS est en RAID0 sur l'ensemble du réseau pour répartir la charge, Sto3 a tout détruit car les données de Sto1 et Sto2 sont nulles sans Sto3.

Les disques utilisés sur Sto3 sont des WD RED 4To. Sto4 est prévu avec des 6To, espérons qu'ils tiendront un peu mieux ^^

Solutions mises en oeuvre :
==========
> Newsoo est reparti de 0 en reconfigurant toutes ses machines de stockage en RAID6 afin de tolérer 2 pannes simultanées par machine. Le but est de rajouter de la redondance au plus bas niveau (la machine) pour que le haut, l'ensemble du réseau en profite (sans devoir doubler chaque machine en plus). Grâce au RAID software, les CPU n'ont aucun mal à gérer la légère charge supplémentaire.

> Newsoo a augmenté la RAM de chaque machine afin de mieux absorber la montée en charge et surtout les pics en cas de forte activité soudaine. Chaque machine passe de 16 à 24 Go (je garde encore 8Go sous le pied au cas où).

> Newsoo avait encore un point critique : les bases de données, non redondées. Au lieu de faire du RAID1 sur la même machine, les bases de données sont répliquées en temps réel sur une autre machine pour pouvoir profiter d'une répartition de charge et mieux encaisser la charge là aussi.

Améliorations :
==========
> A la vue des excellentes performances de la base de données LevelDB (Google), Newsoo l'utilise maintenant aussi pour y stocker les headers des articles (avant MariaDB/MySQL s'en chargeait). Le listing des groupes et de leur contenu (sous Grabit, Unison etc) devrait être nettement plus rapide encore.

> Au lieu de rajouter une entrée BDD à chaque article feedé ou posté, le serveur constituera dès maintenant des "lots" pour regrouper les ajouts et envoyer par paquet de 100 pour accélérer encore davantage la réactivité (déjà énorme) pour encaisser toujours plus de contenu. Ca n'a pas manqué, on était proche de la saturation du lien AmsIX en fin d'après midi lors du redémarrage.

Voilà, j'en ai pas mal chié pour tout refaire bien comme il faut, avec une meilleure tolérance aux pannes. En fait c'est un juste milieu à trouver : les newsgroups n'ont pas besoin de sécurité des données, répliquées dans plusieurs datacenters et tout le tralala, mais de performances pures. Seulement voilà, j'ai aussi un taff à temps plein avec une vie personnelle et faut que je sois moi-même un peu zen, sans devoir paniquer dès qu'un disque lâche qui peut tout faire tomber. Du coup j'ai réhaussé toute la partie sécurité et dispo pour que ça reste correct. J'espère avoir trouvé un meilleur équilibre cette fois-ci pour que Newsoo puisse grossir et gérer davantage de rétention, sans recommencer du début :)

PS : sachant que SBG recommence la rétention au 22/08/2014, ça risque de bouchonner un peu pendant les prochains jours, le temps qu'on reconstitue qq jours dans le ventre. Je vous conseille de checker l'intérieur des groupes avec GrabIt (Windows) ou Unison (Mac) par ex, ça montre ce qu'on stocke sur sbg avec un excellent débit.

Bon weekend :)

Ceci explique donc celà...
En tout cas, pour le moment, je ne reçois que "Impossible de se connecter au serveur".. ;D
Bon courage!

Super! j'avais loupé ce sujet!

Je vais tester ça de ce pas!  :-* :-*

Citation de: JC01 le 27 Août 2014 à 18:05:17
Super! j'avais loupé ce sujet!

Je vais tester ça de ce pas!  :-* :-*

Et j'arrive pas à dl ;p

#74
J'ai des erreurs "400 le backend n'arrive pas à suivre" dans Niouzefire. Est-ce un problème chez vous ou c'est Niouzefire qui me fait des trucs bizarres ?
Et bien entendu je n'arrive pas à DL sur les 10 connexions permises.