
Un incident est arrivé hier après midi sur le serveur ayant la plus haute autorité parmi les sources de temps sur lequel se synchronise le serveur.
Or, concours de circonstance, depuis 12h23, côté F1-Express.net, un thread Apache était (pour une fois) entré en plantage occupant énormément de ressources processeur et ralentissant l'horloge logicielle (par contraste avec l'horloge matérielle) de 15 secondes par minutes.
Les autres sources de temps étant d'autorité plus faible que la principale source de temps en panne, le logiciel de synchronisation se méfia naturellement du décalage grandissant qu'il observait avec ces autres sources de temps, estimant que le ratio (vitesse de décalage avec ce serveur)/(confiance en ce serveur) était trop grand.
Ainsi donc, tant que la principale source de temps était en panne, le serveur n'a fait confiance qu'à lui-même, et a continué en autarcie, à dériver au rythme de 12 secondes de retard par minute réelle. Lorsque la principale source de temps revint en ligne, le décalage avec elle était trop suspect pour prendre la décision de se remettre à l'heure (appelant à une intervention manuelle de l'administrateur).
Nous avions donc à minuit tout juste une heure de retard et à 9h ce matin, près de 3h .. Ainsi donc des messages marqués 5h ou 6h ce matin datent en fait de 9h..
C'est bien un concours de circonstance, car en la présence de la principale source de temps, elle aurait suffit à compenser le retard dû au thread d'Apache en plantage. Et inversement sans le plantage de ce thread d'Apache, l'absence de la principale source de temps aurait été sans effet.
Hugues