søndag 18. september 2011

Making Facebook Self Healing

Interessante nyheter på url:http://rss.slashdot.org/~r/Slashdot/slashdot/~3/9shqwZZ2ypM/Making-Facebook-Self-Healing:
Nye Innsenderen djeps skriver "Jeg pleide å oppnå noen grad av automatisert problemløsning med Nagios hendelseshåndterer skript og RabbitMQ, men Facebook har gjort det på en langt større skala enn min gamle dager administratorvennlige Sitere:. 'Når infrastrukturen er på størrelse med Facebook-tallet, er det alltid brutt servere og biter av programvare som har gått ned eller er generelt dårlig oppførsel. I de fleste tilfeller er våre systemer konstruert slik at disse problemene forårsaker liten eller ingen innvirkning på folk å bruke området. Men noen ganger kan små strømbrudd kan bli større driftsstans, forårsaker feil eller dårlig ytelse på nettstedet. Hvis et stykke ødelagt programvare eller maskinvare ikke påvirke området, så er det viktig at vi reparere det eller erstatte det så raskt som mulig. ... Vi måtte finne en automatisert måte å håndtere denne typen saker, slik at den menneskelige ingeniørene kan fokusere på å løse og forebygge de større, mer komplekse avbrudd. Så begynte jeg å skrive manus når jeg hadde tid til å automatisere fikser for ulike typer av knuste servere og biter av programvare. "

Les mer i denne historien på Slashdot.


Ingen kommentarer:

Legg inn en kommentar