Nedetid

Varsling av nedetid

Ikke-planlagt nedetid (strømbrudd, nettproblemer, etc.) skal så fort som mulig varsles til berørte brukere.

Planlagt nedetid (omstart av tjenere etc.) skal, om mulig, varsles minimum et døgn i forkant. Normal prosedyre er 48 timer. Husk å ta veldig godt i når dere varsler nedetid; all erfaring tilsier at det tar mye lenger å rydde opp i ringvirkningene av oppgraderinger enn folk tror. Ikke vær redd for bare å si «hele kvelden». Presiser også gjerne hvilke tjenester som påvirkes av nedetiden.

All nedetid bør forberedes grundig. Om man sier at nedetid starter 18, burde ikke folk komme dettende inn i fjerde 1805; alle involverte burde være til stede 1730 og ha en klar idé om hva som skal gjøres, og så går reboot-kommandoen på slaget 18. Ting som kan gjøres uten å forårsake nedetid burde gjøres før nedetiden begynner (f.eks.: hvis man skal bytte ut en switch med en ny en, kan den nye få config lang tid i forveien; hvis man skal bytte kjerne eller firmware på en boks, kan den lastes ned og installeres dagen før eller tidligere).

Nedetid på nettlinja (BGP faller ut) skal varsles til UNINETT. Husk at hvis BGP flapper, detter vi av NORDUnet i flere timer, så om merete går opp og ned mange ganger, trekk ut fiberen først. Husk også å sette opp nedetid i Nagios på de berørte enhetene, slik at folk ikke blir varslet.

Nedetid skal meldes via:

Under UKA, billettslipp osv. må man vurdere eventuell utvidet varsling.

Pass på at nedetiden ikke påvirker et arrangement eller viktig billettsalg.

Kassesystemet under nedetid

Bak hver bar på samfundet er det to betalingskasser. Disse bruker et master/slave prinsipp der den ene kassen fungerer som master. Slaven er avhengig av kommunikasjon med masterkassen for å kjøre mandarin, og kommunikasjonen mellom dem går på vlan. Dersom nettverket ikke fungerer på huset, vil dette føre til at slavekassen ikke vil kunne brukes, og barene står i praksis igjen med en fungerende kasse. Verifisering av kort på kortterminalen går hovedsaklig enten gjennom ethernet eller 3g/4g. De som er avhengig av ethernet vil ikke kunne brukes under nedetid, men dette kan løses ved å benytte seg av en håndholdt kortterminal der beløpet tastes inn manuelt.

Cronjobber under nedetid

Hvis noen tjenester går ned vil flere cronjobber spamme ned itk-unix fordi de feiler. Det er ofte ikke ønskelig å få feilmeldinger fra en cronjobb som f.eks går hvert minutt under nedetid. På flere tjenere kan de fleste stoppes hvis man oppretter en fil i /etc med navn cirkus-is-down.

touch /etc/cirkus-is-down

Man må muligens også stoppe timeout-payex.pl på okkupasjon

Lenker: Start, oppgradere ios, servertodo, til nye itkere

Epost: itk@samfundet.no | Telefon: 992 15 925 | Sist endret: 2023-04-02 10:35 | Revisjon: 26 (historie, blame) | Totalt: 1887 kB | Rediger