Facebooki ebaõnnestumine näitab, miks me ei peaks kõiges sellele lootma

Sisukord:

Facebooki ebaõnnestumine näitab, miks me ei peaks kõiges sellele lootma
Facebooki ebaõnnestumine näitab, miks me ei peaks kõiges sellele lootma
Anonim

Võtmed kaasavõtmiseks

  • Facebooki tehnilised probleemid olid kahetsusväärsed, kuid probleem oleks tõenäoliselt palju kiiremini lahendatud, kui see ei tugineks nii paljudele omavahel ühendatud süsteemidele.
  • Süsteemi tõrkeid ei saa täielikult ära hoida, kuid on võimalusi nende tõenäosuse vähendamiseks.
  • Varuplaanide olemasolu süsteemi rikke puhuks (mitte siis, kui, millal) võib teha vahet "tüütu" ja "katastroofilise" vahel.
Image
Image

Hiljutine Facebooki kokkuvarisemine näitab, kuidas omavahel ühendatud süsteemid kindlasti ebaõnnestuvad ja miks me ei peaks neid kõigeks kasutama.

Facebooki, WhatsAppi ja Instagrami kaotamine esmaspäeval mitmeks tunniks oli ebamugav, ettevõtetele kahjulik ja mõnel juhul peaaegu katastroofiline. Facebooki sõnul oli see kõik tingitud selle võrku koordineerivate ruuterite konfiguratsioonimuudatustest.

See on mõistlik seletus, kuid tõsiasi, et üks selline viga võib mitte ainult Facebooki, vaid ka teiste Facebooki omanduses olevate süsteemide jahvatamise peatada, on pisut murettekitav.

Üks vale ruuteri konfiguratsiooni muutmine põhjustas mitme teenuse ja isegi VR-peakomplektide täieliku töötamise lõpetamise. Lisaks sellele avaldas see Facebooki enda kinnitusel ka kaskaadset mõju ettevõtte andmekeskuste suhtlemisele, peatades kõik nende teenused.

"Toetumine omavahel ühendatud süsteemidele toob endaga kaasa loomupärase süsteemi või isegi teenuse rikete riski," ütles GlobalDotsi vanemtehniline müügiinsener Francesco Altomare meiliintervjuus ajalehele Lifewire,.

"Selle hirmuäratava riski vastu võitlemiseks kasutavad ettevõtted SRE (System Reliability Engineering) põhimõtet, aga ka muid tööriistu, mis kõik tegelevad süsteemi infrastruktuuri igasse kihti sisseehitatud erineva liiasuse tasemega."

Image
Image

Mis võib valesti minna

Väärib märkimist, et kui selline süsteem ebaõnnestub, nõuab see tavaliselt täiuslikku tormi, et asjad lähevad valesti. See on vähem nagu kaardimajake, mis ootab kukkumist, ja pigem nagu väikese kuu suuruse kosmosejaama avatud soojusväljalaskeava.

Enamik ettevõtteid astub samme, et püüda tagada, et üks asi, mis võib kõik kaosesse viia, ei juhtuks kunagi – kuid sellest hoolimata võib see juhtuda.

"Ootamatud tõrked on osa ärist ja võivad tekkida töötajate hooletuse, Interneti-teenuse pakkuja võrgu rikete või isegi pilvesalvestusteenuste probleemide tõttu," ütles FastPeopleSearchi kaasasutaja Sally Stevens. meiliintervjuu.

"… Kuni süsteemi kaitsmiseks vajalikud sammud, nagu varukoopiad, kohapealne ruuter ja mitmetasandiline juurdepääs, on paigas, on need tõrked üsna ebatõenäolised." Kuigi isegi suure hulga tõrkekinnituste armeega, on nööpnõel siiski võimalik.

Kui süsteem, mis juhib selliseid asju nagu esmased kontaktivormid, seadmed, uksed jne, ebaõnnestub, võivad tulemused olla märkimisväärsed. Alates kergest ebamugavusest kuni täieliku katastroofini, olenev alt sellest, kui palju üksikisikud ja ettevõtted sellele kõigele loodavad.

Image
Image

"Samuti on oht, et häkkerid pääsevad süsteemi kõige vähem kaitstud seadmetest, nagu külmikud ja ahjurösterid, " lisas Stevens, "mis võib põhjustada andmete vargusi ja lunavara."

Kuidas me saame valmistuda

Ei saa kuidagi garanteerida, et süsteem kunagi ebaõnnestub, kuid on võimalik astuda samme, et tõrkeid vähendada või rikkeid sujuvam alt lahendada. Ideaalne oleks nende kahe lähenemisviisi kombinatsioon, mis ühendab tõrkekindlad ja vastumeetmed situatsiooniplaanide ja varusüsteemidega.

"Tõhus alt käsitletavate kolmandate osapoolte toodete ja teenuste põhjustatud ohtude kõrvaldamiseks tuleb kolmanda osapoole riskijuhtimisega seotud rollid ja kohustused rangelt välja tuua," ütles Daniela Sawyer, FindPeopleFasti asutaja ja tehnoloogiajuht. meiliintervjuus: "Et areneda selles uues keskkonnas, peavad riskijuhid mõistma sellise keeruka ökosüsteemi olulisi osi."

Facebooki, WhatsAppi ja Instagramiga juhtunu oli kahetsusväärne, kuid loodetavasti ka silmiavav. Inimesed, kes toetuvad omavahel ühendatud süsteemidele, peavad mõistma, et õige asi, mis läheb valesti, võib kõik häirida. Ja tuleb võtta meetmeid (või neid hoolik alt uurida ja täiustada), et muuta sellised häired vähem tõenäoliseks ja vähem mõjusaks.

Facebooki puhul ei olnud selle probleemiks ruuteri probleemid, vaid peaaegu kogu selle ökosüsteem oli kõige muuga ühendatud. Seega, kui Facebook (teenus) lakkas, pidi Facebook (ettevõte) kulutama palju rohkem aega ja energiat lihts alt probleemi korraldamisele ja lahendamisele. Kui see kas ei kasutaks nii sügav alt juurdunud, omavahel ühendatud süsteemi või oleks taolise katkestuse lahendamiseks paigas varuplaanid, oleks selle parandamine tõenäoliselt võtnud palju vähem aega.

Soovitan: