Escolar Documentos
Profissional Documentos
Cultura Documentos
dijagnostika računalnih
sustava
Auditorna vježba 1
Uvod u toleriranje kvarova
1
1
Zašto tolerirati kvarove?
“To err is human, but to really foul things up you need a computer.”
Paul Ehrlich, nobelovac
2
2
Dizajn sustava koji tolerira kvarove
Glavna pitanja:
Mogu li sustavi ispasti iz rada i prouzročiti štetu?
Primjer je sustav Therac 25
Jedna od najpoznatijih nesreća u računalno upravljanom stroju
za terapijsko zračenje. Šest poznatih nesreća rezultirale su
predoziranjem, smrću i opasnim ozljedama.
Mogu li se koristiti standardne arhitekture sustava?
Nepraktične za siguronosno-kritične inženjerske aplikacije u
stvarnom životu
Padaju u praksi iz tri primarna razloga:
3
3
Definicija
sigurnosti:
Sigurnost u smislu vožnje automobila, letenja avionom
Npr. “Je li sigurno voziti automobil?”
Sigurnost u smislu mogućnosti nesreće (mishap)
Nesreća
MIL-STD-822D: Neplanirani dogaĎaj ili niz dogaĎaja koji rezultiraju
smrću, ozljedom, profesionalnom bolešću, oštećenjem ili gubitkom
opreme ili imovine, ili štetom okolišu.
Rizik od nesreće (Mishap risk)
MIL-STD-822D: Izraz za učinak i mogućnost nesreće u smislu
potencijalne težine nesreće i vjerojatnosti pojave.
Primjer: pad aviona u odnosu na sudar motornih vozila ima manju
vjerojatnost ali teži učinak
Važna poruka:
Sustavi nikada nisu apsolutno sigurni → potrebno smanjiti rizik
4
4
Računalni sustav
Aplikacija
Fizički entitet kojim sustav upravlja ili ga nadzire (pr. elektrana)
Senzor
UreĎaj koji konvertira aplikacijske mjerene osobine u prikladne
ulazne računalne signale
Efektor (effector)
Konvertira električne signale računalnog izlaza u odgovarajuće
fizičke akcije koje kontroliraju funkciju (pr. motor, ventil, pumpa)
Operator
Čovjek koji nadzire i aktivira računalni sustav u realnom
vremenu (pr. pilot, medicinski tehničar)
Računalo
Hardver i softver koji koristi senzore i efektore za kontrolu
aplikacije u stvarnom vremenu (pr. PLC, letno računalo, SoC)
5
5
Analiza hazarda (Hazard Analysis)
Hazard
MIL-STD-822D: “Svaki stvarni ili potencijalni uvjet koji može
prouzročiti ozljedu, bolest ili smrt osoblja, štetu ili gubitak
sustava, opreme ili imovine, ili štetu okolini.”
Primjer: gubitak nadzora nad avionom, pregrijavanje nuklearne
jezgre, prisutnost toksičnih materijala
6
6
Identifikacija aplikacijskih hazarda kako
bi se odredilo kako ispad komponenti
sustava može rezultirati nesrećom Nesreća Uništenje
električnih instalacija
Preljevanje vode
Hazard
Načini
kvara Senzor razine ne reagira
7
7
Primjena mjera ublažavanja rizika
Nesreća
Hazard
Načini kvara
8
8
Primjer
Računalni sustav električnog grijanja vode
Aplikacija
Metalni tank koji sadrži vodu
Efektor
Računalno-upravljan električki grijač
Senzor
Temperaturni senzor koji mjeri temperaturu vode i šalje je na
računalo
Računalo
Softver u računalu koji održava temperaturu vode na 50 C
upravljanjem grijačem na slijedeći način
Upaljenako je temperatura vode manja od 50 C
Ugašen ako je temperatura vode veća od 50 C
9
9
Rač. sustav električnog grijanja vode – nastavak
Hazard
Npr. pregrijavanje vode
Nesreća
Npr. pregrijavanje vode uzrokuje eksploziju tanka
Npr. čovjek otvara slavinu i zadobiva opekline od vode ili pare
10
10
Kvarovi sustava koji mogu izazvati hazard – nastavak
Operator može unijeti neispravnu točku regulacije temperature,
primjerice 100 C
Greške održavanja, primjerice serviser ugradi krivi temperaturni
senzor
Okolinski uvjeti, primjerice pretjerano topla lokacija aplikacije
može uzrokovati kvar na čipovima
Greške dizajna, primjerice upotreba neadekvatnog
temperaturnog senzora
11
11
Ublažavanje rizika od nesreće
Opcije:
1) Poboljšati pouzdanost i kvalitetu komponenata
Smanjiti vjerojatnost kvara komponente koja tada smanjuje i
vjerojatnost nesreće
2) Ugraditi unutarnje sigurnosne i upozoravajuće ureĎaje
Primjerice termopar koji prekida strujni krug za grijač
3) Ugraditi vanjske sigurnosne ureĎaje
Od jednostavne fizičke izolacije sustava do računalno
sigurnosnih sustava
12
12
Primjena ublažavanja rizika
T&P ispušni
Dodatak sigurnosnih ureĎaja kao što su
ventil
prekidač limita visoke temperature i ispušni
ventil temperature i tlaka smanjuje operacijski
rizik računalnog sustava grijanja vode
Temp.
senzor
El. grijač
Alarm Računalo
Prekidač
temp. limita
Voda
Prekidač
napajanja
Napajanje
13
13
Dodatni sigurnosni ureĎaji
Senzor
Operator
Računalo Inhibitori efektora Aplikacija
Efektor W E I S
Watchdog Vanjsko
timer sigurnosno
upravljanje
15
15
Metode evaluacije – nastavak
Modeliranje pouzdanosti (Reliability Modeling)
Razmatranje svih komponenata, zalihosnih i nezalihosnih i
odreĎivanje vjerojatnosti neispravnog rada sustava u nekom
odreĎenom vremenu
Strategija dizajniranja
Korištenje FTA za odreĎivanje sveukupne vjerojatnosti
ispada
Na temelju vjerojatnosti iz FT identificirati mjesta gdje treba
primijeniti ublažavanje
Redizajn sekcija koje jako doprinose nepouzdanosti
Nastavak ovog procesa dok se ne postigne željena
pouzdanost
16
16
“Oslonivost na sustav” (Dependability)
Kvalitativniizraz za sposobnost sustava za ispravan rad
Osobina sustava da se na njega može osloniti u vremenu,
da se može opravdano računati na njegov ispravan rad
Veličine koje su enkapsulirane izrazom su pouzdanost,
raspoloživost, sigurnost, sposobnost održavanja,
izvodivost Pouzdanost
Raspoloživost
Veličine Sposob. održavanja
Sigurnost
PredviĎanje kvarova
Toleriranje kvarova
Oslonivost Sredstva Uklanjanje kvarova
Sprječavanje kvarova
Kvarovi (faults)
Prijetnje Neispravnosti (errors)
Ispadi (failures)
17
17
Kvar – Neispravnost – Ispad
Kvar (Fault) – fizički defekt koji se dogaĎa u komponenti
(hardverskoj ili softverskoj) – fizička domena
Neispravnost (Error) – nepravilno ponašanje prouzročeno
pogreškom, manifestacija, informacijska domena
Ispad (Failure) – nesposobnost sustava za izvoĎenje
specificiranog rada, vanjska domena
Pouzdanost (Reliability)
R(t) je vjerojatnost rada sustava prema specifikacijama bez
prekida u intervalu [0,t]
R(t) je uvjetovana time da je sustav sposoban za rad u vrijeme
t=0
Nepouzdanost F(t) je vjerojatnost ispadanja sustava iz rada u
bilo kojem trenutku u intervalu [0,t]
F(t)=1-R(t)
18
18
Sigurnost (Safety)
S(t) je vjerojatnost da sustav ne ispadne iz rada u intervalu [0,t]
na način koji rezultira neprihvatljivom štetom ili drugim
katastrofalnim učincima.
Sigurnost je mjera fail-safe sposobnosti sustava
19
19
Izvodivost (Performability)
P(L,t) je vjerojatnost da će radna svojstva sustava
(performanse) biti iznad razine L u trenutku t
Mjera mogućnosti da se neka skupina funkcija izvršavaju
ispravno
To se razlikuje od pouzdanosti koja zahtjeva da se sve funkcije
izvršavaju ispravno
Sposobnost održavanja(Maintainability)
M(t) je vjerojatnost da će sustav koji je ispao iz rada biti
ponovno uspostavljen u specificiranom periodu t
Proces ponovnog uspostavljanja
20
20
Pri koliko je definicija različitih veličina oslonivosti na sustav
(dependability) upotrebljena riječ vjerojatnost?
21
21