Você está na página 1de 50

BIOESTATSTICA I

Departamento de Bioestatstica


Prof
a
Ldia Raquel de Carvalho
Prof. Luciano Barbosa



UNESP - BOTUCATU




1

1 - Populao e Amostra

Populao o conjunto de indivduos ou objetos ou que tm pelo menos
uma varivel comum observvel.
Ex: Conjunto de pacientes de um hospital
Conjunto de alunos da UNESP
Conjunto de animais
Conjunto de rvores

Amostra qualquer subconjunto da populao.
Varivel qualquer quantidade ou caracterstica que pode assumir
diferentes valores numricos.


Nveis de mensurao

Ao realizarmos um levantamento de dados necessrio saber o nvel
de mensurao das informaes a serem levantadas, da a necessidade de
se conhecer as escalas de medida.

1) Escala Nominal
Quando classes ou smbolos so usados para identificar os grupos a
que vrios objetos pertencem, essas classes ou smbolos, no ordenados,
constituem uma escala nominal. Por exemplo, ao classificarmos um indivduo
numa populao de acordo com uma caracterstica como, por exemplo, sexo,
ou cor dos olhos, ou estado civil, estamos usando uma escala nominal. Neste
caso as categorias se expressam nominalmente e devem ser exaustivas (no
sentido de que dem conta de todos os indivduos da populao) e
mutuamente exclusivas (no sentido de que um mesmo indivduo da populao
no possa possuir simultaneamente duas categorias).

2) Escala Ordinal
Quando, alm de classificar as unidades de acordo com as classes, a
mensurao permite ordenar essas classes relativamente ao grau de
classificao da varivel, atinge-se o nvel seguinte de mensurao
denominado de escala ordinal.
Por exemplo, quando se fala em estgios de uma doena: primrio,
moderado, avanado; h uma certa ordem de gravidade, porm essa
ordenao no fornece informao sobre a magnitude das diferenas entre os
elementos da escala. Neste caso a escala ordinal. Um outro exemplo seria o
nvel de escolaridade.


2


3) Escala de Razes
A escala de mensurao mais elevada, com origem (zero) no arbitrria
e onde possvel a realizao de todas as operaes aritmticas
denominada de escala de razes. A razo entre dois valores quaisquer da
escala independente da unidade de mensurao. Por exemplo, um indivduo
que tem 40 anos tem o dobro da idade do que tem 20 anos.
comum denominar varivel qualitativa s caractersticas medidas em
escala nominal ou ordinal e varivel quantitativa referindo-se s caractersticas
medidas em escalas intervalar ou da razo.
A varivel quantitativa pode ser contnua ou discreta. Quando a varivel
puder assumir qualquer valor numrico num determinado intervalo de variao
ela ser uma varivel contnua. Como exemplo temos as medies de peso,
altura, dosagem de hemoglobina no sangue, taxa de glicose, etc. Por outro
lado, a varivel quantitativa discreta s poder assumir valores pertencentes a
um conjunto enumervel. Ex: Nmero de filhos por casal, nmero de
radiografias tiradas no setor de radiologia de um hospital, nmero de leitos,
etc.





























3

2 - ESTATSTICA DESCRITIVA

2.1 - Apresentao Tabular dos Dados

As informaes obtidas baseadas nos elementos que constituem a
populao ou a amostra so denominadas tecnicamente de dados.
Os dados relativos a indivduos podem ser coletados tanto diretamente
pelo pesquisador, como atravs de declaraes feitas pelos prprios
indivduos. Para se obter essas informaes o pesquisador pode fazer
questionrios com perguntas para serem respondidas por escrito, ou fazer
entrevistas. Assim, por exemplo, os dados a respeito do estado de sade de
um indivduo podem ser obtidos tanto mediante exame fsico como atravs de
declaraes prestadas pelo prprio indivduo (anamnese).
Um mesmo elemento pode fornecer diversos dados. Assim, por
exemplo, os pacientes de uma clnica fornecem dados relativos a sexo, idade,
profisso, etc., alm de dados relativos ao diagnstico e ao tratamento.
Depois de se fazer levantamento de dados, isto , aps a operao de
coleta do material bsico para descrio e posterior anlise das
caractersticas de uma populao, h necessidade de os dados e os
resultados obtidos serem dispostos de uma forma ordenada e resumida, a fim
de auxiliar o pesquisador na anlise dos mesmos. Os dados e os resultados
podem ser apresentados na forma de tabelas. Existem normas nacionais para
a apresentao de tabelas.

Uma tabela possui elementos essenciais e complementares. Os
elementos essenciais so: o ttulo, o corpo, o cabealho e a coluna indicadora.
O ttulo deve preceder a tabela e designar a natureza do fato estudado,
as variveis escolhidas na anlise do fato, o local e a poca em que o mesmo
foi observado.
O corpo formado pelo conjunto de linhas e colunas onde os dados
esto colocados.
O cabealho deve especificar o contedo das colunas.
Coluna indicadora a parte em que designada a natureza (as
categorias, as modalidades da varivel) do contedo de cada linha.
Casela o cruzamento de uma linha com uma coluna, onde se tem a
freqncia com que a categoria aparece.

Os elementos complementares so: a fonte, as notas e chamadas.
Fonte o indicativo, no rodap da tabela, da entidade responsvel pela
sua organizao ou fornecedora dos dados primrios.
Notas so colocadas no rodap para esclarecimento de ordem geral.
Chamadas, tambm colocadas no rodap, servem para esclarecer
mincias em relao s casas, colunas ou linhas. So numeradas geralmente
em algarismos arbicos.
4
As tabelas devem ser fechadas no alto e embaixo por linhas horizontais.
No devem ser fechadas direita e esquerda.
Nenhuma casela da tabela deve ficar em branco, apresentando sempre
um nmero ou sinal, a saber:
- (hfen), quando o valor numrico nulo;
.. quando no se aplica dado numrico;
... (reticncia), quando no se dispe de dado;
? (interrogao), quando h dvidas quanto exatido do valor numrico;
0; 0,0; 0,00 (zero), quando o valor numrico muito pequeno para ser
expresso pela unidade utilizada.
x (letra x), quando o dado for omitido a fim de evitar individualizao da
informao.


2.2 - Distribuio de freqncias

Chama-se distribuio de freqncias a correspondncia entre
categorias ou valores possveis de uma varivel e as freqncias respectivas,
como aparecem na tabela 2.1.

Tabela 2.1 Nmero de bitos, segundo o sexo, de residentes no municpio de So Paulo
em 1970.
Sexo Nmero de bitos
Masculino 25 754
Feminino 19 300
Total 45 054
Fonte: So Paulo (Estado) Secretaria de Economia e Planejamento, Departamento de
Estatstica, 1974.


Esta tabela se refere a apenas uma varivel (sexo). Vejamos um
exemplo com duas variveis.

Tabela 2.2 Nmero e percentagem de mulheres segundo a religio e uso de mtodos
anticoncepcionais (MAC), distrito de So Paulo, 1966.
USO DE MAC

Alguma vez Nunca Total

Religio N
O
% N
O
% N
O
%
Catlica
Praticante
746 74,2 260 25,8 1006 100
Catlica no
Praticante
1149 77,2 339 22,8 1488 100
No catlica
Praticante
176 78,6 48 21,4 224 100
No catlica No
praticante
91 75,8 29 24,2 120 100
Total 2162 76,2 676 23,8 2838 100
Fonte: Berqu, E. et al., A Fecundidade em So Paulo - Caractersticas demogrficas,
biolgicas e scio-econmicas, CEBRAP, Editora Brasileira de Cincias, So Paulo, 1977.

5
Algumas vezes os dados relativos a uma varivel contnua tm preciso
maior do que aquela que o pesquisador pretende utilizar. Nesses casos
razovel apresentar os dados por faixas, de acordo com a preciso necessria.
Ento, construmos uma tabela de distribuio de freqncias. Seja por
exemplo a varivel idade.
Em primeiro lugar, definimos as faixas etrias que recebem
tecnicamente o nome de classes. Ex.:
01 10
101 20
201 30
para significar que o intervalo compreende os valores da varivel de zero
(inclusive) at dez (exclusive) e assim por diante.
til que as classes tenham a mesma amplitude, mas h situaes que
nem sempre possvel.
Definida uma classe, podemos calcular o seu ponto mdio, que dado
pela mdia aritmtica dos extremos da classe. Assim, o ponto mdio da classe
01 10 (0 + 10)/2 = 5. O ponto mdio ser usado para construo de um
grfico que veremos depois, e para calcular algumas medidas.

Exemplo:

Tabela 2.3 Distribuio de freqncias de alcolatras crnicos segundo a idade na ocasio
do incio do hbito ingerir bebidas alcolicas.
Idade Ponto mdio N
o
de indivduos
51 10 7,5 2
101 15 12,5 9
151 20 17,5 34
201 25 22,5 28
251 30 27,5 12
301 35 32,5 9
351 40 37,5 2
401 45 42,5 4
Fonte: Dantas (1979)

Quando fazemos uma pesquisa e obtemos os dados, se quisermos
organizar uma tabela como esta, ser necessrio calcular:

a) Amplitude total (R)
o maior valor menos o menor valor e aparece no conjunto de dados.
R = X
mx
- X
mn


b) Nmero de classes (K)
No existem critrios rgidos para se estabelecer o nmero ideal de
classes, podendo-se sugerir de 8 a 20 como um nmero razovel.

c) Amplitude de classe(H)
H = R/K

d) Limites de classe
Limite inferior - o limite inferior da 1
a
. classe deve ser menor ou igual ao
menor valor. Os demais limites inferiores so obtidos por: li = l
i-1
+ h
Limite superior: Li = l
i
+ h
6

Seja o exemplo:

Tabela 2.4 Medidas de capacidade vital pulmonar em litros, de 50 adultos do sexo masculino,
de 18 a 27 anos, da Santa Casa de So Paulo, 1974.
4,08 4,55 5,03 5,70 6,03
4,12 4,68 5,22 5,75 6,07
4,23 4,82 5,33 5,76 6,08
4,25 4,83 5,37 5,76 6,08
4,27 4,85 5,53 5,78 6,30
4,34 4,92 5,56 5,82 6,72
4,48 4,96 5,61 5,83 6,92
4,49 4,97 5,63 5,90 7,04
4,52 4,98 5,66 5,95 7,28
4,55 5,00 5,66 6,00 7,51
Fonte:Santa Casa de So Paulo, 1974.

Vejamos o procedimento para agrupar os dados em classes:

a) Amplitude total (R) R = Xmx - X mn
r = 7,51 - 4,08 = 3,43

b) Nmero de classes (K)
Faamos k = 8

c) Amplitude de classe (H) H = R/K
h = 3,43/8 = 0,42 0,5

d) Limites
l
1
= 4,0
l
2
= 4,0 + 0,5 = 4,5
l
3
= 4,5 + 0,5 = 5,0
Portanto, l
4
= 5,5, l
5
= 6,0, l
6
= 6,5, l
7
= 7,0, l
8
= 7,5
L
1
= 4,0 + 0,5 = 4,5
L
2
= 4,5 + 0,5 = 5,0
L
3
= 5,0 + 0,5 = 5,5
Portanto, L
4
= 6,0 , L
5
= 6,5, L
6
= 7,0, L
7
= 7,5, L
8
= 8,0

Tabela 2.5 Distribuio de freqncias de medidas de capacidade vital pulmonar, em litros, de
50 adultos do sexo masculino, de 18 a 27 anos, da Santa Casa de So Paulo, 1974.
Capacidade Vital Nmero de adultos Porcentagem
4,0 1 4,5 8 16,0
4,5 1 5,0 11 22,0
5,0 1 5,5 5 10,0
5,5 1 6,0 15 30,0
6,0 1 6,5 6 12,0
6,5 1 7,0 2 4,0
7,0 1 7,5 2 4,0
7,5 1 8,0 1 2,0
Fonte: Santa Casa de So Paulo, 1974.




7
2.3 - APRESENTAO GRFICA

A apresentao grfica de dados pode ser usada para aumentar a
legibilidade de resultados de pesquisas. Os grficos devem ser auto-
explicativos e de fcil compreenso. Devem sempre ter um ttulo e devem ser
construdos em uma escala que no desfigure os fatos ou as relaes que se
deseja destacar. (A altura deve ter de 60% a 80% da largura). Deve ser
colocada tambm a fonte de obteno dos dados.

Representao grfica de varivel qualitativa

Quando trabalhamos com variveis qualitativas os grficos mais usados
so: grfico de colunas, de barras, de setores, de crculos, de linhas.

Exemplo:

Tabela 2.6 Percentuais de bitos de menores de 1 ano, por grupos de causas, Curitiba, de
1951 a 1955.
Grupos de causas Percentuais
Causas congnitas 21,92
Causas gastro-intestinais 39,96
Causas respiratrias 17,50
Causas infecciosas 7,68
Outras causas 9,56
Causas no especificadas 3,38
Total 100,00
Fonte: Sounis, Emilio - Bioestatstica (1979)

Grfico de colunas - a representao em que, sobre o eixo horizontal, em
intervalos apropriados, constroem-se retngulos cujas reas so proporcionais
s freqncias das categorias da varivel em estudo. Se usarmos a mesma
base para os diversos retngulos bastar construir retngulos cujas alturas
sejam proporcionais s freqncias.

0
5
10
15
20
25
30
35
40
c o ng ni t as g ast r o-
i nt est i nai s
r e spi r at r i a s i n f ec c i o sas O ut r as no
es pec i f i c ada s
C au sa s
P er cen t u ai s

Figura 1 - Percentuais de bitos de menores de 1 ano, por grupos de causas, Curitiba, de 1951
a 1955.
Fonte: Sounis, Emilio - Bioestatstica (1979)
8


Grfico de barras - semelhante ao grfico de colunas, porm os retngulos
so dispostos horizontalmente.
0 5 10 15 20 25 30 35 40
congnitas
gastro-intestinais
respiratrias
inf ecciosas
Outras
no especif icadas
Causas
Percentuais

Figura 2 - Percentuais de bitos de menores de 1 ano, por grupos de causas, Curitiba, de 1951
a 1955.
Fonte: Sounis, Emilio - Bioestatstica (1979)

















9

Grfico de crculos - alm do retngulo, uma outra figura geomtrica utilizada
o crculo ou conjunto de crculos. Sabemos que a rea do crculo o produto
do nmero irracional (3,1416) pelo quadrado do raio (r),ou seja,
c r = .
2
, e desde que as reas dos diversos crculos devem ser
proporcionais s magnitudes das freqncias, isto , c f = . , onde fator
de proporcionalidade, segue-se que:

. . f r =
2
e
r f =

.


Se chamarmos

de ' , tem-se que r f = ' . Assim, os raios dos


crculos devem se proporcionais raiz quadrada das freqncias das
modalidades da varivel. Portanto, para o nosso exemplo, os raios dos crculos
devero ser proporcionais, respectivamente, a:
' , 39 96
' , 2192
' , 17 50
' , 9 56
' , 7 68
' , 3 38
fazendo ' = 0,4 , teremos
0,4 . 6,32 = 2,53
0,4 . 4,68 = 1,87
0,4 . 4,18 = 1,67
0,4 . 3,09 = 1,24
0,4 . 2,77 = 1,11
0,4 . 1,84 = 0,73








Gastro-intestinais Congnitas Respiratrias Outras Infecciosas No especificadas

Figura 3 - Percentuais de bitos de menores de 1 ano, por grupos de causas, Curitiba, de 1951
a 1955.
Fonte: Sounis, Emilio - Bioestatstica (1979)

10

Grfico de setores - neste tipo de grfico, divide-se a rea total de um crculo
em subreas (setores) proporcionais s freqncias.
Essa diviso pode ser obtida atravs da regra de trs:

total - 360
parte - x

100% - 360
3,38% - x x= 12,17

100% - 360
7,68% - x x= 27,65

100% - 360
9,56% - x x= 34,42

Para as demais freqncias teremos 63, 78,91e 143,85.

congnitas
gastro-intestinais
respiratrias
infecciosas
Outras
no especificadas

Figura 4 - Percentuais de bitos de menores de 1 ano, por grupos de causas, Curitiba, de 1951
a 1955.
Fonte: Sounis, Emilio - Bioestatstica (1979)






11

Grfico linear - Neste tipo de grfico unem-se as extremidades das retas,
tendo-se ento o grfico linear.

Exemplo:
Tabela 2.7 Nmero de casos da molstia X, na rea Z, 1970/1974.
Anos Nmero de casos
1970 8 000
1971 7 600
1972 7 200
1973 7 300
1974 7 000
Total 37 100



6600
6800
7000
7200
7400
7600
7800
8000
1970 1971 1972 1973 1974


Figura 5 - Nmero de casos da molstia X, na rea Z, 1970/1974.











12

Distribuies de duas ou mais variveis qualitativas


Quando se passa das distribuies de uma varivel para duas variveis,
em lugar de retngulos construdos sobre bases de mesmo comprimento,
necessitamos paraleleppedos de mesma rea e, finalmente, em lugar de exigir
que as reas dos retngulos sejam proporcionais s freqncias exigimos que
os volumes sejam proporcionais. Com isto os grficos devem ser construdos
em perspectiva, o que fica mais difcil. Ex.:

Tabela 2.8 Populao da Capital de So Paulo (em milhares), segundo o sexo e trs grupos
etrios, 1950.
Grupos etrios
Sexo I
1
I
2
I
3
Total
Masculino 325 638 127 1090
Feminino 318 669 133 1120
Total 643 1307 260 2210
Fonte: IBGE, Censo demogrfico - 1950.


I1 I2 I3
0
100
200
300
400
500
600
700
P
o
u
l
a

o

(
e
m

m
i
l
h
a
r
e
s
)
I1 I2 I3
Idade
Mas
Fem




Figura 6 - Populao da Capital de So Paulo (em milhares), segundo o sexo e trs grupos
etrios, 1950.
Fonte: IBGE Censo demogrfico - 1950.




13


Uma outra opo que facilita bem representar as modalidades da
distribuio de uma das variveis, para cada um dos valores da outra varivel;
assim o grfico fica reduzido a um grfico de colunas ou de barras.



0
100
200
300
400
500
600
700
I1 I2 I3
Faixa etria
Populao
Masc
Fem


Figura 7 - Populao da Capital de So Paulo (em milhares), segundo o sexo e trs grupos
etrios, 1950.
Fonte: IBGE Censo demogrfico - 1950.





Representao grfica de variveis quantitativas

Nas distribuies de freqncias de uma varivel quantitativa,
necessrio distinguir quando esta discreta ou contnua.
Nas distribuies discretas, o grfico mais usado o de ordenadas.
Nas distribuies contnuas, os grficos mais usados so: o polgono de
freqncias e o histograma.


14
Polgono de freqncias
Para construir o polgono de freqncias, admite-se que as freqncias
das classes esto concentradas nos pontos mdios dos intervalos que as
definem. Locados os pontos, estes so ligados entre si por meio de retas,
sendo que, via de regra, o primeiro e o ltimo deles so ligados ao eixo das
abscissas na metade de classes hipotticas, imediatamente anterior primeira
e posterior ltima; este procedimento leva ao trmino da construo do
polgono e determina que a rea total delimitada pelo polgono e o eixo das
abscissas seja proporcional freqncia total da distribuio, ou seja, 100%,
havendo tambm proporcionalidade entre reas parciais, delimitadas por
intervalos definidos no eixo das abscissas.
Exemplo:
Tabela 2.9 Distribuio de frequncias de pesos (em onas
1
) de tumores malignos removidos
de abdomens de 57 indivduos.
Classes Ponto mdio Nde indivduos
11 20 15,5 5
20 29 24,5 19
29 38 33,5 8
38 47 42,5 11
47 56 51,5 7
56 65 60,5 2
65 74 69,5 3
74 83 78,5 2
Total 57
Fonte: Daniel, W.W Bioestatistics: A foundation for analysis in the health sciences
(1) 1 ona = 28,691 g
0
2
4
6
8
10
12
14
16
18
20
0 6,5 15,5 24,5 33,5 42,5 51,5 60,5 69,5 78,5 87,5
Peso do tumor
Nmero de indivduos

Figura - 8 Distribuio de frequncias de pesos (em onas
1
) de tumores malignos removidos de
abdomens de 57 indivduos.
Fonte: Daniel, W.W Bioestatistics: A foundation for analysis in the health sciences
(1) 1 ona = 28,691 g
15
Histograma


O histograma um grfico cujas colunas so justapostas. Lembrando
que as reas das colunas devem ser proporcionais s freqncias, no caso
de intervalos de classes iguais, as bases dos retngulos so sempre de
mesma amplitude, bastando construir os retngulos com alturas
proporcionais s freqncias das classes.



0
2
4
6
8
10
12
14
16
18
20
15,5 24,5 33,5 42,5 51,5 60,5 69,5 78,5
Peso do tumor
Nmero de indivduos

Figura 9 - Distribuio de freqncias de pesos (em onas
1
) de tumores malignos removidos de
abdomens de 57 indivduos.
Fonte: Daniel, W.W Bioestatistics: A foundation for analysis in the health sciences
(1) 1 ona = 28,691 g





Forma de uma distribuio de freqncias

Os processos grficos podem ajudar-nos a visualizar a imensa
variedade de figuras e formatos que as distribuies de freqncia assumem.
Algumas distribuies so simtricas: dobrando-se a curva ao meio as duas
metades coincidem. Outras distribuies, denominadas assimtricas,
apresentam maior quantidade de dados extremos numa das caudas.
As distribuies simtricas apresentam considervel variao. Elas
podem diferir em termos de alongamento (ou curtose). Podem ser:
16
(a) leptocrticas (bastante pontiagudas ou altas);
(b) platicrticas (quando so achatadas);
(c) mesocrticas ( nem muito pontiagudas nem muito achatadas)










(a) (b) (c)


Quanto assimetria uma distribuio pode ser:
(a) assimtrica positiva
(b) assimtrica negativa









(a) (b)


Representao grfica com amplitudes de classes diferentes

Quando a representao grfica for de uma distribuio de freqncias
de uma varivel contnua apresentada em classes com intervalos com
amplitudes diferentes, h necessidade do ajuste das freqncias, pois, caso
contrrio, a magnitude da figura geomtrica no ser proporcional freqncia
com que ocorre a varivel. O ajuste feito dividindo-se o nmero de casos de
cada classe pela amplitude da respectiva classe, obtendo-se como resultado o
nmero de casos por unidade de intervalo.
Vejamos o exemplo da tabela 2.10, onde construiremos o polgono de
freqncias e o histograma.

17
Tabela 2.10 Nmero de casos registrados de linfomas, sexo feminino, segundo a idade (anos),
Brasil, 1975.
Idade Nde casos Amplitude do intervalo casos/ano
0 5 15 5 15:5 = 3,0
5 20 63 15 63:15 = 4,2
20 50 151 30 151:30 = 5,0
50 65 79 15 79:15 = 5,3
65 100 54 35 54:35 = 1,5
Total 362
*

Nota: Excludos casos com idade ignorada
Fonte: Brasil (Ministrio da Sade), Registro Nacional de Tumores, Diviso de doenas
crnico-degenerativas. RJ,1978.



0
1
2
3
4
5
6
2,5 12,5 35 57,5 82,5 132,5
Idade
Casos/ano

Figura 10 - Nmero de casos registrados de linfomas, sexo feminino, segundo a idade (anos),
Brasil, 1975.

Nota: Excludos casos com idade ignorada
Fonte: Brasil (Ministrio da Sade), Registro Nacional de Tumores, Diviso de doenas
crnico-degenerativas. RJ,1978.

18
0
1
2
3
4
5
6
Anos
Casos /ano
Figura 11 - Nmero de casos registrados de linfomas, sexo feminino, segundo a idade (anos),
Brasil, 1975.


Nota: Excludos casos com idade ignorada
Fonte: Brasil (Ministrio da Sade), Registro Nacional de Tumores, Diviso de doenas crnico-
degenerativas. RJ,1978.





Grfico de freqncias acumuladas

um outro tipo de grfico que serve para representar varivel
quantitativa. Neste caso o interesse no simplesmente a freqncia de um
determinado valor ou classes de valores de uma varivel, mas sim o
conhecimento da freqncia total dos valores inferiores a um fixado. O grfico
construdo a partir dos pontos representativos dos valores das freqncias
acumuladas no eixo das ordenadas e o valor superior de cada intervalo de
classe, respectivamente, nas abscissas. Demarcados os pontos, estes so
ligados entre si, sendo que o primeiro unido ao eixo das abscissas no
extremo inferior da primeira classe e o ltimo ponto ao extremo superior da
ltima classe, formando-se neste ltimo segmento, perpendicular ao eixo das
abscissas, uma nova escala, que poder ser em termos de porcentagem,
graduada de 0 a 100%.


19

Tabela 2.11 Distribuio de freqncias de pesos (em onas) de tumores malignos removidos
de abdomens de 57 indivduos.
Peso n
o
de indivduos freqncia relativa (%) nde indivduos com pe-
so de tumores abaixo de
11 20 5 5/57x 100 = 8,77 5
20 29 19 33,33 5+19=24
29 38 8 14,04 24+8=32
38 47 11 19,30 32+11=43
47 56 7 12,28 43+7=50
56 65 2 3,51 50+2=52
65 74 3 5,26 52+3=55
74 83 2 3,51 55+2=57
Total 57
Fonte: Daniel, W.W Bioestatistics


0
10
20
30
40
50
60
0 11 20 29 38 47 56 65 74 83
Peso
Nmero de indivduos com
peso abaixo de

Figura 12 - Distribuio de freqncias de pesos (em onas) de tumores malignos removidos
de abdomens de 57 indivduos.

Fonte: Daniel, W.W Bioestatistics


O grfico utilizado para se conhecer a freqncia, em porcentagem, de
valores inferiores a um valor determinado. Por exemplo: qual a porcentagem
de indivduos com peso de tumor at 29 onas. A resposta 42,10%. Ou, a
porcentagem de indivduos que tm tumor com peso at 20 onas de 8,77%.


20

Serve tambm para dizer qual o valor que define uma dada freqncia
relativa(%). Por ex.: qual o peso abaixo do qual se tem 50% dos tumores dos
indivduos? Usando as propriedades de tringulos semelhantes podemos
calcular.

' C ' B
BC
' B ' A
AB
=

9
29
14 04
7 9 x
=
,
,


x = 29 5 064 ,

x = 34 06 ,


Logo, o valor abaixo do qual se tem 50% dos pesos dos tumores 34,06
onas.



Grfico Polar

Quando as categorias da varivel em estudo se repetem aps um
perodo, como no caso dos dias da semana, os meses do ano, as horas do dia,
etc. pode haver interesse em verificar se o conjunto de freqncias destas
categorias apresentam algum padro de acordo com a ordenao das
categorias; em Epidemiologia seria caso do estudo do fenmeno chamado
estacionalidade ou sazonalidade. O grfico recomendado o grfico polar, que
consiste em um crculo com tantos raios quantas forem as categorias da
varivel; cada raio ter uma escala de freqncias com origem no centro do
crculo. Locadas as freqncias observadas para cada raio, unem-se os
pontos e da tem-se o grfico polar.


Ex.:

Tabela 2.12 Nmero de bitos mensais na UTI do HC de Botucatu, segundo o sexo, nos
meses de janeiro a outubro de 1990.
Meses
Sexo Jan Fev Mar Abr Mai Jun Jul Ago Set Out Total
Masc 1 2 1 2 2 2 1 2 1 2 16
Fem 2 3 2 - 2 3 6 2 4 2 26
Total 3 5 3 2 4 5 7 4 5 4 42
Fonte: trabalho realizado por alunos da UNESP na UTI do HC de Botucatu, 1990.

21

0
1
2
3
4
5
6
Jan
Fev
Mar
Abr
Mai
Jun
Jul
Ago
Set
Out
Masc
Fem

Figura 13 - Nmero de bitos mensais na UTI do HC de Botucatu, segundo o sexo, nos
meses de janeiro a outubro de 1990.

Fonte: trabalho realizado por alunos da UNESP na UTI do HC de Botucatu, 1990.















22

3 - MEDIDAS DE POSIO OU DE TENDNCIA CENTRAL

Uma forma til de descrever um grupo como um todo consiste em
encontrar um nico nmero que represente o que mdio ou tpico naquele
conjunto particular de dados. Esse valor conhecido por medida de tendncia
central ou de posio ou mdia, uma vez que ele geralmente se localiza em
torno do meio ou centro de uma distribuio, onde a maior parte dos dados
tende a se concentrar.
So medidas de tendncia central:
Mdia aritmtica, mediana e moda.



Mdia aritmtica - Dados no agrupados

Se x
1
, x
2
,...,x
n
so n valores distintos da varivel X, a mdia aritmtica
simples de X representada por X :
X
X
n
i
i
n
=
=

1
, ou simplesmente X
X
n
= , onde n o nmero de elementos
do conjunto.
X
X X X
n
n
=
+ + +
1 2
...

Exemplo: Calcular a mdia aritmtica de radiografias tiradas em uma semana
em determinado hospital.

x= (9 + 12 + 8 + 6 + 14 + 11 + 5)/7 = 9,28 radiografias


Mdia aritmtica - dados em distribuio de freqncias ou agrupados

Se tivermos k observaes da varivel X, das quais f
1
so iguais a x
1
, f
2

iguais a x
2
, ..., f
k
iguais a x
k
, ou quando os dados estiverem agrupados em
classes, usaremos a mdia aritmtica dos valores x
1
, x
2
, ..., x
k
, ponderados
pelas respectivas freqncias.

X
X f
n
i i
i
k
=
=

1
onde n f
i
i
k
=
=

1




23

1) Por exemplo, seja a tabela abaixo:



Tabela 2.13 Pacientes com hipertenso, segundo a idade.
Idade(em anos completos)(X
i
) N
o
de indivduos (f
i
) X
i
f
i

22 1 22
27 1 27
30 1 30
31 1 31
34 1 34
35 3 105
36 5 180
40 1 40
42 1 42
43 1 43
44 2 88
45 1 45
46 2 92
47 1 47
48 1 48
50 2 100
53 3 159
56 1 56
58 1 58
59 2 118
60 1 60
61 1 61
63 1 63
65 3 195
67 2 134
Total
Fonte: Montenegro, M.R.G. (1962)


x =
+ + +
= =
221 271 67 2
40
1878
40
46 95
. . ... .
, anos


x = 46 anos e 11 meses, ou seja, a idade mdia dos hipertensos igual a 46
anos (completos)



2) Se os dados estiverem agrupados em classes, preciso, antes de calcular a
mdia, determinar os pontos mdios das classes.

X
X f
n
i i
i
k
=
=

1
onde X
i
o ponto mdio de cada classe. Ex.:




24



Tabela 2.14 Pacientes com hipertenso segundo a idade.
Idade Ponto mdio n de indivduos(f
i
) x
i
f
i

20 25 22,5 1 22,5
25 30 27,5 1 27,5
30 35 32,5 3 97,5
35 40 37,5 8 300,0
40 45 42,5 5 212,5
45 50 47,5 5 237,5
50 55 52,5 5 262,5
55 60 57,5 4 230,0
60 65 62,5 3 187,5
65 70 67,5 5 337,8
Total 40 1915,0
Fonte: Montenegro, M.R.G.
x= 1915,0/40 = 47,875 = 47 anos e 10 meses ou 47 anos completos.



Mediana


a realizao que ocupa a posio central da srie de observaes
quando estas esto ordenadas segundo suas grandezas (em ordem crescente
ou decrescente). Precisamos considerar:

a) Se o nmero de observaes (n) mpar a mediana ser o valor da varivel
que ocupa o posto de ordem (n + 1)/2.

Seja o exemplo do nmero de radiografias tiradas em uma semana em
determinado hospital.

2
a
feira - 9 3
a
feira - 12 4
a
feira - 8 5
a
feira - 6
6
a
feira - 14 sbado - 11 domingo 5

Colocando em ordem crescente, teremos:
5, 6, 8, 9, 11, 12, 14
Logo, a mediana ser:
md = 9 que o valor que ocupa o posto (7 + 1)/2 = 4
o
, na ordem.

b) Se n par, ento no existe um valor que ocupe o centro. Da convencionou
-se que a mediana ser a mdia aritmtica dos valores que ocupam os postos
n/2 e n/2 + 1.

No exemplo das radiografias, se no considerssemos o domingo, teramos:
6, 8, 9, 11, 12, 14
e a mediana seria md = (9 + 11)/2 = 10.


25
Alm da mediana que, por definio, divide um conjunto ordenado de
valores em duas partes iguais, existem outras medidas que dividem o conjunto
de valores em 4, 10 e 100 partes iguais.


Quartis

Os quartis dividem um conjunto de dados em quatro partes iguais.
Assim:


Q
1
Q
2
Q
3


25% dos valores so menores do que o primeiro quartil (Q
1
)
50% dos valores caem abaixo do segundo quartil (Q
2
ou mediana)
75% dos valores so menores que o terceiro quartil (Q
3
).

Para se calcular os quartis, procedemos semelhantemente como no
caso do clculo da mediana.


Decis so valores que dividem o conjunto ordenado de dados em 10
partes iguais, isto , 10% das observaes caem abaixo do 1
o
decil, 20%
abaixo do 2
o
, e assim por diante.

Percentis so valores que dividem o conjunto de dados em 100 partes
iguais.


MODA


o valor mais freqente da distribuio. Por exemplo para a distribuio:

x
i
18 21 32 27 45
f
i
2 5 8 7 4

a moda 32. Indica-se m = 32. Esse nmero o mais comum nesta
distribuio (aparece mais vezes).
Se os pesos de 8 pessoas (em kg) so: 65, 87, 49, 58, 67, 83, 79, 69,
estas medidas no definem uma moda. J os pesos:
65, 87, 49, 58, 65, 65, 67, 83, 87, 79,87 apresentam duas modas: m = 65 kg e
m = 87 kg. Nesse caso a distribuio diz-se bimodal. Ser unimodal se
apresentar uma s moda e multimodal se apresentar vrias modas.
A moda pode ser usada tambm no caso de a varivel ser qualitativa.
Por exemplo, quando se diz que as doenas cardacas foram a causa principal
de mortalidade em certo ano, isto significa que na distribuio dos bitos
segundo a causa mortis, s doenas cardacas correspondeu um maior
nmero de bitos, ou seja, a rubrica "doenas cardacas" a moda da
distribuio.
26
4 - MEDIDAS DE VARIABILIDADE OU DE DISPERSO

A sumarizao de um conjunto de dados, atravs de uma nica medida
representativa de posio central, esconde toda a informao sobre a
variabilidade do conjunto de valores. Sejam, por exemplo, as amostras A e B
que representam dois grupos de pessoas cujas presses sangneas
sistlicas (mm) acusaram os seguintes valores:

amostra A
10 10 11 12 12 13 14 14 14 15 x=12,5 md = 12,5

amostra B
7 7 8 9 12 13 13 16 17 23 x=12,5 md = 12,5

Observamos que essas sries no so homogneas, apesar de terem o
mesmo valor para a mdia e mediana em ambas. preciso calcular as
constantes de disperso que medem os afastamentos dos valores dessas
sries em torno do valor central.

Entre as medidas de disperso mais usadas, veremos:

a) Amplitude Total
b) Amplitude interquartlica
c) Varincia
d) Desvio-padro
e) Coeficiente de variao



a) Amplitude total - a diferena entre o maior e o menor valor de um
conjunto de dados.
R= X
mx
- X
mn

Para a srie A r = 5
Para a srie B r = 16
A utilizao da amplitude total como medida de disperso muito
limitada, pois sendo uma medida que depende apenas dos valores externos,
instvel, no sendo afetada pela disperso dos valores internos.



b) Amplitude interquartlica - a diferena entre o 3
o
e o 1
o
quartil.
A = Q
3
- Q
1

Para a srie A a = 14 - 11 = 3
Para a srie B a = 16 - 8 = 8
Examinando os resultados podemos concluir que a srie B tem disperso
maior que a A.




27

c) Varincia

Considerando o nosso propsito de medir a disperso dos valores em
torno da mdia, interessante estudarmos o comportamento dos desvios de
cada valor em relao mdia, isto , x x
i
. Observem que, na determinao
de cada desvio d x x
i i
= , estaremos medindo a disperso entre cada x
i
e a
mdia x. Porm, se somarmos todos os desvios, teremos d
i
i
n
=
=
1
0 ou
( ) x x
i
i
n
=
=
1
0. Para contornar o problema, resolveu-se considerar o quadrado
de cada desvio ( ) x x
i

2
, evitando-se com isso que d
i
i
n
=
=
1
0. Assim, definiu-
se a varincia como:

2
2
1
2
1
=

=
= =

( ) x
N
d
N
i
i
N
i
i
N
se os dados no so agrupados e

2
2
1
2
1
=

=
= =

( ) x f
N
d f
N
i i
i
K
i i
i
K
para os dados agrupados.

Trata-se da mdia aritmtica dos quadrados dos desvios.

Observao:
2
indica a varincia da populao e l-se sigma ao quadrado,
a mdia da populao e N o tamanho da populao. Para o caso do clculo
da varincia de valores amostrais conveniente usarmos a frmula:
S
x x
n
i
i
n
2
2
1
1
=

( )
se os dados no so agrupados e
S
x x f
n
i i
i
k
2
2
1
1
=

( )
para os dados agrupados onde x no caso, a mdia da
amostra e n o tamanho amostral.

A seguir esto outras frmulas que podem ser usadas para o clculo da
varincia populacional e amostral.

2 2
1
2
1
1
=
=
=


N
X
X
N
i
i
N i
i
N
[
( )
] varincia populacional para dados no agrupados

2 2
1
2
1
1
=
=
=


N
X f
X f
N
i i
i
K i i
i
K
[
( )
] varincia populacional para dados agrupados
28
S
n
X
X
n
i
i
n i
i
n
2 2
1
2
1
1
1
=


=
=


[
( )
] varincia amostral para dados no agrupados

S
n
X f
X f
n
i i
i
k i i
i
k
2 2
1
2
1
1
1
=


=
=


[
( )
] varincia amostral para dados agrupados.

Estas frmulas so obtidas atravs de transformaes nas respectivas
frmulas originais.

Clculo da varincia amostral para as sries A e B
S
n
X
X
n
i
i
n i
i
n
2 2
1
2
1
1
1
=


=
=


[
( )
]
s mm
A
2
2
2
1
9
1591
125
10
3167 = = [
( )
] ,
s mm
B
2
2
2
1
9
1799
125
10
26 278 = = [
( )
] ,


d) Desvio-padro

Observando-se a frmula para o clculo da varincia, vemos que se trata
de uma soma de quadrados. Assim, se a unidade da varivel for, por exemplo,
mm, teremos como resultado mm
2
.
Para voltarmos varivel original, necessitamos definir outra medida de
disperso, que a raiz quadrada da varincia, o desvio-padro. Assim:
=
2
o desvio-padro populacional
S S =
2
o desvio-padro amostral

Portanto, para o exemplo das sries teremos:
s mm
A
= = 3167 1 780 , ,
s mm
B
= = 26 278 5126 , ,

Vejamos o exemplo da tabela 2.14 (pacientes com hipertenso segundo a
idade), para dados agrupados:
S
n
X f
X f
n
i i
i
k i i
i
k
2 2
1
2
1
1
1
=


=
=


[
( )
]
s anos
2
2
2
1
39
97500
1915
40
149 21 = = [
( )
] ,

portanto, a varincia da idade dos pacientes com hipertenso igual a 149,21
anos
2
, sendo que o desvio padro 12,22 anos.

29

e) Coeficiente de variao

Trata-se de uma medida relativa da disperso, til para a comparao
em termos relativos do grau de concentrao em torno da mdia de conjuntos
de dados distintos. dado por:

CV =

.100% ou CV
S
X
= .100%

Vamos supor, para exemplificar, que temos dois grupos de indivduos,
cujas idades esto apresentadas na tabela abaixo:

Tabela 2.16 Idades de indivduos, segundo o grupo
Grupo
I II
3 55
1 57
5 53


Temos que a idade mdia no Grupo I 3 e no grupo II, 55. A disperso
em torno da mdia a mesma para os dois grupos, pois tm varincias s
2
= 4
anos
2
e desvio-padro s = 2 anos. Entretanto, as diferenas de dois anos, na
idade dos indivduos do grupo I, so muito importantes porque determinam
grandes modificaes tanto no aspecto fsico como no comportamento desses
indivduos. Isso j no acontece com os indivduos do grupo II. Ento, h o
interesse em estabelecer relao entre o desvio-padro, que mede a disperso
dos dados, e a mdia, que mede a tendncia central.

Assim, o coeficiente de variao ser:
cv
A
= 2/3 . 100% = 66,67%
cv
B
= 2/55 . 100% = 3,64%

Vejamos os valores dos coeficientes de variao para as sries A e B:
cv
A
= 1,780/12,5 . 100% = 14,24%
cv
B
= 5,126/12,5 . 100% = 41,10%

Vemos, portanto, que h maior variao na srie B que na A, pois o cv
na srie B foi bem maior que na srie A.





30

5 - NOES DE PROBABILIDADE
Conceitos fundamentais

Qual a probabilidade de ocorrer determinado fenmeno?

pergunta-se quo provvel esse fenmeno.
quer-se quantificar a possibilidade de ocorrncia desse fenmeno.

Probabilidade uma medida de incerteza.

Fenmeno aleatrio ou probabilstico: aquele cuja ocorrncia no se pode
prever com certeza.

a cura de um doente aps ser submetido a um transplante.
sair a face cara no lanamento de uma moeda.
a durao de uma lmpada ser igual a 100 horas.
chover amanh.
o primeiro filho de um casal ser do sexo masculino.
etc.

Fenmeno determinstico: aquele cuja ocorrncia pode ser prevista com certeza.

a velocidade atingida por um objeto em queda livre.
etc.

Blaise Pascal
(1601 1665)
&
Pierre Fermat
(1623 1662)
deram origem

Teoria das Probabilidades
31
CONCEITOS FUNDAMENTAIS

Experimento
um procedimento realizado sob determinadas condies e que pode ser
repetido um nmero qualquer de vezes sob condies idnticas.

Experimento Determinstico
So aqueles em que as condies em que o experimento realizado
determinam completamente seu resultado.

Experimento Aleatrio ou Probabilstico
So aqueles cujo resultado no se pode prever com certeza.

realizao de um experimento aleatrio
diversos resultados possveis


Exemplos:

Experimento: plantar uma semente e observar o resultado:
Resultados possveis: germinou, no germinou.

Experimento: observar o sexo de um recm-nascido:
Resultados possveis: masculino; feminino.

Experimento: observar o peso de um recm-nascido, em quilos:
Resultados possveis:...; 2,2; ...; 2,5; ...; 3,0; ...
etc.
causas mltiplas que no podem ser controladas: ACASO
32
Espao Amostral
o conjunto de todos os possveis resultados de um experimento aleatrio.
representado pela letra S.

Evento
Dado um experimento aleatrio, evento qualquer subconjunto de seu espao
amostral.

Os eventos constitudos por apenas um elemento do espao amostral
so chamados eventos simples.

O espao amostral chamado evento certo.

O conjunto vazio chamado evento impossvel.

Exemplos:

Experimento: plantar uma semente e verificar o resultado:
S = { germinou; no germinou}
Experimento: observar o sexo de um recm-nascido:
S = { feminino; masculino }
Experimento: observar o peso de um recm-nascido, em quilos:
S = {...; 2,2; ...; 2,5; ...; 3,0; ... }

um experimento aleatrio repetido vrias vezes
sob mesmas condies

padro regular na freqncia dos
diferentes resultados que podem ocorrer


efeito aleatrio
33
Neste contexto,
a probabilidade de ocorrncia de determinado resultado na realizao
de um experimento aleatrio
pode ser estimada pela
razo entre o nmero de vezes em que este resultado foi observado
em uma srie de repeties do experimento e
o nmero total de vezes em que o experimento foi repetido.


Notao: Seja o evento A pertencente ao espao amostral de determinado
experimento aleatrio. A probabilidade de A ocorrer em uma realizao deste
experimento representada por P(A).

Interseo de Eventos
Dado um experimento aleatrio, a ocorrncia simultnea dos eventos A e B de
seu espao amostral chamada evento interseo e representada
por A B.









A B
S
34

Unio de eventos
Dado um experimento aleatrio e dois eventos A e B de seu espao amostral,
a ocorrncia de A, de B ou de ambos chamada evento unio e
representada por A B.


Eventos Mutuamente Exclusivos
Dado um experimento aleatrio, dois eventos A e B de seu espao amostral
so mutuamente exclusivos se nunca ocorrem simultaneamente.
Ou seja, a ocorrncia de A exclui a ocorrncia de B e vice-versa.

A e B mutuamente exclusivos P(A B) = 0.



Eventos Independentes
Dado um experimento aleatrio, dois eventos A e B de seu espao amostral
so independentes se a ocorrncia de A no afeta a ocorrncia de B e vice-
versa, ou seja, a probabilidade de ocorrncia de B independe de A ter ou
no ocorrido e vice-versa.
A probabilidade de A dado que B ocorreu chamada probabilidade
condicional de A dado B e denotada por P(A | B).

A B
S
35



Exemplo

Num estudo sobre a ocorrncia de problemas cardacos em pessoas acima de
40 anos de determinado municpio, um pesquisador coletou dados de peso
corporal e presso arterial de uma amostra aleatria de 1660 pessoas dessa
populao:

Peso

Presso
Excessivo Normal Baixo
Arterial (A) (B) (C) Total
Elevada (E) 166 132 35 333
Normal (N) 249 747 331 1327
Total 415 879 366 1660

Considere o experimento aleatrio:

Selecionar aleatoriamente uma pessoa da populao amostrada e observar
sua presso arterial e seu peso corporal (de acordo com a classificao
adotada pelo pesquisador para as variveis peso e presso arterial).

Com base nos dados obtidos pelo pesquisador, ou seja, com base na amostra
observada, podemos responder, por exemplo, s seguintes perguntas:

1. Qual a probabilidade de a pessoa selecionada ter presso arterial
elevada?
A e B independentes
P(A | B) = P(A )
P(B | A) = P(B )
36
2. Qual a probabilidade de a pessoa selecionada ter peso excessivo?
3. Qual a probabilidade de a pessoa selecionada ter presso arterial
elevada e peso excessivo?
4. Qual a probabilidade de a pessoa selecionada ter presso arterial
elevada ou peso baixo?
O espao amostral correspondente ao experimento aleatrio considerado :
S = {EA, EB, EC, NA, NB, NC}

Podemos definir vrios eventos em S. Sejam, por exemplo, os eventos:

H : apresentar presso arterial elevada H = {EA, EB, EC}.
I : apresentar peso normal I = { EB, NB }.

Considerando-se o conceito de probabilidade como o limite de uma freqncia
relativa, podemos facilmente calcular:

1. Qual a probabilidade do evento H ocorrer neste experimento aleatrio?

2. Qual a chance do evento I ocorrer?

3. Qual a probabilidade dos eventos H e I ocorrerem simultaneamente?

P( H )
333
1660
0,2006 = =
0,5295
1660
879
) I P( = =
P( H I )
132
1660
0,0795 = =
37
4. Qual a chance de ocorrer o evento H ou o evento I?

5. Se foi observado que a pessoa selecionada apresenta peso excessivo, qual
probabilidade dessa pessoa apresentar presso arterial elevada?

H : apresentar presso arterial elevada H = {EA, EB, EC}.
I : apresentar peso normal I = { EB, NB }.
J : apresentar peso excessivo J = { EA, NA }.


6. Dado que a pessoa selecionada apresenta peso normal, qual a
probabilidade dessa pessoa apresentar presso arterial elevada?

P( H I )
333
1660
0,6506 = + =
879
1660
132
1660
P( H | J )
166
415
0,4000 = =
P( H )
333
1660
0,2006 = =
P( H | I )
132
879
0,1502 = =
P( H | J )
P( H J )
P( J )
166
415
0,4000 =

= = =
166
1660
415
1660
P( H | I )
P( H I )
P( I )
132
879
0,1502 =

= = =
132
1660
879
1660
38
TEOREMA DA SOMA
Dados dois eventos A e B do espao amostral de um experimento aleatrio,
ento a probabilidade de ocorrncia de A ou de B na realizao desse
experimento aleatrio dada por:



TEOREMA DO PRODUTO
Dados dois eventos A e B do espao amostral de um experimento aleatrio,
ento a probabilidade de ocorrncia simultnea de A e de B na realizao
desse experimento aleatrio dada por:




P( A B ) P( A ) P( B | A) =
P( A B ) P( B ) P( A | B) =
ou
P( A | B )
P( A B )
P( B )
=

P( B | A )
P( A B )
P( A )
=

P( A B ) = P( A ) + P( B ) - P( A B )
39

6 - EXPERIMENTOS ALEATRIOS


Existe grande importncia nos experimentos feitos na cincia. Um
princpio fundamental que se efetuamos tais experimentos repetidas vezes,
sob condies praticamente idnticas, obtemos resultados que so
essencialmente os mesmos. H, entretanto, experimentos em que os
resultados no so essencialmente os mesmos, ainda que as condies de
realizao se mantenham praticamente as mesmas. Tais experimentos
chamam-se experimentos aleatrios.


ESPAO AMOSTRAL


Um conjunto S, que consiste de todos os resultados possveis de um
experimento aleatrio chamado espao amostral; cada resultado um ponto
amostral. comum haver mais de um espao amostral para descrever os
resultados de determinado experimento, mas em geral apenas um desses
espaos nos d o mximo possvel de informaes.


EVENTO

Um evento um subconjunto do espao amostral.



PROBABILIDADES


Em qualquer experimento aleatrio, h sempre uma incerteza quanto
ocorrncia, ou no, de determinado evento. A fim de obtermos uma medida de
chance, ou probabilidade, com que podemos esperar a ocorrncia de
determinado evento, conveniente atribuirmos um nmero entre 0 e 1.

Exemplo 1) De um grupo de duas mulheres (M) e trs homens (H), uma
pessoa ser sorteada para ser representante do Conselho de Classe no IB.
Observamos que

a) s existem duas possibilidades: ou a pessoa sorteada do sexo feminino
(M) ou do sexo masculino (H);
b) supondo que o sorteio seja honesto e que cada pessoa tenha a mesma
chance de ser sorteada; teremos o seguinte modelo de probabilidades para
o experimento:

Sexo
Masculino Feminino Total
Freq. terica 3/5 2/5 1
40
Todo experimento ou fenmeno que envolva um elemento casual ter
seu modelo probabilstico especificado no momento que estabelecemos:

1
o
) um espao amostral, S, que consiste, no caso discreto, na enumerao de
todos os possveis resultados do experimento em questo: S = {w
1
,w
2
,...}. Os
elementos w so os pontos amostrais.
No exemplo acima S = {M,H}.

2
o
) uma probabilidade , P(w), para cada ponto amostral, de tal sorte que ser
possvel encontrar a P(A) de qualquer subconjunto A de S, isto , a
probabilidade da ocorrncia de um evento.


Exemplo 2) Lanamos uma moeda duas vezes. Se C indica cara e R indica
Coroa, ento, um espao amostral ser S = {w
1
, w
2
, w
3
, w
4
} ou seja,
S = {(C,C); (C,R); (R,C); (R,R)}. Se a moeda perfeitamente simtrica e
homognea razovel supor que cada ponto w tem probabilidade 1/4.

Se A o evento que consiste na obteno de faces iguais nos dois
lanamentos, ento
P(A) = P(w
1
,w
4
) = 1/4 + 1/4 = 1/2

De um modo geral, se A um evento, ento, P(A) = (w
j
), onde a soma
estendida a todos os w
j
A.

Para um mesmo experimento podemos ter vrios espaos amostrais,
dependendo do objetivo do problema que se quer estudar.


Exemplo 3) Considere o experimento que consiste em retirar um medicamento
de um lote de medicamentos e medir a sua validade. Um espao amostral
conveniente :
S={t : t 0}

Se A indica o evento: "o tempo de validade do medicamento inferior a 3
anos", ento A = {t : 0 t< 3}. Este um exemplo de um espao amostral
contnuo, ao contrrio dos exemplos anteriores, que so discretos.


Algumas Propriedades

Sendo o modelo probabilstico um modelo terico para as freqncias
relativas, das propriedades destas podemos verificar algumas das
propriedades que veremos a seguir.
Como toda freqncia relativa um nmero entre 0 e 1, temos que:
0 P(A) 1 para qualquer evento A.
Considerando o espao todo S e o conjunto vazio como eventos, temos:
P(S) = 1
P() = 0
onde o primeiro denominado evento certo e o segundo, evento impossvel.
41

Varivel aleatria discreta (v.a.d.)

Uma funo X, definida sobre o espao amostral S e assumindo valores
num conjunto enumervel de pontos do conjunto real, dita uma varivel
aleatria discreta.

w
1
w
2
w
3
w
4
w
5
w
6
S






x
1
x
2
x
3
x
4


Exemplos:
X: n. de sobreviventes aps determinada operao
X: n. de pessoas portadoras de 1 determinado bacilo
X: n. de amostras de fezes com ovos detectados
X: n. de bitos do sexo masculino

Chama-se de funo de probabilidade (f.p.) da varivel aleatria discreta
X, que assume os valores x
1
, x
2
, ... , x
n
, a funo p(x
i
), que a cada valor x
i

associa sua probabilidade de ocorrncia, isto ,

p(x
i
) = P(X = x
i
) = p
i



Valor esperado de uma varivel aleatria discreta

Dada a varivel aleatria discreta X, assumindo os valores x
1
, x
2
, ... x
n
,
chamamos valor mdio ou esperana matemtica de X ao valor

E(X) = x p
i
i
n
i
=

1


Varincia de X
Var(X) =

= = =
=
n
1 i
n
1 i
2
i i i
2
i i
2
n
1 i
i
)] x ( p x [ ) x ( p x p )] X ( E x [

Desvio-padro de X
DP(X) = Var X ( )

Exemplo: Seja X o nmero de pontos marcados na face superior de
um dado:
x 1 2 3 4 5 6 Total
p(x) 1/6 1/6 1/6 1/6 1/6 1/6 1,0

42
E(X) = 1.1/6 + 2.1/6 + 3.1/6 + 4.1/6 + 5.1/6 + 6.1/6 = 21/6 = 3,5

Var(X) = (1-21/6)
2
.1/6 + (2-21/6)
2
.1/6 + (3-21/6)
2
.1/6 + (4-21/6)
2
.1/6 +
+(5-21/6)
2
.1/6 + (6-21/6)
2
.1/6 = 35/12 = 2,917.

DP(X) = 708 , 1 12 / 35 =


Distribuio de Bernoulli

Muitos experimentos so tais que os resultados possveis apresentam ou
no determinada caracterstica.
(1) Uma pessoa escolhida, ao acaso, dentre 1000 pessoas, ou no do sexo
feminino;
(2) Uma pessoa escolhida, ao acaso, entre os moradores de uma cidade e
pergunta-se se ela diz sim ou no a um projeto governamental;
(3) Uma moeda lanada: o resultado ou "cara", ou no ;
(4) Um dado lanado: ou ocorre face 5, ou no.

Em todos esses casos, estamos interessados na ocorrncia de um
sucesso (ser do sexo feminino, dizer sim a um projeto, sair cara, ocorrer face
5) ou fracasso (no ser do sexo feminino, dizer no a um projeto, sair coroa,
no ocorrer face 5). A definio do que sucesso ou fracasso depende do
objetivo do estudo.
Para cada experimento acima, podemos definir uma varivel X que
assume apenas dois valores: o valor 1, se ocorre sucesso, e o valor 0, se
ocorre fracasso. Indicaremos por p a probabilidade de sucesso e q = 1-p a
probabilidade de fracasso.

A varivel aleatria X, que assume apenas os valores 0 e 1 com a
funo de probabilidade,
x 0 1 Total
p(x) 1-p p 1

chamada varivel aleatria de Bernoulli.
E(X) = 0.(1-p) + 1.p = p
Var(X) = p - p
2
= p(1-p) = pq



Distribuio Binomial


Imagine que repetimos um ensaio de Bernoulli n vezes, ou como se diz
tambm, obtemos uma amostra de tamanho n de uma distribuio de
Bernoulli. Suponha ainda que as repeties sejam independentes, isto , o
resultado de um ensaio no tem influncia nenhuma no resultado de qualquer
outro ensaio.
A varivel aleatria X, correspondente ao nmero de sucessos num
experimento binomial b(n,p), tem funo de probabilidade:
43

P X k
n
k
p q
k n k
( ) = =
|
\

|


onde
)! k n ( ! k
! n
k
n

=
|
|

\
|


Numa distribuio binomial
E(X) = np
Var(X) = npq


Exemplo 1: Qual a proporo esperada de famlias com 2 filhas e 3 filhos,
supondo mesma chance de nascimento para cada sexo?

Definindo X como n. de meninas

P(X = 2) = ?
P(X = 2) =
5 3 2
5 , 0 .
! 3 ! 2
! 5
5 , 0 . 5 , 0
2
5
=
|
|

\
|

P(X = 2) = 10.0,03125 = 0,3125 = 31,25%


Exemplo 2: Sabe-se que a proporo de sucesso de um tratamento de 0,80.
Qual a probabilidade de que em 10 indivduos, 6 obtenham sucesso?

P(X = 6) =
10
6
0 80 0 20
10!
6!4
0 80 0 20
6 4 6 4
|
\

| = , . ,
!
. , . ,

P(X=6) = 210 . 0,2621 . 0,0016 = 0,0881 = 8,81%



Variveis aleatrias contnuas (v.a.c.)

Exemplo: O ponteiro dos segundos de um relgio mecnico pode parar a
qualquer instante por defeito tcnico. Vamos indicar por X o ngulo que este
ponteiro forma com o eixo imaginrio, passando pelo centro do relgio e pelo
nmero XII.
0
o

xii

270
o
IX III - 90
o



VI
180
o

44
Lembrando que:
a) o ponteiro deve dar 60 "saltos" (ele d um salto em cada segundo) para
completar uma volta;
b) acreditando que o ponteiro tenha probabilidade igual de parar em qualquer
ponto, a varivel X tem distribuio uniforme discreta, cuja funo de
probabilidade :

x 0 6 12 18 ... 348 354
p(x) 1/60 1/60 1/60 1/60 1/60 1/60

com a seguinte representao grfica:

p(x)



1/60



6
o
12
o
18
o
348
o
354
o
x (em graus)


Transferindo o mesmo problema para um relgio eltrico, onde o
ponteiro dos segundos move-se continuamente, necessitamos um outro
modelo para representar a varivel aleatria X. Primeiro observamos que o
conjunto dos possveis valores de X no mais um conjunto enumervel de
valores, pois X pode assumir qualquer valor do intervalo [0,360[ = {x R 0 x
< 360}. Neste caso faz sentido determinar a probabilidade de o ngulo X estar
compreendido entre dois valores quaisquer. Por exemplo, a probabilidade de o
ponteiro parar no intervalo compreendido entre os nmeros XII e III 1/4, pois
este intervalo corresponde a 1/4 do intervalo total. Ento, podemos escrever:
P(0 X 90) = 1/4

Do mesmo modo, a probabilidade de o ponteiro parar entre os nmeros
IV e V igual a 1/12, isto ,
P(120 X 150) = 1/12
Portanto, a probabilidade de X [a,b[
P(a x < b) =
b a
360


f(x)



1/360



a b c d 360 x (em graus)
45

O histograma anterior corresponde seguinte funo:
f x ( ) =
<
<

0, se x 0
1/ 360, se 0 x 360
0, se x 360



A rea correspondente ao intervalo [a,b[ deve indicar a probabilidade da
varivel estar entre a e b. Matematicamente, isso expresso atravs da
integrao da funo entre a e b.

P(a X < b) = f x dx dx
b a
a
b
a
b
( ) =


1
360 360


pois a integral de uma funo entre dois pontos determina a rea sob a curva
compreendida entre esses dois pontos.
A funo f(x) chamada funo densidade de probabilidade (f.d.p.).



Valor esperado de uma varivel aleatria contnua

Qualquer funo (f.d.p) no negativa tal que


= 1 dx ) x ( f , define uma
varivel aleatria contnua X. Isto cria um modelo terico para as freqncias
relativas de uma varivel quantitativa contnua. A rea compreendida entre
dois valores, a e b, da abscissa x e da curva f(x), d a probabilidade (proporo
terica esperada) da varivel pertencer ao intervalo limitado pelos dois pontos.
Assim, temos:

P(a x < b) = f x dx
a
b
( )


A mdia, esperana matemtica ou valor esperado de uma v.a.c. pode
ser escrita como:
E(X) = x f x dx . ( )



e a varincia
Var(X) = ( ( )) . ( ) x E X f x dx

2


sendo que o desvio-padro
DP(X) = ) X ( Var





46

Modelo Normal ou Distribuio Normal

Dizemos que uma v.a. X tem distribuio normal com parmetros,
mdia igual a e varincia igual a
2
, - < < + , 0 <
2
< + , se a sua
funo densidade de probabilidade (f.d.p) dada por:

f x e
x
( )
( ) /
=

1
2
2 2
2


< < + x

Grfico
f ( X )
- + 0


Temos que:
a) E(X) =
b) Var(X) =
2

c) f(x) 0 quando x
d) - e + so pontos de inflexo de f(x);
e) x = ponto de mximo de f(x), e o valor mximo
1
2


f) f(x) simtrica ao redor de x = , isto , f(x + ) = f(x - ), para todo
< < + x

Como calcular P(a < X < b) = ?
P(a < X < b) =
dx e
2
1
b
a
2 / ) x (
2 2






f(x)
f
a b

47
A integral no pode ser calculada exatamente, e a probabilidade
indicada s pode ser obtida aproximadamente, por mtodos numricos. No
entanto, para cada valor de e cada valor de , teramos que obter P(a < X <
b) para diversos valores de a e b. Essa tarefa facilitada, atravs do uso da
normal padronizada ou reduzida.
Quando = 0 e
2
= 1 e, temos a distribuio normal padro ou
reduzida. Se X tem distribuio normal, com mdia e varincia
2
,
indicaremos assim : X ~ N(,
2
), ento a varivel aleatria Z definida por
Z
X
=



tem distribuio normal com mdia 0 e varincia 1 Z ~N(0, 1).


f
-1,0 0,0 1,0
Z
f(z)


Ento, para obter probabilidades podemos consultar uma tabela que
tenha a distribuio normal reduzida ou padronizada, pois esta tabela nos d
as probabilidades sob uma curva normal padro, que nada mais so do que as
correspondentes reas sob a curva.

P(Zz
0
)
z0 Z



Exemplo: As alturas de 10000 alunos tm distribuio aproximadamente
normal, com mdia 170 cm e desvio padro 5 cm. Qual a probabilidade de
termos:
a) alunos com alturas entre 165 cm e 170 cm.
b) entre 165 e 180 cm.
c) entre 168 e 185 cm.
d) menores que 160 cm.
e) maiores que 180 cm.
f) Qual o nmero esperado de alunos com altura superior a 165 cm?
48
Resoluo:

a) P(165 < X < 170)


=
X
Z
z = (165 - 170)/5 = -1
z = (170 - 170)/5 = 0

P(165 < X < 170) = P(-1 < Z < 0)
Temos que P(Z < 0) = 0,5000 e P(Z < -1) = 0,1587, portanto a rea que
queremos dada por
P(Z < 0) - P(Z < -1) = 0,5000 - 0,1587 = 0,3413 = 34,13%.

b) z = (165 -170)/5 = -1
z = (180 - 170)/5 = 2
P(165 < X < 180) = P(-1 < Z < 2)
= P(Z < 2) - P(Z < -1)
= 0,9772 - 0,1587 = 0,8185 = 81,85%.

c) z = (168 - 170)/5 = -0,4
z = (185 - 170)/5 = 3,0
P(168 < X < 185) = P(-0,4 < Z < 3)
= P(Z < 3) - P(Z < -0,4)
= 0,9987 - 0,3446 = 0,6541 = 65,41%

d) z = (160 - 170)/5 = -2
P(X < 160) = P(Z < -2) = 0,0228 = 2,28%


e) z = (180 - 170)/5 = 2
P(X > 180) = P(Z >2) = 1 - P(Z < 2)
= 1 - 0,9772 = 0,0228 = 2,28%

f) P(X > 165) = ?
z = (165 - 170)/5 = -1
P(X > 165) = P(Z > -1) = 1 - P(Z < -1)
= 1 - 0,1587 = 0,8413 = 84,13%

Como so 10000 alunos teremos

10000 x 0,8413 = 8413 alunos

que o nmero esperado de alunos com altura superior a 165 cm.



49

7 - BIBLIOGRAFIA


BERQU, E.S.; SOUZA, J.M.P. de; GOTLIEB, S.L.D. Bioestatstica. So
Paulo, EPU, 1980. 325p.

BUSSAB, W.O. & MORETTIN, P.O. Estatstica Bsica: Mtodos
Quantitativos. 4.ed. So Paulo, Atual Editora, 1987. 321p.

CAMPBELL, M.J. & MACHIN, D. Medical Statistics: A Commonsense
Approach. 2nd ed. Chichester, John Wiley & Sons, 1993. 189p.

SOARES, J.F. & SIQUEIRA, A.L. Introduo Estatstica Mdica. 1.ed.
Belo Horizonte, UFMG, 1999. 300p.

VIEIRA, S. Introduo Bioestatstica. 2.ed. Rio de Janeiro, Editora
Campus, 1991. 203p.

Você também pode gostar