Você está na página 1de 21

DISCIPLINAS: BIOESTATSTICA/PROBABILIDADE E ESTATSTICA 2 SEM/2013

PROF ROSEANI PARENTE




SUMRIO:
1. CONCEITOS INICIAIS ........................................................................................................................................... 1
1.1 POPULAO E AMOSTRA ................................................................................................................................ 1
1.2 PESQUISA ESTATSTICA ............................................................................................................................. 1
1.3DADOS ................................................................................................................................................................... 1
1.4 VARIVEL ............................................................................................................................................................ 1
1.5 PARMETROS E ESTATSTICAS ................................................................................................................ 2
2. MTODO ESTATSTICO........................................................................................................................................ 2
3. ORGANIZAO DOS DADOS ............................................................................................................................... 2
3.1 REPRESENTAO TABULAR .......................................................................................................................... 2
3.2 REPRESENTAES GRFICAS ..................................................................................................................... 6
4. MEDIDAS DE POSIO OU TENDNCIA CENTRAL ..................................................................................... 8
4.1 MDIA ARITMTICA SIMPLES .................................................................................................................... 8
4.2 MEDIANA ............................................................................................................................................................ 9
4.3. MODA ................................................................................................................................................................... 9
5. MEDIDAS DE VARIABILIDADE (DISPERSO). ............................................................................................ 10
5.1. VARINCIA. ..................................................................................................................................................... 10
5.2. DESVIO PADRO ............................................................................................................................................ 11
5.3 COEFICIENTE DE VARIAO (ou de variabilidade) .............................................................................. 11
5.2. ASSIMETRIA E CURTOSE .......................................................................................................................... 12
5.3. SEPARATRIZES ............................................................................................................................................. 11
6. CONCEITOS BSICOS DE PROBABILIDADE ................................................................................................ 14
6.1. ESPAO AMOSTRAL ( - mega) E EVENTO .......................................................................................... 15
6.2. OPERAES COM EVENTOS ALEATRIOS........................................................................................... 15
6.3. PROPRIEDADES DAS OPERAES ............................................................................................................ 17
6.4. PARTIO DE UM ESPAO AMOSTRAL .................................................................................................. 17
6.5. PROBABILIDADE ............................................................................................................................................ 18
6.6. PROBABILIDADE CONDICIONAL E INDEPENDNCIA DE EVENTOS ........................................... 19
6.7. TEOREMA DE BAYES ..................................................................................................................................... 19








Chamar o especialista em estatstica depois que o
experimento foi feito pode ser o mesmo que pedir a ele
para fazer um exame post-mortem. Talvez ele consiga
dizer de que foi que o experimento morreu.

Sir Ronald Aylmer Fisher (1890 1962) Bilogo,
geneticista e estatstico ingls.


1
1. CONCEITOS INICIAIS
Estatstica um conjunto de conceitos e mtodos cientficos para a coleta, organizao,
descrio, anlise e interpretao de dados experimentais que permitem concluses vlidas que
possibilitem a tomada de deciso. Os dados experimentais podem ser extrados de estudos realizados
em grupos de pessoas, animais, vegetais ou objetos inanimados.
A Estatstica compreende a:
Estatstica Descritiva: que trata da observao de fenmenos de mesma natureza, da coleta
de dados numricos referentes a esses fenmenos, da sua organizao e classificao atravs de
tabelas, grficos e medidas, bem como da sua anlise e interpretao.
Teoria da Probabilidade: a Teoria Matemtica utilizada para se estudar a incerteza
oriunda de fenmenos de carter aleatrio.
Estatstica Indutiva ou Inferencial: o estudo de tcnicas que possibilitam a extrapolao
a um grande conjunto de dados, das informaes e concluses obtidas a partir de subconjuntos de
valores usualmente de dimenso muito menor.
Bioestatstica a estatstica aplicada s cincias da sade como a Medicina, Biologia,
Odontologia ou Psicologia.
A Anlise Descritiva a fase inicial de um processo de estudo de dados coletados.
Os mtodos de Estatstica Descritiva so utilizados para organizar, resumir e descrever os
aspectos importantes de um conjunto de caractersticas observadas ou comparar tais caractersticas
entre dois ou mais conjuntos de dados. A descrio dos dados tambm ajuda a identificar anomalias que
podem ser resultantes do registro incorreto de valores, e dados dispersos, que so aqueles que no
seguem a tendncia geral do restante do conjunto.

1.1 POPULAO E AMOSTRA:
Populao a totalidade dos elementos de caractersticas comuns, pertencentes a um universo
sobre o qual se deseja estabelecer concluses ou exercer aes. Amostra qualquer subconjunto do
conjunto definido como populao.
1.2 PESQUISA ESTATSTICA: qualquer informao retirada de uma populao ou amostra,
podendo ser atravs de Censo ou Amostragem.
i) CENSO: atividade de observar todos os elementos de uma populao com o objetivo de
conhecer suas caractersticas.
ii) AMOSTRAGEM: processo ou ato de selecionar os elementos de uma amostra.
1.3 DADOS: So as informaes, numricas ou no, obtidas de uma unidade experimental (elemento
constituinte da amostra ou populao).
1.4 VARIVEL: toda caracterstica de interesse que medida em cada elemento da amostra ou
populao. Como o nome diz, seus valores podem variar de elemento para elemento.
As variveis podem ser numricas e no numricas. As numricas so denominadas de
quantitativas e as variveis no numricas de qualitativas ou categricas.
a) VARIVEIS QUALITATIVAS: So aquelas representadas por uma caracterstica prpria
da varivel, um atributo ou categoria. Ex: raa do indivduo, o sexo, o grupo sanguneo e a qualidade de
um produto. So classificadas em Nominais e Ordinais.
Varivel qualitativa nominal so caractersticas classificadas em categorias para as quais no h
nenhuma ordenao nas possveis realizaes. So exemplos: Sexo (Feminino e Masculino) e Regio de
procedncia (Capital e Interior).
Nas variveis qualitativas ordinais existe uma ordem nos seus possveis resultados. Exemplos:
Grau de Instruo (fundamental, mdio, superior e ps-graduao) e Classe social (baixa, mdia e alta).


2
b) VARIVEIS QUANTITATIVAS: So aquelas representadas por valores numricos que
expressam uma quantidade, tais como: presso arterial, temperatura e nmero de colnias contadas
numa amostra. So classificadas em Discretas e Contnuas.
As variveis quantitativas discretas so aquelas cujos valores resultam, em geral, de processos
de contagem e portanto esta associada ao conjunto dos nmeros naturais. So exemplos: n de filhos
(0, 1, 2, ...) e n de batimentos cardacos por minuto (0, 1, 2, ...).
As variveis quantitativas contnuas so aquelas cujos valores pertencem a um intervalo de
nmeros reais e que resultam de processos de mensurao. So exemplos: altura em cm e peso em kg.
O tipo da varivel ir indicar a melhor forma para o dado ser apresentado em tabelas, grficos,
em medidas de resumo e a anlise estatstica mais adequada.
1.5 PARMETROS E ESTATSTICAS
a) Parmetro um valor que resume, na populao, a informao relativa a uma varivel. Por
exemplo: Do total de 69 alunos matriculados na disciplina Probabilidade e Estatstica no 1
semestre de 2013, 65% eram do sexo masculino e sua estatura mdia foi de 169 cm.
b) Estatstica ou Estimador uma quantidade calculada com base nos elementos de uma
amostra. Por exemplo: do total de 13 alunos do curso de Licenciatura em Qumica
matriculados na disciplina Probabilidade e Estatstica no 1 semestre de 2013, 69% eram do
sexo feminino e sua altura mdia era de 166 cm.
Na maioria das situaes de pesquisa os parmetros so difceis de obter, pois implicam no
estudo de toda a populao. Costumam ser substitudos por valores calculados em amostras
(estatsticas) representativas da populao alvo.
2. MTODO ESTATSTICO
a) Definio do problema: Consiste na formulao correta do problema, em examinar outros
levantamentos realizados no mesmo campo (reviso da literatura) e em saber exatamente o que
se pretende pesquisar definindo o problema corretamente (variveis, populao, hipteses,
etc.).
b) Planejamento: Consiste em determinar o procedimento necessrio para resolver o problema:
- Como levantar informaes, quais os tipos de levantamentos: por Censo (completo) ou por
Amostragem (parcial); - Montar cronograma, levantar os custos, etc.
c) Coleta de dados: consiste na obteno dos dados referentes ao trabalho que desejamos fazer.
Os dados podem ser obtidos pela prpria pessoa (primrios) ou se basear no registro de
terceiros (secundrios);
d) Apurao dos dados: consiste em resumir os dados atravs de uma contagem e agrupamento.
e) Apresentao dos dados: a fase em que vamos mostrar os resultados obtidos na coleta e na
organizao. Esta apresentao pode ser Tabular e/ou Grfica e a determinao de medidas.
f) Anlise e interpretao dos dados: a fase mais importante e tambm a mais delicada, pois
so tiradas concluses que auxiliam o pesquisador a resolver seu problema.
3. ORGANIZAO DOS DADOS: Para permitir a anlise dos dados necessria sua organizao que
pode ser feita na forma de uma srie estatstica, uma distribuio de frequncias ou uma
representao grfica.

3.1 REPRESENTAO TABULAR: Uma tabela consiste em dispor os dados em linhas e colunas
distribudas de modo ordenado. A elaborao de tabelas seguem as regras previstas pelo Conselho
Nacional de Estatstica (CNE), pela Associao Brasileira de Normas Tcnicas (ABNT), pelas Normas
de apresentao Tabular do Instituto Brasileiro de Geografia e Estatstica (IBGE) e pela Resoluo do
Conselho Nacional de Metrologia (CONMETRO). Na sequncia mostraremos as principais orientaes


3
para a elaborao de uma tabela. Para maiores detalhes, aconselhamos a consulta s normas citadas.

ELEMENTOS DE UMA TABELA:

Ttulo: O ttulo deve responder as seguintes questes:
- O que? (Assunto a ser representado (fato));
- Onde? (O lugar onde ocorreu o fenmeno (local));
- Quando? (A poca em que se verificou o fenmeno (tempo)).
Deve ter numerao sequencial no caso de haver mais de uma tabela no texto. Deve ser escrito
sem abreviaes, por extenso e de forma clara e concisa.
Exemplo: Distribuio de frequncias das espcies de peixes de uma amostra de 1200 animais
coletados no lago da Hidroeltrica de Tucuru Brasil 2008.

Cabealho: parte da tabela na qual designada a natureza do contedo de cada coluna.
Corpo: o conjunto das informaes que aparecem no sentido vertical e horizontal.
Linhas: parte do corpo que contm uma sequncia horizontal de informaes.
Coluna Indicadora: a diviso em sentido vertical, onde aparece a designao da natureza do contedo
da linha.
Casa ou clula: so as divises que aparecem no corpo da tabela.
Rodap: o espao aproveitado em seguida ao fecho da tabela, onde so colocadas as notas de
natureza informativa (fonte, notas e chamadas).
Fonte: refere-se entidade que organizou ou forneceu os dados expostos.
Notas e Chamadas: podem ser colocadas nas tabelas aps a Fonte. So esclarecimentos contidos na
tabela (nota - conceituao geral; chamada - esclarecer mincias em relao a uma clula).
importante que nenhuma casela (interseco entre linha e coluna) fique em branco.
A tabela deve ser uniforme quanto ao nmero de casas decimais e conter os smbolos ou 0
quando o valor numrico nulo e ... quando no se dispe do dado.
a) TABELAS DE DISTRIBUIO DE FREQUNCIA
Os dados brutos so aqueles que no tiveram nenhum tipo de tratamento quanto a ordenao
dos mesmos.
A partir dos dados brutos, podemos construir tabelas com os dados resumidos para cada
varivel. Essa tabela denominada de Tabela de Distribuio de Frequncias.


4
a.1) Variveis qualitativas:
Tabela 1 Distribuio de frequncia dos alunos de engenharia do IFAM-CENTRO matriculados na
disciplina probabilidade e estatstica, segundo a procedncia, 2 semestre/2012.
Procedncia Frequncia Porcentagem
Manaus 12 54,5
Outro municpio do Amazonas 7 31,8
Outro estado 3 13,7
Total 22 100,0
Fonte: Dirio de classe - 2012

A primeira coluna da Tabela 1 mostra todas as categorias da varivel Procedncia. A segunda
coluna resulta da contagem de quantas observaes se identificam com cada categoria. So as
frequncias observadas chamadas de frequncias absolutas ou simplesmente de frequncias.
Finalmente, a terceira coluna apresenta uma medida relativa da frequncia de cada categoria
pelo nmero total de observaes. Essas porcentagens so obtidas dividindo-se a frequncia de cada
categoria pelo nmero total de observaes e, em seguida, multiplicando-se por 100.

a.2) Variveis quantitativas discretas: A distribuio de frequncias de variveis
quantitativas discretas pode ser feita de forma anloga distribuio de frequncias de variveis
qualitativas.
Tabela 2 Distribuio de frequncia alunos do curso de engenharia do IFAM-CENTRO
matriculados na disciplina probabilidade e estatstica segundo o nmero de irmos, 2 semestre/2012.
Nmero de
irmos
Frequncia
Frequncia
percentual
0 1 4,5
1 6 27,3
2 12 54,6
3 2 9,1
6 1 4,5
Total 22 100,0
Fonte: Dirio de classe - 2012
Na anlise de variveis quantitativas, em geral, so procuradas trs informaes principais:
a) a faixa em que os valores ocorrem com maior frequncia (faixa de valores tpicos);
b) valores discrepantes, que podem ser resultado de erros de mensurao ou digitao, mas
tambm podem corresponder a elementos que apresentam comportamento muito diferente dos demais;
c) a forma da distribuio de modo a permitir a comparao com modelos probabilsticos, o que
nos permite utilizar tcnicas mais avanadas de anlise.
a.3) Variveis quantitativas contnuas: como os dados so contnuos, a melhor forma de
apresent-los utilizando intervalos de valores denominados Intervalos de Classe.
O intervalo de classe o conjunto de observaes contidas entre dois valores limite (limite
inferior e limite superior).
Exemplos de intervalos:
5 |--- 10 intervalo fechado no limite inferior e aberto no limite superior (contm o valor 5 mas no


5
contm o valor 10)
5 -- 10 intervalo aberto nos limites inferior e superior (no contm os valores 5 e 10)
5 |---| 10 intervalo fechado nos limites inferior e superior (contm os valores 5 e 10)

Os intervalos de classe devem ser mutuamente exclusivos (um indivduo no pode ser
classificado em dois intervalos ao mesmo tempo) e exaustivos (nenhum indivduo pode ficar sem
classificao).
A amplitude do intervalo o tamanho do intervalo de classe. A amplitude do intervalo e o
nmero de intervalos dependem basicamente do problema especfico e da literatura existente sobre o
assunto.
Adotaremos como procedimento para a construo dos intervalos de classe o seguinte roteiro:
a) Encontre o menor e o maior valor das observaes e determine a amplitude total dos dados:
h = mximo mnimo.
b) Determine o nmero de intervalos. O nmero de intervalos no deve ser muito baixo nem muito
alto. Um nmero de intervalos pequeno gera amplitudes de classes grandes o que pode causar
distores na visualizao do histograma. Um nmero de intervalos grande gera amplitude de
intervalo muito reduzida. Uma regra prtica para a determinao do nmero de intervalos a
que diz que este deve variar entre 5 e 20 (5 para um nmero muito reduzido de observaes e
20 para um nmero muito elevado). Se n representa o nmero de observaes (na amostra ou na
populao, conforme for o caso) o nmero aproximado de intervalos pode ser calculado por:
Nmero de Intervalos (k): k n arredondando o resultado;
c) Calcular a amplitude dos intervalos: essa ser obtida pela razo entre a amplitude total e o
nmero de intervalos:
k
h
H =
d) Construa as classes de forma a incluir todos os valores observados.

Em todas as etapas da construo das classes deve prevalecer o bom senso: se a primeira
distribuio de frequncias construda no ficou boa (muito resumida ou muito dispersa), aumente ou
diminua o nmero de classes, diminuindo ou aumentando o tamanho delas.

Tabela 3 Distribuio de frequncia alunos do curso de engenharia do IFAM-CENTRO
matriculados na disciplina probabilidade e estatstica segundo a altura (cm), 2 semestre/2012.
Altura (cm) Frequncia
Frequncia
percentual
155 |--- 161 2 9,1
161 |--- 167 6 27,3
167 |--- 173 5 22,7
173 |--- 179 4 18,2
179 |--- 185 5 22,7
Total 22 100,0
Fonte: Dirio de classe 2012



6
3.2 REPRESENTAES GRFICAS
As representaes grficas fornecem, em geral, visualizao mais sugestiva do que as tabelas.

1) Para variveis qualitativas:
a) Grfico de colunas: composto por duas linhas ou eixos, um vertical e outro horizontal.
No eixo horizontal so construdas as colunas que representam cada categoria e a frequncia (absoluta
ou relativa) colocada no eixo vertical. As colunas devem ter a mesma largura e a distncia entre elas
deve ser constante.

Grfico 1 Representao dos alunos do curso de engenharia do IFAM-CENTRO matriculados na
disciplina probabilidade e estatstica segundo a procedncia, 2 semestre/2012.
Fonte: Dirio de classe - 2012

Alternativamente, o eixo horizontal poderia representar a escala das frequncias e o eixo
vertical, as categorias. O resultado chamado de Grfico de Barras.

b) Grfico de Setores Circulares: Um grfico muito comum para representar variveis
qualitativas o chamado Grfico de Setores Circulares (pizza) que particularmente til quando o n
de categorias no grande e as categorias no obedecem a alguma ordem especfica. Consiste num
crculo de raio arbitrrio, representando o todo, dividido em setores, que correspondem s categorias
da varivel de maneira proporcional. A representao da rea de cada setor obtida por uma regra de
trs simples onde o crculo corresponde ao ngulo de 360 e associado ao total de valores observados
(tamanho da populao ou da amostra), um ngulo X que corresponde a um subconjunto do total. Os
valores de X devem somar 360.


7
2
6
5
4
5
0
1
2
3
4
5
6
7
155 |--- 161 161 |--- 167 167 |--- 173 173 |--- 179 179 |--- 185
Altura (cm)
F
r
e
q
u

n
c
i
a

12
7
3
Manaus Outro municpio do Amazonas Outro estado

Grfico 2 Representao dos alunos do curso de engenharia do IFAM-CENTRO matriculados na
disciplina probabilidade e estatstica segundo a procedncia, 2 semestre/2012.
Fonte: Dirio de classe - 2012

2) Para variveis quantitativas:
A representao grfica da distribuio de frequncias de uma varivel contnua feita
atravs de um grfico chamado histograma. O histograma um grfico de barras verticais contguas
devido ao carter contnuo dos valores da varivel. As bases so proporcionais aos intervalos das
classes e a rea de cada retngulo proporcional respectiva frequncia que pode ser tanto a absoluta
simples como a percentual.










Grfico 3 Representao dos alunos do curso de engenharia do IFAM-CENTRO matriculados na
disciplina probabilidade e estatstica segundo a altura (cm), 2 semestre/2012.
Fonte: Dirio de classe - 2012

Um polgono de frequncia um grfico que se realiza atravs da unio dos pontos mais altos
das colunas num histograma de frequncia.
Os polgonos de frequncia para dados agrupados, por sua vez, constroem-se a partir da marca
de classe que coincide com o ponto mdio de cada coluna do histograma.
O ponto mdio calculado para cada intervalo pela mdia aritmtica entre os dois extremos:


8
19,5 24,5 29,5 34,5 39,5
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Idade
F
r
e
q
u

n
c
i
a
n
PM X
X
k
i
i i

=
1
) (

2
LI LS
PM
i
+
= , onde LS = limite superior do intervalo e LI = limite inferior do intervalo.











Grfico 4 Representao dos alunos do curso de engenharia do IFAM-CENTRO matriculados na
disciplina probabilidade e estatstica segundo a idade, 2 semestre/2012.
Fonte: Dirio de classe - 2012
4. MEDIDAS DE POSIO OU TENDNCIA CENTRAL
A tendncia central da distribuio de frequncias de uma varivel em um conjunto de dados
caracterizada pelo valor tpico dessa varivel. Essa uma maneira de resumir a informao contida nos
dados, pois escolheremos um valor para representar todos os outros.
Veremos trs medidas que podem ser utilizadas para descrever a tendncia central de um
conjunto de dados: a mdia, a mediana e a moda. Apresentaremos essas trs medidas e discutiremos
suas vantagens e desvantagens.

4.1 MDIA ARITMTICA SIMPLES
A mdia aritmtica simples (que chamaremos apenas de mdia) a medida de tendncia central
mais conhecida e usada para o resumo de dados. Essa popularidade pode ser devida facilidade de
clculo e ideia simples que ela nos sugere. No caso de dados no agrupados em uma distribuio de
frequncias, a mdia aritmtica definida por:
a) Para dados amostrais:
n
X
X
n
i
i
=
=
1
, onde, n = tamanho da amostra.
b) Para dados populacionais:
N
X
N
i
i
=
=
1
, onde N = tamanho da populao.
No caso dos dados estarem agrupados em uma tabela com intervalos de classe, o clculo da
mdia amostral definido pela expresso:
Onde PM
i
definido como ponto mdio de cada intervalo e K o nmero de
Intervalos, e definido por:
2
LI LS
PM
i
+
= , onde LS = limite superior do
intervalo e LI = limite inferior do intervalo.

PROPRIEDADES DA MDIA ARITMTICA:
a) A soma dos desvios de cada um dos valores de um conjunto em relao mdia sempre zero:

=
=
n
i
i
X X
1
0 ) (


9
b) Somando ou subtraindo um valor constante a cada um dos elementos de um conjunto de dados,
a mdia aritmtica desse conjunto fica somada ou subtrada por essa constante.
c) Multiplicando ou dividindo, por um valor constante, cada um dos elementos de um conjunto de
dados, a mdia aritmtica desse conjunto fica multiplicada ou dividida por essa constante.

4.2 MEDIANA
A mediana de um conjunto ordenado de dados definida como sendo o valor do meio desse
conjunto de dados, dispostos em ordem crescente, deixando metade dos valores acima dela e metade
dos valores abaixo dela.
a) Se n mpar ento existe apenas um valor do meio, que a mediana.
Seja o conjunto de dados (2,0 ; 3,3 ; 2,5 ; 5,6 ; 5,0 ; 4,3 ; 3,2 ).
Ordenando os valores (2,0 ; 2,5 ; 3,2 ; 3,3 ; 4,3 ; 5,0 ; 5,6). O valor do meio 3,3. A mediana o
valor 3,3.

b) Se n par ento existem dois valores do meio. A mediana mdia aritmtica simples deles.
Seja o conjunto de dados (3,0 ; 4,5 ; 5,5 ; 2,5 ; 1,3 ; 6,0 ).
Ordenando os valores (1,3 ; 2,5 ; 3,0 ; 4,5 ; 5,5 ; 6,0). Os valores do meio so 3,0 e 4,5.
A mediana (3,0 + 4,5)/2 = 3,75.

4.3. MODA
Uma maneira alternativa de representar o que tpico atravs do valor mais frequente da
varivel, chamado de moda.
Exemplos:
a) No conjunto de dados (1; 2; 3; 3; 4; 5; 5; 5; 5; 5) h apenas um valor de moda, o valor 5. O
conjunto de dados chamado de UNIMODAL.
b) No conjunto de dados (1; 2; 2; 2; 2; 3; 4; 5; 6; 6; 6; 6; 7; 9) existem duas modas, os valores 2
e 6. O conjunto de dados chamado de BIMODAL.
c) No conjunto de dados (1; 2; 3; 4; 5; 6; 7; 8; 9) no existe um valor mais frequente que os
demais. Portanto o conjunto chamado de AMODAL.
A moda tambm a nica das medidas de tendncia central que faz sentido no caso de variveis
qualitativas. Assim, a categoria dessas variveis que aparecer com maior frequncia chamada de
categoria modal.
MODA, MEDIANA OU MDIA: COMO ESCOLHER?
Devemos sempre apresentar os valores de todas as medidas de tendncia central. Na sequncia
faremos uma comparao entre elas em situaes onde a diferena entre seus valores poder levar a
concluses diversas sobre os dados.
MEDIANA VERSUS MDIA
A mdia uma medida-resumo muito mais usada na prtica do que a mediana. Existem vrias
razes para essa popularidade da mdia, entre elas, a facilidade de tratamento estatstico e algumas
propriedades interessantes que a mdia apresenta.
No entanto, a mdia uma medida muito influenciada pela presena de valores extremos em um
conjunto de dados (valores muito grandes ou muito pequenos em relao aos demais).
Como a mdia usa os valores de cada observao em seu clculo, esses valores extremos
puxam o valor da mdia em direo a si, deslocando tambm a representao do centro, que j no
ser to central como deveria ser.
A mediana, por sua vez, no to influenciada por valores extremos, pois o que utilizamos para
calcul-la a ordem dos elementos e no diretamente seus valores. Assim, se um elemento do conjunto


10
de dados tem o seu valor alterado (um erro, por exemplo), mas sua ordem continua a mesma, a
mediana no sofre influncia nenhuma.
De modo geral, o uso da mediana indicado quando:
Os valores para a varivel em estudo tm distribuio de frequncias assimtrica (verificada
atravs das ferramentas grficas);
O conjunto de dados possui algumas poucas observaes extremas (valores muito mais altos
ou muito mais baixos que os outros);
MODA VERSUS MDIA E MEDIANA
A moda no uma medida de tendncia central muito utilizada, mas tem suas vantagens em
relao mdia e mediana, especialmente quando estamos lidando com variveis que possuem
distribuio de frequncias bimodais ou multimodais.
5. MEDIDAS DE VARIABILIDADE (DISPERSO).
As medidas de tendncia central (mdia, mediana, moda) conseguem resumir em um nico
nmero, o valor que tpico no conjunto de dados. Mas, somente com essas medidas, conseguimos
descrever adequadamente o que ocorre em um conjunto de dados?
Tomemos como exemplo os dois conjuntos de observaes abaixo:
A: 25 28 31 34 37 B: 17 23 30 39 46
Ambos tm a mesma mdia, 31. No entanto, percebe-se intuitivamente que o conjunto B acusa
disperso muito maior do que o conjunto A. Torna-se ento necessrio estabelecer medidas que
indiquem o grau de disperso, ou variabilidade, em relao ao valor central.
As medidas de disperso so medidas que mostram o grau de disperso ou de concentrao em
torno da mdia. As principais medidas de disperso so: varincia, desvio padro e coeficiente de
variao.

5.1. VARINCIA.
Esta medida leva em conta todas as observaes da amostra e mede a disperso desses valores
em torno da mdia. dada pela soma dos quadrados dos desvios (SQD) em relao a media aritmtica,
dividida pelo nmero de graus de liberdade (G.L)*. Por definio a mdia dos quadrados dos desvios
a) Para dados amostrais:
1
) (
1
2
2

=
n
X Xi
s
n
i
onde, n = tamanho da amostra.
b) Para dados populacionais:
N
X
N
i
i
=

=
1
2
2
) (

onde, N = tamanho da populao.



(G.L)*: De uma maneira geral, o nmero de graus de liberdade associados a uma estatstica o nmero
de elementos da amostra, n, menos o nmero de parmetros j estimados. Existem (n - 1) desvios
independentes, e, possvel demonstrar que, utilizando-se o denominador (n 1), obtm-se um
estimador de melhor qualidade da varincia populacional pela varincia da amostra.
CONSIDERAES SOBRE A VARINCIA:
a) O sinal dos desvios irrelevante, uma vez que na frmula os desvios so elevados ao quadrado.
b) A magnitude da diferena que vai determinar maior ou menor peso para a varincia.


11
c) A varincia de um nico dado indeterminada. Isso revela obviamente, de que nada podemos
dizer da variao de dados sem repetio.
d) Somando-se ou subtraindo-se uma mesma constante (k) a todas as observaes de um conjunto
de dados a varincia no se altera.
e) Multiplicando-se ou dividindo-se cada observao de um conjunto de dados por uma mesma
constante (k0), a varincia fica multiplicada ou dividida pelo quadrado dessa constante.

Como medida de disperso a varincia tem a desvantagem de apresentar unidade de medida
igual ao quadrado da unidade dos dados observados, p.ex.; se os dados so medidos em metros (m), a
varincia dada em metros ao quadrado (m)
2
. Para voltarmos unidade de medida original, precisamos
de outra medida de disperso, o Desvio Padro.

Ex: Verifique as propriedades d e e acima colocadas considerando o conjunto de valores:
X = { 2 ; 3 ; 5 ; 6 ; 9} e a constante k = 2.

5.2. DESVIO PADRO
a raiz quadrada positiva do valor da varincia, avalia a variao dos dados e nos permite
discutir os resultados na mesma unidade de mensurao dos dados. O desvio padro da populao e da
amostra representado, respectivamente por:
2
s s =
.

5.3 COEFICIENTE DE VARIAO (ou de variabilidade)
Frequentemente se tem o interesse em comparar variabilidades de diferentes conjuntos de
valores. A comparao se torna difcil em situaes onde as mdias so muitos desiguais ou as unidades
de medidas so diferentes.
O Desvio Padro uma medida absoluta da disperso e o Coeficiente de Variao uma medida
relativa de disperso, pois expressa percentualmente o Desvio Padro por unidade de mdia, ou seja, o
CV representa o Desvio Padro que seria obtido se a mdia fosse igual a 100.
100 100 = =
mdia
padro desvio
X
s
CV

Quanto menor o Coeficiente de Variao de um conjunto de dados, menor a sua variabilidade.
O Coeficiente de Variao expressa o quanto da escala de medida, representada pela mdia,
ocupada pelo desvio-padro.
O Coeficiente de Variao uma medida adimensional, isto , no depende da unidade de
medida. Essa caracterstica nos permite us-lo para comparar a variabilidade de conjuntos de dados
medidos em unidades diferentes, o que seria impossvel usando o desvio-padro.
5.4 SEPARATRIZES: QUARTIS, DECIS E PERCENTIS.
Os quartis, decis e percentis, assim como a Mediana, tambm subdividem a distribuio de
medidas de acordo com a proporo das frequncias observadas.
a) QUARTIL (Q): Os quartis dividem um conjunto de dados em quatro partes iguais, isto ,
25% por parte. H, portanto, em uma distribuio de frequncias, trs quartis.

Amplitude Interquartlica (AIQ): Corresponde diferena entre o valor do Q
3
e Q
1
.


12
Corresponde aos 50% dos dados que ocupam a posio mais central da distribuio.
menos afetada pelos valores extremos do que a amplitude e o desvio padro, o que faz desta
medida a melhor escolha quando a distribuio de frequncia apresenta alto grau de
assimetria: AIQ = Q
3
Q
1
b) DECIL (D): Os Decis so os nove valores que dividem uma distribuio de frequncia em 10
partes iguais:


c) PERCENTIL (P): Os Percentis ou Centis so os noventa e nove valores que dividem uma
distribuio em cem partes iguais:

5.5. ASSIMETRIA E CURTOSE
Segundo Arango (2001) a caracterizao de um conjunto de observaes pode ser feita em
termos de um valor tpico (medidas de tendncia central) e do comportamento dos demais valores do
conjunto ao redor dele (medidas de disperso). Podemos ainda fornecer mais elementos de modo a
completar o diagnstico do conjunto como a verificao da forma de sua distribuio de frequncias.
a) ASSIMETRIA:
Como j sabemos, a distribuio de frequncias de uma varivel pode ter vrias formas, mas
existem trs formas bsicas, representadas esquematicamente pelos histogramas da Figura 1.

Figura 1 Representao esquemtica da forma da distribuio de frequncias e as posies
relativas das medidas de tendncia central.


13

Nesta figura, tambm est a posio de cada uma das medidas de tendncia central
apresentadas neste texto.
Quando uma distribuio simtrica em torno de um valor (o mais frequente, isto , a moda),
significa que as observaes esto igualmente distribudas em torno desse valor (metade acima e
metade abaixo). Ou seja, esse valor tambm a mediana. A mdia dessas observaes tambm
coincidir com a moda, que coincide com a mediana, pois, se as observaes valores esto
simetricamente distribudas em torno de um valor, a mdia delas ser esse valor.
Assim, quando a distribuio de frequncias de uma varivel simtrica, as trs medidas de
tendncia central tm o mesmo valor.
Baseando-se nessas relaes entre mdia e a moda, podemos empreg-las para determinar o
tipo de assimetria.
Assim, calculando o valor da diferena entre a mdia aritmtica e a moda, teremos:
X - Mo = 0 assimetria nula ou distribuio simtrica
X - Mo < 0 assimetria negativa ou esquerda
X - Mo > 0 assimetria positiva ou direita

Outra medida o chamado Coeficiente de Assimetria de Pearson que definido por:
Padro Desvio
Mo X
Sk

=
. Quando:
Sk = 0 assimetria nula ou distribuio simtrica
Sk < 0 assimtrica positiva
Sk > 0 assimtrica negativa

Conhecendo os valores dos Quartis, podemos calcular o valor da Assimetria utilizando o segundo
coeficiente de Pearson, definido por: As =
1 3
1 3
2
Q Q
Md Q Q

+
. A interpretao do valor a mesma.

b) CURTOSE: identifica se a curva que representa uma distribuio de frequncias apresenta
um formato achatado ou alongado em relao curva padro normal (gaussiana). De modo geral, as
distribuies se classificam quanto curtose, conforme mostrado na figura 2. calculada com base
na concentrao ou disperso dos valores de um conjunto de dados em relao medidas de tendncia
central de uma distribuio.






Figura 2 Tipos de distribuio quanto curtose.

Logo, uma curva (conjunto) poder ser quanto sua Curtose:
Mesocrtica: ou de curtose mdia. Fica no meio termo. Nem muito achatada e nem muito
afilada.
Platicrtica: a curva mais achatada.
Leptocrtica: a curva mais afilada.
a) b) c)


14
Para verificar o tipo de curva (da distribuio) e o grau de Curtose utiliza-se a medida
estatstica adimensional denominada de Coeficiente de Curtose definido como:
) ( 2
) (
10 90
1 3
P P
Q Q
C

=
onde: Q
3
e Q
1
= Terceiro e primeiro quartis.
P
10
e P
90
=Dcimo e nonagsimo percentis.
A interpretao para o Coeficiente de Curtose :
Se C = 0,263 curva mesocrtica
C < 0,263 curva leptocrtica
C > 0,263 curva platicrtica


15
6. CONCEITOS BSICOS DE PROBABILIDADE
Segundo Magalhes e Lima (2002, p.37) a teoria das probabilidades tem por objetivo o estudo
de fenmenos aleatrios.
Para Morettin (2006, p.1) na natureza encontramos dois tipos de fenmenos: os determinsticos
e os aleatrios. Segundo o mesmo autor, os fenmenos determinsticos so aqueles em que os
resultados so sempre os mesmos, qualquer que seja o nmero de repeties dele. Por exemplo, se
deixarmos um bloco de gelo a temperatura ambiente sabemos que haver a passagem para o estado
lquido. J o fenmeno chamado de aleatrio se quando observado repetidamente sob as mesmas
condies ele produz resultados diferentes a cada repetio. Mesmo que a chance da ocorrncia seja
alta, os resultados no so conhecidos antes de ocorrer, mas mantm certa regularidade, o que permite
determinar a chance de ocorrncia, qual seja, a Probabilidade.
So exemplos:
Condies climticas do prximo domingo;
Jogar uma moeda repetidamente e observar o resultado da face de cima;
Jogar um dado e observar o nmero mostrado na face superior;

Quando a possibilidade de repetir o fenmeno est na mo do experimentador, este fenmeno
aleatrio chamado de experimento aleatrio.

6.1. ESPAO AMOSTRAL ( - mega) E EVENTO
O espao amostral () o conjunto formado por todos os resultados possveis de um
experimento aleatrio. Este conjunto ser nico para cada experimento aleatrio. Os elementos que
compem o espao amostral so chamados de pontos amostrais.
Um evento qualquer subconjunto do conjunto definido como espao amostral.
So exemplos de experimentos aleatrios e seu espao amostral:
a) Lanar uma moeda honesta e observar a face voltada para cima.
Os resultados possveis so: = {Cara, Coroa}.
c) Lanar um dado honesto e observar o resultado do lanamento.
Os resultados possveis so: = {1; 2; 3; 4; 5; 6 }.
d) Lanamento simultneo de duas moedas honestas.
Os resultados possveis so: = {(cara, cara), (cara, coroa), (coroa, cara), (coroa, coroa)}.

6.2. OPERAES COM EVENTOS ALEATRIOS
Para verificarmos as operaes possveis com eventos aleatrios utilizaremos alguns conceitos
da teoria dos conjuntos.
Consideremos o espao amostral finito = {e
1
, e
2
, ... e
n
} e dois eventos A e B associados a ele.
a) UNIO:
DEFINIO: A U B = {e
i
| e
i
A ou e
i
B} para i = 1, 2, ..., n.
Ou seja, o evento unio formado por todos os pontos amostrais que pertencem a pelo menos
um dos eventos.

Figura 3 Evento Unio



16
b) INTERSECO:
DEFINIO: A I B = {e
i
| e
i
A e e
i
B} para i = 1, 2, ..., n.
Ou seja, o evento interseco formado por todos os pontos amostrais que pertencem
simultaneamente aos eventos A e B.

Figura 4 Evento Interseco

Quando a interseco entre dois ou mais eventos vazia ( ), dizemos que os eventos so
mutuamente excludentes ou mutuamente exclusivos ou disjuntos.


Figura 5 Eventos mutuamente exclusivos

c) COMPLEMENTAO:
DEFINIO: - A = A
c
= {e
i
| e
i
A} para i = 1, 2, ..., n.
Ou seja, o complementar de um evento formado por todos os pontos amostrais que
pertencem ao espao amostral, mas no pertencem ao evento.

Figura 6 Complementar de um evento

Exemplo: Seja o experimento aleatrio lanamento um dado honesto e observao dos
resultados. O espao amostral formado por: = {1, 2, 3, 4, 5, 6}. Considere os seguintes eventos:
1. Sada de uma face par A = {2, 4, 6};
2. Sada de uma face mpar B = {1, 3, 5};
3. Sada de uma face menor ou igual a 3 C = {1, 2, 3}

Determinar os eventos:
a) A U C =
b) B U C =
c) A
c
=
d) (B U C)
c
=
e) A
c
I B =
f) A
c
I B
c
=
g) C
c
=
h) A

I B =



17
6.3. ALGUMAS PROPRIEDADES RELATIVAS A CONJUNTOS
a) X Y = Y X (Lei comutativa da Unio)
b) X Y =Y X (Lei comutativa da interseco)
c) X (Y Z) = (X Y) Z = X Y Z (Lei associativa da unio)
d) X (Y Z) = (X Y) Z = X Y Z (Lei associativa da interseco)
e) X (Y Z) = (X Y) (X Z) (Primeira Lei Distributiva)
f) X (Y Z) = (X Y) (X Z) (Segunda Lei Distributiva)
g) X = X e X =
h) X U = U e X U = X
i) (X Y)
c
= X
c
Y
c
(Primeira Lei de Morgan)
j) (X Y)
c
= X
c
Y
c
(Segunda Lei de Morgan)
k) X = (X Y) (X Y)
c
(para quaisquer conjuntos X e Y)

Exerccios:
1. As atividades fsicas tm sido recomendadas como forma de se obter uma boa qualidade de vida.
Uma pesquisa realizada com mdicos que residem na regio ocenica de uma determinada cidade, na
faixa etria entre 30 e 40 anos, sobre a prtica de duas modalidades de atividades fsicas
caminhada na orla martima e exerccios em academia de ginstica, 130 apenas caminham na orla,
280 praticam somente uma das duas modalidades e 30 praticam as duas modalidades. A quantidade
de mdicos que frequentam academia de ginstica corresponde a:
a) 150 b) 160 c) 180 d) 210 e) 280

2. Uma pesquisa referente a dois telejornais, A e B, envolvendo 100 pessoas, revelou que:
82 gostam de A;
76 gostam de B;
4 no gostam nem de A, nem de B.
O nmero de pessoas que gosta de ambos os telejornais :
a) 56 b) 58 c) 60 d) 62 e) 64

3. Uma pesquisa realizada com um grupo de 78 pessoas acerca de suas preferncias individuais de
lazer nos finais de semana, entre as opes caminhar no parque, fotografar e ir ao cinema, revelou
que:
26 preferem caminhar no parque;
19 preferem ir ao cinema;
12 preferem caminhar no parque e ir ao cinema;
8 preferem fotografar e caminhar no parque;
5 preferem fotografar e ir ao cinema;
2 preferem as 3 opes;
20 no preferem nenhuma dessas trs opes.
Nessa situao, a quantidade desses indivduos que preferem fotografar, mas no gosta de ir ao cinema
e nem de caminhar no parque nos finais de semana igual a:
a) 10; b) 12; c) 15; d) 25; e) 29.

6.4. PARTIO DE UM ESPAO AMOSTRAL

Figura 7 Partio de um espao amostral


18

DEFINIO: Dizemos que os eventos A
1
, A
2
, ..., A
n
formam uma partio do espao amostral se:
a) A
i
, i = 1, 2, ..., n.
b) A
i
I A
j
= , para i j.
c)
U
n
i 1 =
A
i
= .

6.5. PROBABILIDADE
1. FUNO DE PROBABILIDADE:
DEFINIO: a funo P que atribui aos eventos do espao amostral um nmero real
pertencente ao intervalo [0,1], satisfazendo aos seguintes axiomas:
i. P() = 1.
ii. P(A U B) = P(A) + P(B) se A e B forem mutuamente exclusivos.
iii. P(
U
n
i 1 =
A
i
) =

=
n
i 1
P(A
i
), se A
1
, A
2
, ..., A
n
forem, dois a dois, eventos mutuamente
exclusivos.

Pela definio, observamos que 0 P(A) 1 para todo evento A .

2. TEOREMAS:
T1 Se os eventos A
1
, A
2
, ..., A
n
formam uma partio do espao amostral , ento:

=
n
i 1
P(A
i
) = 1.

T2 Se o evento impossvel, ento P( ) = 0.

T3 Para todo evento A , P(A) + P(A
c
) = 1.

T4 Sejam A e B . Ento P(A U B) = P(A) + P(B) P (A

I B) chamado de Teorema
da Soma.

3. EVENTOS EQUIPROVVEIS:
Consideremos o espao amostral = {e
1
, e
2
, ..., e
n
} associado a um experimento aleatrio.
Chamemos P(e
i
) = p
i
, i = 1, 2, ..., n.
Temos

=
n
i 1
P(e
i
) =

=
n
i 1
p
i
= 1 a

DEFINIO: Os eventos e
1
, e
2
, ..., e
n
so equiprovveis quando P(e
1
) = P(e
2
) = ... = P(e
n
) = p, isto ,
quando todos tm a mesma probabilidade de ocorrer.
Ento a fica:

=
n
i 1
p
i
= 1 np = 1 p =
n
1

Logo, se os n pontos amostrais (eventos) so equiprovveis, a probabilidade de cada um dos pontos
amostrais
n
1
. Suponha um evento A tal que ele tenha k pontos amostrais A = {e
1
, e
2
, ..., e
k
}
1 k n. P(A) =

=
k
i 1
P(e
i
) =

=
k
i 1
p = K p = K
n
1
P(A) =
n
K


Podemos resumir P(A) =
possveis casos de total
A evento ao favorveis casos de n
.


19

Exemplo - Seja o Experimento Aleatrio lanamento de um dado no viciado e observao da face
voltada para cima. O seu espao amostral ser = {1, 2, 3, 4, 5, 6}. Definindo trs eventos: A = face 1 =
{1}, B = face par = {2, 4, 6} e C = face

2 = {1, 2}, calcular a probabilidade de ocorrncia dos seguintes


eventos:
a) Complementar de A.
b) Complementar de B.
c) Unio de B e C.
d) Interseco de A e B.

6.6. PROBABILIDADE CONDICIONAL E INDEPENDNCIA DE EVENTOS
1. PROBABILIDADE CONDICIONAL:
Em algumas vezes h interesse de calcular a probabilidade de ocorrncia de um evento A
qualquer, sabendo (ou supondo) que outro evento B ocorreu previamente.
DEFINIO: Dados dois eventos A e B, a probabilidade condicional de A dado que ocorreu B
representada por P(A | B) dada por:
) (
) (
) | (
B P
B A P
B A P

= , para P(B) > 0.
importante ressaltar que a operao de interseco comutativa, implicando em:
P(A B) = P(B A).

2. INDEPENDNCIA DE EVENTOS:
Sejam A e B.
DEFINIO: A e B so eventos independentes se P(A I B) = P(A) P(B).
Exemplo - Uma urna contm 2 bolas brancas e 3 vermelhas. Retiram-se 2 bolas ao acaso, uma aps a
outra. Resolva os itens abaixo:
a) Se a retirada for feita SEM REPOSIO.
a.1- Qual a probabilidade de que as 2 bolas retiradas sejam da mesma cor?
a.2- Qual a probabilidade de que as 2 bolas retiradas sejam vermelhas, supondo-se que so da
mesma cor?
b) Se a retirada for feita COM REPOSIO.
b.1- Qual a probabilidade de que as 2 bolas retiradas sejam da mesma cor?
b.2- Qual a probabilidade de que as 2 bolas retiradas sejam vermelhas, supondo-se que so da
mesma cor?

6.7. TEOREMA DE BAYES
Sejam A
1
, A
2
, ..., A
n
eventos que formam uma partio do espao amostral . Seja B.
Sejam conhecidas P(A
i
) e P(B|A
i
), i = 1, 2, ..., n.
Ento: P(A
j
|B) =

n
i
i i
j j
A B P A P
A B P A P
1
) | ( ) (
) | ( ) (
, j = 1, 2, ..., n

EXERCCIOS:
1. A probabilidade de um homem estar vivo daqui a 20 anos de 0,4 e de sua mulher de 0,6. Qual a
probabilidade de que:
a) ambos estejam vivos no perodo?


20
b) somente o homem estar vivo?
c) ao menos a mulher estar viva?
d) somente a mulher estar viva?

2. Um casal pretende ter filhos. Sabe-se que a cada ms a probabilidade da mulher engravidar de
20%. Qual a probabilidade dela vir a engravidar somente no quarto ms de tentativas?

3. Em uma escola de idiomas com 2000 alunos, 500 alunos fazem o curso de ingls, 300 fazem o curso
de espanhol e 200 cursam ambos os cursos. Selecionando-se um estudante do curso de ingls, qual a
probabilidade dele tambm estar cursando o curso de espanhol?

4. Considere uma prova de Matemtica constituda de quatro questes de mltipla escolha, com
quatro alternativas cada uma, das quais apenas uma correta. Um candidato decide fazer essa
prova escolhendo, aleatoriamente, uma alternativa em cada questo. Qual a probabilidade de esse
candidato acertar, nessa prova, exatamente uma questo?

5. As mquinas A e B produzem o mesmo tipo de embalagem para teste de laboratrio. A porcentagem
de embalagens defeituosas produzidas, respectivamente, pelas mquinas A e B de 15% e de 5%.
Foram misturadas, numa caixa 100 embalagens produzidas por A e 100 produzidas por B. Se
tirarmos uma embalagem ao acaso e ela for defeituosa, a probabilidade de que tenha sido
produzida pela mquina A?

6. Um novo teste foi desenvolvido para determinar se um estudante est estressado com o estudo de
Teoria das Probabilidades. O teste 95% acurado (d o resultado correto) se o estudante NO
est estressado, mas acerta somente 85% se ela ou ela esta de fato estressado. Sabe-se que
99,5% de todos os estudantes esto estressados. Sabendo-se que o resultado de um teste indicou
que certo aluno no esta estressado, qual a probabilidade de que o teste tenha indicado o resultado
correto?

BIBLIOGRAFIA BSICA:
Calegari, J.S.M., Bioestatstica: princpios e aplicaes. 1 ed., Artmed, 2004.
Fontelles, M.J., Bioestatstica: aplicada pesquisa experimental. 1 ed, Livraria da Fsica, 2012
Montgomery,D.C.; Runger,G.C. Estatstica Aplicada e Probabilidade para Engenheiros, 5 ed, LTC, 2012.
Morettin, L.G. Estatstica Bsica. Makron Books, 2009.
Meyer, P. Probabilidade: aplicaes estatstica. LTC,
Vieira, S. Introduo Bioestatstica, 2 ed, Campus, 1991


BIBLIOGRAFIA COMPLEMENTAR:
Arango, H.G., Bioestatstica terica e computacional, 1 ed, Guanabara Koogan, 2001
Barbetta, P.A.; Reis, M.M.; Bornia, A.C. Estatstica para cursos de engenharia e informtica, Atlas, 3
ed, 2010.
Magalhes, M.N.; Lima, A.C.P. Noes de probabilidade e estatstica, Edusp, 2002.
Walpole, R.E; Myers, R.H.; Myers, S.L.; Ye, K. Probabilidade e estatstica para cincias exatas. Pearson
Prentice Hall, 2009

Você também pode gostar