Escolar Documentos
Profissional Documentos
Cultura Documentos
Angela
INTRODUÇÃO
A estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-
los, resumi-los, analisá-los, interpretá-los e deles extrair soluções. Nela, utiliza-se muito os termos
população e amostra, que estão no próprio cerne da estatística, assim como outros termos também
importantes.
A palavra estatística provém do latim status, que significa Estado. A primitiva utilização da
estatística envolvia compilações de dados e gráficos que descreviam vários aspectos de um Estado ou
País. Em 1662, John Graunt publicou informes estatísticos sobre nascimentos e mortes, vindo depois a
ser complementado por taxas de desemprego, rendas, tamanho de populações, etc. Assim, as taxas de
desemprego, inflação, índices de consumidor, taxas de natalidade, mortalidade, etc, são calculados em
tempos regulares e utilizadas por empresários em tomadas de decisões como contratação de empregados,
níveis de produção, expansão para novos mercados, etc.
• Pouco depois de encerrada a votação num dia de eleições, a televisão anuncia que determinado
candidato é o provável vencedor. E a previsão é feita após a contagem de apenas 2% dos votos;
• Um em cada três prédios construídos é desperdiçado na construção civil;
• Um fabricante de lâmpadas para máquinas fotográficas deve determinar a percentagem de lâmpadas
que não funcionarão. Se essa percentagem for muito grande, a reputação do fabricante estará em
risco, mas se ele fosse testar todas as lâmpadas, destruiria toda a sua produção. Testa, pois, só uma
pequena fração dentre elas e sua decisão de despachar ou não as lâmpadas se baseará nessa pequena
fração;
• O metereologista informa que a probabilidade de chover hoje é de 30%;
• O governo informa que a renda média de uma família de quatro pessoas aumentou 5% de um ano
para cá;
• Um professor comunica à classe que sua nota média foi 7,0.
DEFINIÇÕES
Variáveis:
• Variável é a característica de interesse que é medida em cada elemento da amostra ou população.
• Como o nome diz, seus valores variam de elemento para elemento.
• As variáveis podem ter valores numéricos ou não numéricos.
Variável: é a característica que vai ser observada, medida ou contada nos elementos da
população ou da amostra e que varia, ou seja, assume um valor diferente de elemento para elemento.
(contrário de constante). Não basta identificar a variável a ser trabalhada, é necessário fazer-se distinção
entre os tipos de variáveis:
Variáveis
QUANTITATIVAS QUALITATIVAS
Variáveis Quantitativas
É uma variável que assume como possíveis valores, números. Também denominadas de
variáveis numéricas. São características populacionais que podem ser quantificadas. Podem ser:
VARIÁVEIS CONTÍNUAS resultam de um número infinito de valores possíveis que podem ser
associados a pontos em uma escala contínua de tal maneira que não haja lacunas ou interrupções. É
quando os dados representam MENSURAÇÕES, ou seja, a variável contínua pode assumir um valor em
qualquer ponto fracionário ao longo de um intervalo especificado de valores, gerados pelo processo de
medição.
Ex: peso de cada remessa, tempo decorrido antes da 1ª falha de um dispositivo, o número médio de
pessoas por domicílio em uma comunidade, comprimento do canal radicular (mm), etc.
Ex: número de pessoas por domicílio, unidades de um artigo em um inventário, número de peças
defeituosas encontradas em um lote de pinos intrarradiculares; CPOD, etc.
Variáveis qualitativas nominais: é uma variável que assume como possíveis valores, atributos ou
qualidades e estes não apresentam uma ordem natural de ocorrência, são utilizados símbolos ou números
para representar determinado tipo de dado, mostrando assim, a qual grupo ou categoria pertencem Ex.:
sexo; meio de informação utilizado, cor do fruto, marca de um produto, local de residência, etc.
Variáveis qualitativas ordinais (ou por postos): é uma variável que assume como possíveis valores
atributos ou qualidades e estes apresentam uma ordem natural de ocorrência. Ex.: Padrão de uma casa,
estatura (alta, média, baixa), grau de instrução, opinião sobre um produto (ótimo, bom, médio, ruim), etc.,
quando uma classificação for dividida em categorias ordenadas, em graus convencionados, havendo uma
relação entre as categorias do tipo “maior que”, “menor que”, “igual a”. Os dados por postos consistem de
valores relativos atribuídos para denotar a ordem do primeiro, segundo, e assim sucessivamente.
Título
Os dados podem ser organizados em tabelas ou gráficos.
Cabeçalho
Tabela 1- Taxa de albumina (g/100ml) no plasma de 25 pacientes-HUSM-2010
Albumina Contagem f fr F Fr
(x)
4,5 | 1 (1/25)=0,04 1 (1/25)=0,04
4,6 0 0 1 (1/25)=0,04
Rodapé
Onde:
f ou fi ⇒ freqüência simples ou absoluta (número de vezes em que o dado aparece)
fr ou fir ⇒ freqüência relativa (relação entre o número de vezes em que o dado aparece e o total de
dados) ⇒ Quando expresso em porcentagem(%) sua simbologia é fr(%) ou fir(%)
F ou Fi ⇒ freqüência acumulada
Fr ou Fir ⇒ freqüência acumulada (relação entre a freqüência acumulada e o total de dados)
⇒ Quando expresso em porcentagem(%) sua simbologia é Fr(%) ou Fir(%)
Bioestatística- Parte 1 Prof. Angela
Título Cabeçalho
Deve responder a três perguntas: Indica a natureza do conteúdo de cada coluna
- o quê? Assunto a ser representado.
- onde? Lugar onde ocorreu o fenômeno.
- quando? A época em que ocorreu o fenômeno.
Corpo Rodapé
Composta por linhas e colunas Espaço aproveitado abaixo da tabela, onde são
colocados detalhes do conteúdo da tabela de
natureza informativo (fonte, notas de observações)
H i st ogr a m a
0
0
4,5 4,5.
4,7 4,7.
4,9 4,9.
5,1 5,1. 5,3 5,3.
5,5 5,5.
5,7 5,7.
Classes
C l asse s
1 0 ,0 0
f
8 ,00
6 ,00
4 ,0 0
2 ,0 0
0 ,00
xi
,0 0 4 ,5 9 4 ,7 6 4,9 3 5,1 0 5 ,2 7 5 ,4 4 ,0 0
f 6
0
1 2 3 4 5 6 7 8 9 10 11 Li
Gráfico de Colunas
f
40
35
35
30 27
25
20
15
10
5
0
Feminino Masculino gênero
gênero
Masculino 27
Feminino 35
0 5 10 15 20 25 30 35 40
Gráfico de Setores
44% Feminino
56% Masculino
f 30
24
25
20
Feminino
15 12 Masculino
10 8
5
5
0
Dentes restaurados Dentes Perdidos
Situação
Dentes 8
Perdidos 5
Masculino
Feminino
24
Dentes
restaurados
12
0 5 10 15 20 25 30 f
f
40
35
30
24
25 Masculino
20 Feminino
15
8
10 12
5 5
0 Situação
Dentes restaurados Dentes Perdidos
MÉDIA
Χ
∑x
i =1
i
∑x
x= ou simplesmente x =
n n
n
OBS: x lê-se X barra e significa média. ∑x
i =1
i lê-se somatório de xi, i variando de 1 a n.
∑x
i =1
i = x1 + x 2 + ... + x n
Ex: Relacionam-se a seguir os tempos (em anos. Calcular a média desta amostra.
10 29 26 28 15 23 17 25 0 20
x=
∑x =
n
A média é:
A média tem certas propriedades interessantes e úteis, que explicam por que é ela a medida de
tendência central mais usada:
1. A média de um conjunto de números pode sempre ser calculada;
2. Para um dado conjunto de números, a média é única;
3. A média é sensível a ( ou afetada por) todos os valores do conjunto. Assim, se um valor se modifica,
a média também se modifica;
Bioestatística- Parte 1 Prof. Angela
4. Somando-se uma constante a cada valor do conjunto, a média ficará aumentada do valor dessa
constante. Assim, somando-se 4,5 a cada valor de um conjunto , a média ficará aumentada de 4,5.
Analogamente, subtraindo-se cada valor do conjunto uma constante, ou multiplicando-se ou
dividindo-se por ela cada valor do conjunto, a média fica reduzida dessa constante, ou multiplicada
ou dividida por ela;
A média de uma distribuição de freqüência é calculada com base valor e na freqüência de cada
classe.
x=
∑x i fi
n
MEDIANA
A mediana de um conjunto de valores é o valor do meio desse conjunto, quando os valores estão
dispostos em ordem crescente (ou decrescente). Para calcular a mediana, dispor primeiro os valores em
ordem (crescente ou decrescente) e em seguida aplicar um dos dois processos a seguir:
1. Se o número de valores é ímpar, a mediana é o número localizado exatamente no meio da
lista;
Ex: 10 15 26 28 29
A moda de um conjunto de dados é o valor que ocorre com maior frequência. Quando dois
valores ocorrem com a mesma frequência máxima, cada um deles é uma moda, e o conjunto se diz
bimodal. Se dois valores ocorrem com a mesma frequência máxima, é chamado de bimodal, se forem 3
valores, é chamado de trimodal e se no caso forem 4 ou mais, então é plurimodal. Quando nenhum valor é
repetido, o conjunto não tem moda, é chamado de amodal.
Bioestatística- Parte 1 Prof. Angela
Moda
Moda
Mediana Moda
Mediana
Média Mediana
Média
Média
MEDIDAS DE VARIABILIDADE
As medidas de variabilidade ou dispersão indicam se os valores estão relativamente próximos ou não uns
dos outros. Na análise de um conjunto de dados é necessário que sejam observados tanto as informações
relativas à localização (medidas de tendência central) quanto as informações de dispersão (medidas de
variabilidade).
Ex:
Pequena variabilidade
Grande variabilidade
Bioestatística- Parte 1 Prof. Angela
Supor que duas máquinas ensacadoras diferentes ensaquem em média 10 Kg de cereal mas que
em um dos casos todos os sacos estejam dentro de uma margem de 0,10 Kg deste peso, enquanto no outro
caso os pesos possam variar até 1Kg em uma ou outra direção. Medir a variabilidade, neste caso, é tão
importante como media o valor médio.
Algumas são as formas de medir a variação, sendo elas as quatro medidas de dispersão:
amplitude, variância, desvio padrão e coeficiente de variação. Todas elas, exceto a amplitude, têm na
média o ponto de referência. Em cada caso, o valor zero indica ausência de variação; a dispersão aumenta
à proporção que aumenta o valor da medida (intervalo, variância, etc.).
AMPLITUDE
Também conhecida como intervalo. A amplitude de um grupo de dados é, de modo geral, mais
simples de calcular e de entender. Consiste na diferença entre o maior e o menor valor, ou seja, entre os
valores extremos. É dada pela fórmula:
OBS.:Para dados agrupados em uma distribuição de freqüência, a amplitude total é geralmente definida
como a diferença entre a fronteira superior da classe mais alta e a fronteira inferior da classe mais baixa.
. Variância: (σ2 para a população e S2 para a amostra)
A variância é uma medida de variabilidade dos dados em torno da média. A princípio
poderíamos pensar em quantificar os desvios de cada observação em relação à média:
xi – x = di
E a forma natural seria considerar a soma de todos estes desvios. A idéia seria de quanto maiores
fossem os desvios, maior seria a variabilidade presente nos dados. Entretanto pela definição de média,
n −
∑ ( xi − x ) = 0
i =1
Portanto, uma alternativa seria elevar os desvios de cada observação em relação à média, ao
quadrado, isto é, a quantidade a ser calculada seria:
n −
∑ (x i − x) 2
i =1
Dessa forma, adicionamos somente valores positivos. Torna-se necessário considerar o número
de observações, pois, à medida que forem acrescentadas observações, o valor deste somatório também
será aumentado. Uma idéia seria considerar a média, isto é,
−
n
( xi − x ) 2
∑
i =1 n
Em palavras, a variância é uma média dos desvios ao quadrado das observações em relação à
média.
n −
∑ ( xi − x) 2
S2 = i =1
; amostra
n −1
n −
∑ (x i − x) 2
σ2 = i =1
; utiliza-se n, população
n
Logo,
A variância de uma amostra é uma medida de variabilidade dos dados em torno da média.
( x1 − x ) 2 + ( x 2 − x ) 2 + ... + ( x n − x ) 2
Variância = S 2 =
n −1
n (x − x)2
S2 = ∑ in − 1
i =1
População Amostra
n − n −
∑ ( xi − x ) 2
i =1
∑ (x
i =1
i − x) 2
σ= ; S= ;
n n −1
CONCLUSÃO: Os alunos são, aproximadamente, duas vezes mais dispersos quanto ao peso do que
quanto à altura.