Você está na página 1de 16

Bioestatística- Parte 1 Prof.

Angela

INTRODUÇÃO

A estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-
los, resumi-los, analisá-los, interpretá-los e deles extrair soluções. Nela, utiliza-se muito os termos
população e amostra, que estão no próprio cerne da estatística, assim como outros termos também
importantes.
A palavra estatística provém do latim status, que significa Estado. A primitiva utilização da
estatística envolvia compilações de dados e gráficos que descreviam vários aspectos de um Estado ou
País. Em 1662, John Graunt publicou informes estatísticos sobre nascimentos e mortes, vindo depois a
ser complementado por taxas de desemprego, rendas, tamanho de populações, etc. Assim, as taxas de
desemprego, inflação, índices de consumidor, taxas de natalidade, mortalidade, etc, são calculados em
tempos regulares e utilizadas por empresários em tomadas de decisões como contratação de empregados,
níveis de produção, expansão para novos mercados, etc.

POR QUE ESTUDAR ESTATÍSTICA?

1. O raciocínio estatístico é muito usado no governo e na administração. Assim, é possível que um


empregador venha a contratar ou promover o leitor por causa de seu conhecimento estatístico;
2. Os administradores necessitam do conhecimento da estatística para bem tomar suas decisões e para
evitar serem iludidos por certas apresentações viciosas;
3. O turismólogo pode querer conhecer como está o aproveitamento turístico de um determinado local,
se é viável sua exploração turística ou não, saber como está o índice de satisfação de um cliente para
poder tomar suas decisões;
4. O publicitário deverá conhecer o possível retorno que uma campanha de publicidade de alto valor
pode ter. Também terá que tomar decisões certas;
5. O Cirurgião-Dentista poderá querer saber quais os fatores associados à doença cárie/doença
periodontal em determinado grupo de pessoas;
6. Cursos subseqüentes utilizam a análise estatística;
7. A maioria das revistas profissionais e outras contém referências frequentes e estudos estatísticos;
8. A imprensa, tanto quanto muitas experiências cotidianas, oferecem amplas oportunidades para a
interpretação estatística.

Enfim, para desenvolver a habilidade na resolução de problemas, o que inclui a capacidade de


reconhecer qual técnica se aplica a determinada situação e de utilizá-la eficazmente na resolução do
problema.

EIS ALGUMAS FORMAS DE UTILIZAR A ESTATÍSTICA


Bioestatística- Parte 1 Prof. Angela

• Pouco depois de encerrada a votação num dia de eleições, a televisão anuncia que determinado
candidato é o provável vencedor. E a previsão é feita após a contagem de apenas 2% dos votos;
• Um em cada três prédios construídos é desperdiçado na construção civil;
• Um fabricante de lâmpadas para máquinas fotográficas deve determinar a percentagem de lâmpadas
que não funcionarão. Se essa percentagem for muito grande, a reputação do fabricante estará em
risco, mas se ele fosse testar todas as lâmpadas, destruiria toda a sua produção. Testa, pois, só uma
pequena fração dentre elas e sua decisão de despachar ou não as lâmpadas se baseará nessa pequena
fração;
• O metereologista informa que a probabilidade de chover hoje é de 30%;
• O governo informa que a renda média de uma família de quatro pessoas aumentou 5% de um ano
para cá;
• Um professor comunica à classe que sua nota média foi 7,0.

DEFINIÇÕES

 População - coleção completa de todos os elementos (valores, pessoas, medidas,


etc.) a serem estudados.
 Censo – coleção de dados relativos a todos os elementos de uma população .
 Amostra – subcoleção de elementos extraídos de uma população (uma parte da
população- existem métodos específicos para retirar os elementos para compor a
amostra chamado de Teoria da Amostragem)
 Parâmetro – medida numérica que descreve uma característica de uma população.
 Estatística – medida numérica que descreve uma característica da amostra.

Dados Estatísticos- repostas da nossa pesquisa


Podem ser primitivos/primários ou brutos- quando não sofreram tratamento matemático, assim
como são tomados são observados.
Podem ser secundários- quando já passaram por algum tratamento matemático.

NATUREZA DOS DADOS


Alguns conjuntos de dados consistem em números (ex:alturas) enquanto que outros não são
numéricos (ex: sexo feminino). Dessa forma, aplicam-se as expressões dados quantitativos e dados
qualitativos para distinguir esses tipos .
Bioestatística- Parte 1 Prof. Angela

Variáveis:
• Variável é a característica de interesse que é medida em cada elemento da amostra ou população.
• Como o nome diz, seus valores variam de elemento para elemento.
• As variáveis podem ter valores numéricos ou não numéricos.

Variável: é a característica que vai ser observada, medida ou contada nos elementos da
população ou da amostra e que varia, ou seja, assume um valor diferente de elemento para elemento.
(contrário de constante). Não basta identificar a variável a ser trabalhada, é necessário fazer-se distinção
entre os tipos de variáveis:

Variáveis

QUANTITATIVAS QUALITATIVAS

 Consistem em números Categóricos ou atributos,



que representam podem ser separados em
contagens ou medidas
diferentes categorias que
se distinguem por alguma
As Variáveis quantitativas podem ser CONTÍNUAS ou DISCRETAS.característica não

Variáveis Quantitativas
É uma variável que assume como possíveis valores, números. Também denominadas de
variáveis numéricas. São características populacionais que podem ser quantificadas. Podem ser:

VARIÁVEIS CONTÍNUAS resultam de um número infinito de valores possíveis que podem ser
associados a pontos em uma escala contínua de tal maneira que não haja lacunas ou interrupções. É
quando os dados representam MENSURAÇÕES, ou seja, a variável contínua pode assumir um valor em
qualquer ponto fracionário ao longo de um intervalo especificado de valores, gerados pelo processo de
medição.

Ex: peso de cada remessa, tempo decorrido antes da 1ª falha de um dispositivo, o número médio de
pessoas por domicílio em uma comunidade, comprimento do canal radicular (mm), etc.

VARIÁVEIS DISCRETAS resultam de um conjunto finito de valores possíveis ou de um conjunto


enumerável desse valores, ou seja, o número de valores possíveis é 0 ou 1 ou 2, etc. É quando os dados
representam CONTAGENS, que pode ter valores observados somente em pontos isolados ao longo de
uma escala de valores. Por ocorrerem por processo de contagem, normalmente tais valores são expressos
como números inteiros.
Bioestatística- Parte 1 Prof. Angela

Ex: número de pessoas por domicílio, unidades de um artigo em um inventário, número de peças
defeituosas encontradas em um lote de pinos intrarradiculares; CPOD, etc.

Variáveis Qualitativas (ou categóricas)


É uma variável que assume como possíveis valores, atributos ou qualidades. Também são
denominadas variáveis categóricas. São características de uma população que não pode ser
medida. Podem ser:

Variáveis qualitativas nominais: é uma variável que assume como possíveis valores, atributos ou
qualidades e estes não apresentam uma ordem natural de ocorrência, são utilizados símbolos ou números
para representar determinado tipo de dado, mostrando assim, a qual grupo ou categoria pertencem Ex.:
sexo; meio de informação utilizado, cor do fruto, marca de um produto, local de residência, etc.

Variáveis qualitativas ordinais (ou por postos): é uma variável que assume como possíveis valores
atributos ou qualidades e estes apresentam uma ordem natural de ocorrência. Ex.: Padrão de uma casa,
estatura (alta, média, baixa), grau de instrução, opinião sobre um produto (ótimo, bom, médio, ruim), etc.,
quando uma classificação for dividida em categorias ordenadas, em graus convencionados, havendo uma
relação entre as categorias do tipo “maior que”, “menor que”, “igual a”. Os dados por postos consistem de
valores relativos atribuídos para denotar a ordem do primeiro, segundo, e assim sucessivamente.

Arredondamento dos dados


A Portaria 36 de 6 de agosto de 1965, do Instituto Nacional de Pesos e Medidas, adota uma série
de regras para o arredondamento de um dado:
Item 1: Quando o algarismo após aquele que vamos arredondar for 0, 1, 2, 3 ou 4,
conservamos o algarismo a ser arredondado e desprezamos os seguintes.

Ex.: 7,348 arredondar para décimos: 7,3


Item 2: Quando o primeiro algarismo após aquele que vamos arredondar for 6, 7, 8, 9 ou
5, este último seguido de um algarismo diferente de zero, aumentamos uma unidade no algarismo a ser
arredondado e desprezamos os seguintes.
Ex.: 1,2734 arredondar para décimos: 1,3
8,3502 arredondar para décimos: 8,4.
Item 3: Quando o primeiro algarismo após aquele que vamos arredondar for 5, seguido
apenas de zeros, conservamos o algarismo a ser arredondado se ele for par ou aumentamos em um
algarismo se ele for ímpar.
Ex.: 6,250 arredondar para décimos: 6,2
6,350 arredondar para décimos: 6,4
Item 4: Quando, ao arredondarmos uma série de parcelas, a soma correspondente fica
alterada, devemos fazer novo arredondamento (por falta ou por excesso) na maior parcela do conjunto, de
modo que a soma fique inalterada.
Bioestatística- Parte 1 Prof. Angela

Ex.: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100%, se arredondarmos as parcelas


para inteiros:
17% + 18% + 12% + 30% + 22% = 99%, como falta 1% na soma, este deve ser
acrescentado na maior parcela:
17% + 18% + 12% + 31% + 22% = 100%

Título
Os dados podem ser organizados em tabelas ou gráficos.

Cabeçalho
Tabela 1- Taxa de albumina (g/100ml) no plasma de 25 pacientes-HUSM-2010
Albumina Contagem f fr F Fr
(x)
4,5 | 1 (1/25)=0,04 1 (1/25)=0,04
4,6 0 0 1 (1/25)=0,04

4,7 || 2 (2/25)=0,08 3 (3/25)=0,12


4,8 | 1 0,04 4 0,16
C
4,9 ||| 3 0,12 7 0,28 O
5 |||| 5 0,2 12 0,48 R
5,1 ||||| 5 0,2 17 0,68 P
O
5,2 || 2 0,08 19 0,76
5,3 ||| 3 0,12 22 0,88
5,4 || 2 0,08 24 0,96
5,5 | 1 0,04 25 1
Soma 25 1

Fonte: Dados Hipotéticos

Rodapé

Onde:
f ou fi ⇒ freqüência simples ou absoluta (número de vezes em que o dado aparece)
fr ou fir ⇒ freqüência relativa (relação entre o número de vezes em que o dado aparece e o total de
dados) ⇒ Quando expresso em porcentagem(%) sua simbologia é fr(%) ou fir(%)

F ou Fi ⇒ freqüência acumulada
Fr ou Fir ⇒ freqüência acumulada (relação entre a freqüência acumulada e o total de dados)
⇒ Quando expresso em porcentagem(%) sua simbologia é Fr(%) ou Fir(%)
Bioestatística- Parte 1 Prof. Angela

Obs.: O QUADRO DIFERE DA TABELA POR TER AS LATERAIS FECHADAS!!!

Título Cabeçalho
Deve responder a três perguntas: Indica a natureza do conteúdo de cada coluna
- o quê? Assunto a ser representado.
- onde? Lugar onde ocorreu o fenômeno.
- quando? A época em que ocorreu o fenômeno.
Corpo Rodapé
Composta por linhas e colunas Espaço aproveitado abaixo da tabela, onde são
colocados detalhes do conteúdo da tabela de
natureza informativo (fonte, notas de observações)

Representação Gráfica para variáveis quantitativas

Histograma para a Taxa de albumina (g/100ml) no plasma de 25 pacientes-HUSM-2010

H i st ogr a m a

0
0
4,5 4,5.
4,7 4,7.
4,9 4,9.
5,1 5,1. 5,3 5,3.
5,5 5,5.
5,7 5,7.

Classes
C l asse s

Fonte: Dados Hipotéticos

Polígono de freqüência para a Taxa de albumina (g/100ml) no


plasma de 25 pacientes- HUSM-2010
Bioestatística- Parte 1 Prof. Angela

1 0 ,0 0

f
8 ,00

6 ,00

4 ,0 0

2 ,0 0

0 ,00
xi
,0 0 4 ,5 9 4 ,7 6 4,9 3 5,1 0 5 ,2 7 5 ,4 4 ,0 0

Fonte: Dados Hipotéticos


Para distribuição de freq. Discreta
Gráfico 2.3- Taxa de albumina (g/100ml) no plasma de 25 pacientes- HCPA-2006

f 6

0
1 2 3 4 5 6 7 8 9 10 11 Li

Fonte: Dados Hipotéticos


Bioestatística- Parte 1 Prof. Angela

Para variáveis categóricas

Gráfico de Colunas

Gráfico 3- Gênero de alguns acadêmicos do Curso de Odontologia-UFSM-2010

f
40
35
35
30 27
25
20
15
10
5
0
Feminino Masculino gênero

Fonte: Dados Hipotéticos

Gráfico de barras simples

Gráfico 4- Gênero de alguns acadêmicos do Curso de Odontologia-UFSM- 2010

gênero

Masculino 27

Feminino 35

0 5 10 15 20 25 30 35 40

Fonte: Dados Hipotéticos f


Bioestatística- Parte 1 Prof. Angela

Gráfico de Setores

Gráfico 5- Gênero de alguns acadêmicos do Curso de Odontologia-UFSM- 2010

44% Feminino

56% Masculino

Fonte: Dados Hipotéticos

Gráfico de colunas justapostas

Gráfico 6- Dentes restaurados ou perdidos segundo Gênero de 50 arcadas superiores de acadêmicos da


UFSM- 2010

f 30
24
25

20
Feminino
15 12 Masculino
10 8
5
5

0
Dentes restaurados Dentes Perdidos

Fonte: Dados Hipotéticos


Situação
Gráfico de barras comparativas

Gráfico 7- Dentes restaurados ou perdidos segundo Gênero de 50 arcadas superiores de acadêmicos da


UFRGS- 2006
Bioestatística- Parte 1 Prof. Angela

Situação
Dentes 8
Perdidos 5

Masculino
Feminino
24
Dentes
restaurados
12

0 5 10 15 20 25 30 f

Fonte: Dados Hipotéticos

Gráfico de colunas sobrepostas

Gráfico 8- Dentes restaurados ou perdidos segundo Gênero de 50 acadêmicos da UFSM- 2010

f
40
35
30
24
25 Masculino
20 Feminino
15
8
10 12
5 5
0 Situação
Dentes restaurados Dentes Perdidos

Fonte: Dados Hipotéticos


Medidas de Posição

Estas medidas possibilitam representar um conjunto de dados de forma resumida, as medidas de


posição mais importantes são as de tendência central, pois agrupam as dados observados em torno
de valores centrais.
Bioestatística- Parte 1 Prof. Angela

MEDIDAS DE TENDÊNCIA CENTRAL

As medidas de tendência central são os valores típicos ou representativos de um conjunto de


dados, ou seja, são valores no centro ou no meio de um conjunto de dados. São usadas para indicar um
valor que tende a tipificar, ou a representar melhor, um conjunto de números.

 MÉDIA
Χ

A média aritmética é, de modo geral, a mais importante de todas as mensurações numéricas


descritivas, pois é o ponto de equilíbrio do conjunto de dados. A média aritmética de um conjunto de
valores é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores.

∑x
i =1
i
∑x
x= ou simplesmente x =
n n

n
OBS: x lê-se X barra e significa média. ∑x
i =1
i lê-se somatório de xi, i variando de 1 a n.

∑x
i =1
i = x1 + x 2 + ... + x n

Ex: Relacionam-se a seguir os tempos (em anos. Calcular a média desta amostra.
10 29 26 28 15 23 17 25 0 20

x=
∑x =
n
A média é:

A média tem certas propriedades interessantes e úteis, que explicam por que é ela a medida de
tendência central mais usada:
1. A média de um conjunto de números pode sempre ser calculada;
2. Para um dado conjunto de números, a média é única;
3. A média é sensível a ( ou afetada por) todos os valores do conjunto. Assim, se um valor se modifica,
a média também se modifica;
Bioestatística- Parte 1 Prof. Angela

4. Somando-se uma constante a cada valor do conjunto, a média ficará aumentada do valor dessa
constante. Assim, somando-se 4,5 a cada valor de um conjunto , a média ficará aumentada de 4,5.
Analogamente, subtraindo-se cada valor do conjunto uma constante, ou multiplicando-se ou
dividindo-se por ela cada valor do conjunto, a média fica reduzida dessa constante, ou multiplicada
ou dividida por ela;

Cálculo da média para uma distribuição de frequência

A média de uma distribuição de freqüência é calculada com base valor e na freqüência de cada
classe.

x=
∑x i fi
n

onde fi é a freqüência da classe i.


Para dados com perda da informação, utiliza-se em lugar de xi o ponto médio do intervalo.

 MEDIANA

A mediana de um conjunto de valores é o valor do meio desse conjunto, quando os valores estão
dispostos em ordem crescente (ou decrescente). Para calcular a mediana, dispor primeiro os valores em
ordem (crescente ou decrescente) e em seguida aplicar um dos dois processos a seguir:
1. Se o número de valores é ímpar, a mediana é o número localizado exatamente no meio da
lista;
Ex: 10 15 26 28 29

2. Se o número de valores é par, a mediana é a média dos dois valores do meio.


Ex: 500 500 600 800 1000 50000

Mediana = (800 + 600)/2 = 700


 MODA

A moda de um conjunto de dados é o valor que ocorre com maior frequência. Quando dois
valores ocorrem com a mesma frequência máxima, cada um deles é uma moda, e o conjunto se diz
bimodal. Se dois valores ocorrem com a mesma frequência máxima, é chamado de bimodal, se forem 3
valores, é chamado de trimodal e se no caso forem 4 ou mais, então é plurimodal. Quando nenhum valor é
repetido, o conjunto não tem moda, é chamado de amodal.
Bioestatística- Parte 1 Prof. Angela

RELAÇÃO ENTRE AS MEDIDAS DE TENDÊNCIA CENTRAL

Para as curvas de freqüência unimodal moderadamente inclinadas (assimétricas) vigora a relação


empírica

Moda
Moda
Mediana Moda
Mediana
Média Mediana
Média
Média

COMPARAÇÃO ENTRE MÉDIA, MEDIANA E MODA


Definição Vantagens Limitações
Média ∑x Reflete cada valor, possui propriedades É influenciada por valores extremos
x=
n matemáticas atraentes
Mediana Metade dos valores são Menos sensível a valores extremos do É difícil de determinar para grande
maiores, metade menores que a média quantidade de dados
Moda Valor mais freqüente Valor “típico”:maior quantidade de Não se presta a análise matemática,
valores concentrados neste ponto pode não ser moda para certos
conjuntos de dados

MEDIDAS DE VARIABILIDADE

As medidas de variabilidade descrevem um grupo de valores em termos de variabilidade


existente entre os itens incluídos dentro do grupo. A variação se refere a quanto os valores podem diferir
entre si e pode ser medida por números específicos. Os números relativamente próximos uns dos outros
têm baixas medidas de variação, enquanto os valores mais dispersos têm maior medida de variação.

As medidas de variabilidade ou dispersão indicam se os valores estão relativamente próximos ou não uns
dos outros. Na análise de um conjunto de dados é necessário que sejam observados tanto as informações
relativas à localização (medidas de tendência central) quanto as informações de dispersão (medidas de
variabilidade).

Ex:
Pequena variabilidade

Grande variabilidade
Bioestatística- Parte 1 Prof. Angela

Supor que duas máquinas ensacadoras diferentes ensaquem em média 10 Kg de cereal mas que
em um dos casos todos os sacos estejam dentro de uma margem de 0,10 Kg deste peso, enquanto no outro
caso os pesos possam variar até 1Kg em uma ou outra direção. Medir a variabilidade, neste caso, é tão
importante como media o valor médio.

Algumas são as formas de medir a variação, sendo elas as quatro medidas de dispersão:
amplitude, variância, desvio padrão e coeficiente de variação. Todas elas, exceto a amplitude, têm na
média o ponto de referência. Em cada caso, o valor zero indica ausência de variação; a dispersão aumenta
à proporção que aumenta o valor da medida (intervalo, variância, etc.).

 AMPLITUDE

Também conhecida como intervalo. A amplitude de um grupo de dados é, de modo geral, mais
simples de calcular e de entender. Consiste na diferença entre o maior e o menor valor, ou seja, entre os
valores extremos. É dada pela fórmula:

Amplitude = Xmax - X mín

A maior limitação da amplitude é o fato de só levar em conta os valores extremos de um


conjunto, nada informado sobre os outros valores, não sendo tão bom quanto as outras medidas de
variação que levam em conta todos os valores.

OBS.:Para dados agrupados em uma distribuição de freqüência, a amplitude total é geralmente definida
como a diferença entre a fronteira superior da classe mais alta e a fronteira inferior da classe mais baixa.
. Variância: (σ2 para a população e S2 para a amostra)
A variância é uma medida de variabilidade dos dados em torno da média. A princípio
poderíamos pensar em quantificar os desvios de cada observação em relação à média:

xi – x = di

E a forma natural seria considerar a soma de todos estes desvios. A idéia seria de quanto maiores
fossem os desvios, maior seria a variabilidade presente nos dados. Entretanto pela definição de média,

n −
∑ ( xi − x ) = 0
i =1

Para qualquer conjunto de dados.


Bioestatística- Parte 1 Prof. Angela

Portanto, uma alternativa seria elevar os desvios de cada observação em relação à média, ao
quadrado, isto é, a quantidade a ser calculada seria:

n −
∑ (x i − x) 2
i =1

Dessa forma, adicionamos somente valores positivos. Torna-se necessário considerar o número
de observações, pois, à medida que forem acrescentadas observações, o valor deste somatório também
será aumentado. Uma idéia seria considerar a média, isto é,


n
( xi − x ) 2

i =1 n

Em palavras, a variância é uma média dos desvios ao quadrado das observações em relação à
média.

Para dados não agrupados temos:

n −
∑ ( xi − x) 2
S2 = i =1
; amostra
n −1
n −
∑ (x i − x) 2
σ2 = i =1
; utiliza-se n, população
n

Logo,

A variância de uma amostra é uma medida de variabilidade dos dados em torno da média.

( x1 − x ) 2 + ( x 2 − x ) 2 + ... + ( x n − x ) 2
Variância = S 2 =
n −1
n (x − x)2
S2 = ∑ in − 1
i =1

2.2.3. Desvio Padrão


Note que a unidade de medida da variância é a unidade de medida das observações ao quadrado. Por
exemplo, se as observações forem medidas em cm, a unidade da variância será cm2, logo, para obtermos
uma medida de variabilidade com a mesma unidade dos dados, extraímos a raiz quadrada. Esta medida é
denominada desvio padrão e é dada por:
Bioestatística- Parte 1 Prof. Angela

É a raiz quadrada da variância, sua unidade é a mesma dos dados observados.


Para os dados não agrupados

População Amostra

n − n −
∑ ( xi − x ) 2
i =1
∑ (x
i =1
i − x) 2
σ= ; S= ;
n n −1

2.2.4. Coeficiente de Variação (CV)

- é uma medida de dispersão relativa s


CV = × 100%
- elimina o efeito da magnitude dos dados x
- exprime a variabilidade em relação à média
Ex.:
Altura e peso de alunos do Curso de Farmácia-UFSM- 2010

Média Desvio-padrão Coeficiente de


variação
Altura(m) 1,143 0,063 5,5%
Peso(Kg) 50 6 12%
Fonte: Dados Hipotéticos

CONCLUSÃO: Os alunos são, aproximadamente, duas vezes mais dispersos quanto ao peso do que
quanto à altura.

Você também pode gostar