Você está na página 1de 42

Carol Andrade – Medicina

Bioestatística – Conceitos Básicos


BASES CIENTÍFICAS CUIDADO!

 Fornecer subsídios teóricos para que possam realizar as análises exploratórias  Os métodos estatísticos trabalham com uma margem de erro associada à
de dados, determinar probabilidades de ocorrência de eventos, realizar conclusão, é entender porque deu errado.

inferências populacionais, determinar modelos estatísticos para dados  Assim como se mente com as palavras, com os números pode ser feito o

experimentais e tomar decisões estatísticas. mesmo;

 Aprimorar os conhecimentos necessários à interpretação de dados estatísticos  Ruim com a estatística e pior sem ela.
da área da saúde. 

 O conjunto de métodos estatísticos usados no tratamento da variabilidade e POR QUE ESTUDAR ESTATÍSTICA?

nas ciências médicas e biológicas.  Números são mais precisos que palavras em conclusões científicas;

 A bioestatística fornece métodos para se tomarem decisões ótimas na  Dados sem tratamento são apenas dados;

presença de incerteza, estabelecendo faixas de confiança para a eficácia de  É necessário transformar dados obtidos pelo método científico em

tratamentos e verificando a influência de fatores de risco no aparecimento de conhecimento;

doenças.  Extremamente útil na organização e interpretação de dados;

 BIOESTATÍSTICA é a ciência que consiste a orientar na coleta, manipulação,

no resumo, na classificação, na analise e na interpretação dos dados sobre o PERGUNTAS

fenômeno.  Os resultados podem vir do acaso?

 Auxilia e/ou é Preponderante para a seleção de objetos de pesquisa para  O tratamento foi eficiente?

outras etapas Bioestatística.  O método de seleção dos indivíduos foi adequado?

 Não conduz o conhecimento apenas em pesquisas, mas também no dia a dia.


 Conhecimento gerado a partir de: APLICAÇÃO NA SAÚDE

o Observação;  No planejamento ↝ determinação da quantidade de indivíduos;

o Experimentação.  Na análise ↝ técnicas para resumir e apresentar informações e compare

situações.
Carol Andrade – Medicina

 Conclusões ↝ generalizar informações. Entre as duas não existe a melhor ou a pior, mas sim a bem feita e mal feita.

 A base para elaboração de protocolos; Exemplo: amostra de sangue – estatística inferencial que usa dados de uma
 Decisões na área de saúde se baseiam em evidências;
estatística descritiva.
 Indicador para alguns diagnósticos;
 Definição de políticas em saúde preventiva;
POPULAÇÃO OU UNIVERSO: Todo conjunto de unidades que apresenta(m)
 Indicador de doenças de cunho hereditário;
característica em comum, pode ser qualquer objeto. Vai de acordo com o objetivo
 Indicador de mudanças de procedimento para avaliação do paciente.
da pesquisa e dos critérios de inclusão e exclusão

Exemplo: Universitários; veículos.


TIPOS DE ESTATÍSTICAS
 ESTATÍSTICA DESCRITIVA: ramo da estatística que aplica várias técnicas para Censo.

descrever e sumarizar um conjunto de dados; dar a informação que discorre É importante entender para quem a pesquisa esta sendo direcionada;

um determinado momento. Ou seja, direcionada a coleta, o resumo e a A população estudada depende do objetivo da pesquisa.
apresentação de dados populacionais a partir da utilização de gráficos e  POPULAÇÃO GEOGRÁFICA: toda população geral.
tabelas.  POPULAÇÃO ESTATÍSTICA: segue o objetivo da pesquisa.
Exemplo: Quantas pessoas cursam curso superior.

AMOSTRA: É qualquer fração de uma população. Deve ser representativa da


Média, Tabelas, Gráficos;
população de origem; parte da população. Qualquer fração da população; é
Fotografia de uma realidade ↝ O que acontece se a câmera não estiver adequada ou
preciso saber o todo.
com o foco correto?
O tamanho de a amostra estar relacionada com o tamanho da população.
 ESTATÍSTICA INFERENCIAL (INDUTIVA): Quando tiramos conclusões ou

generalizações de uma população através de uma amostra; generalização –


PARÂMETRO: É um valor que resume, na população, a informação relativa a uma
pegar uma amostra e dizer que tudo se baseia naquela informação. Muito
variável; São difíceis de obter, pois necessita do estudo de toda a população.
utilizada nos estudos de hipóteses cientificas e também nas decisões a partir

da interpretação de um conjunto de dados amostrais retirados de uma


ESTATÍSTICA: É uma quantidade, baseada nos elementos da amostra.
população.
Carol Andrade – Medicina

Exemplo: Média ou porcentagem da amostra. as medições necessárias. Não faz uma interferência; Objetiva; Não tem intuito,

mas pode interferir.

Exemplo: Levantamento de mercado, entrevistas;

Determinar o estado nutricional de certa população;

Correlacionar (se há diferença na P.A. de ex-fumantes, fumantes e não

fumantes).

PERÍODO DE SEGUIMENTO DO ESTUDO

o PERÍODO TRANSVERSAL (seccional, cross sectional): Os estudos


UNIDADE EXPERIMENTAL E UNIDADE DE OBSERVAÇÃO
transversais descrevem uma situação ou fenômeno em um momento não
É a menor parte que fornece uma informação.
definido.
 UNIDADE EXPERIMENTA: Experimentos controlados onde o pesquisador Estudos transversais são aqueles em que grupos de indivíduos são observados
deliberadamente influencia os indivíduos (tratamento) e pesquisa o efeito da uma única vez, com a intenção de estudar a situação naquele instante;
intervenção; Quando o pesquisador quer fazer uma mudança por sua vontade. Pesquisa transversal é quando você faz um recorte temporal em um único
Necessidade do controle. período de tempo – indeterminado. Difere da pesquisa que você vai fazer
Exemplo: Avaliar uma nova dieta sobre a rapidez em aumentar os níveis de cálcio; depois, pois é uma pesquisa RETRATO daquele momento – você escolhe o

Controle Mudança na dieta de um paciente. momento, mas ele é único. Tipo de pesquisa mais barata.

Exemplo: Estudos ecológicos – Abordam áreas geográficas e populações bem


o Grupo Controle: Para que você consiga comparar um grupo aletrado com um

grupo normal é necessário que você tenha um grupo controle que não tenha definidas. Base territorial (bairros, cidades) ou institucional (centros de saúde,
sofrido intervenção. fábricas).
 UNIDADE DE OBSERVAÇÃO: Registra o que ocorre sem interferir no fenômeno o PERÍODO LONGITUDINAL: Destinam-se a estudar um processo ao longo do
que vai estudar. O pesquisador coleta a informação sobre os atributos ou faz tempo para investigar mudanças.
Carol Andrade – Medicina

Exemplo: Ensaios clínicos estudam o efeito de um fator, comparando medições  RETROSPECTIVO: (estudo histórico): Realiza-se o estudo a partir de registros

do passado, e é seguido adiante a partir daquele momento até o presente são


efetuadas em, pelo menos, duas oportunidades.
utilizados quando se conhece o efeito de algum fator, sendo os dados
Analise em dois momentos; reação de causa e efeito. Investiga um processo ao
referentes a eventos passados.
longo do tempo; Consegue medir o antes e o depois. FILME.
Exemplo: Fatores que causam Câncer - Prontuários.
Os estudos longitudinais podem ser:

 PROSPECTIVO: (estudo contemporâneo); Monta-se o estudo no presente, e o  Volta para o passado para saber a causa (Efeito ↝ Causa). Necessidade de uma

mesmo é seguido para o futuro. anamnese, prontuário.

Presente ↝ Futuro (efeito ↝ causa).  Caso-controle: compara um grupo de doentes (casos) e um grupo de pessoas

 Monta-se o estudo no presente, e o mesmo é seguido para o futuro. São não doentes (controles).

utilizados quando se pretende conhecer o efeito de algum fator, sendo os O objetivo é verificar se os casos diferem significantemente dos controles em

dados gerados a partir do início do estudo. relação à exposição de um dado fator de risco.

Exemplo: Induzir a dor; Mudança de uma dieta. DOENÇA ↝ CAUSA/EXPOSIÇÃO

 Coorte: comparação entre um grupo exposto a um fator de risco e outro

grupo não exposto. Visa verificar se indivíduos expostos ao fator de risco

desenvolvem a doença em questão, em maior ou menor proporção, do que


um grupo de indivíduos não expostos.

CAUSA/EXPOSIÇÃO ↝ DOENÇA

 Um estudo longitudinal ou transversal não depende diretamente do período


temporal coberto pelas investigações.

Cuidado! Um estudo dos efeitos de um anestésico novo é considerado

longitudinal mesmo se o período de observação for de apenas de 15 minutos.

Um estudo da prevalência do uso de filtros de proteção solar para a prevenção de

câncer é transversal, apesar de durar meses.


Carol Andrade – Medicina

 Podemos ter um estudo, por exemplo, longitudinal experimental prospectivo b) Quantitativa CONTÍNUA: os valores formam um intervalo ou união de

ou um estudo longitudinal observacional retrospectivo. números reais. Quando faz sentido fracionar, ou seja, utilizar vírgulas.

Ex: Peso - Pressão sistólica; Nível de glicose; altura; pessoas por m .


2

DADO: são as informações (numéricas ou não) obtidas de uma unidade ou


Obs: “A distinção entre variáveis contínuas e discretas, e até qualitativas,
caracterizam a unidade, e toda a unidade tem um identificador.

Exemplo: José, sexo masculino, 25 anos e fumante. depende da aproximação (precisão) utilizada”.

Ex: idade (variável de medida de tempo), portanto, é uma variável


Obs: Nem todos os números têm repercussão matemática e sim uma representação

ou identificador. Ex: CPF quantitativa contínua.

Se levarmos em considerarmos anos completos é quantitativa discreta

(“discretização”).
TIPOS DE VARIÁVEIS:
Se usarmos faixas etárias (0 a 5 anos, ou adolescentes, adultos, idosos) é
VARIÁVEL: toda característica que pode variar de uma unidade para outra. É a
qualitativa ordinal.
característica de interesse que é medida em cada elemento da amostra ou
2. QUALITATIVA: São aquelas que se baseiam em qualidades e não podem
população.
ser mensuradas numericamente. Uma variável é qualitativa quando seus
Exemplo: Nome – Sexo – Idade – Nível de Hemoglobina (g/dL).
possíveis valores são categorias. É um adjetivo, são características sobre a

Pode ser: unidade.

1. QUANTITATIVAS: Valores numéricos que expressam quantidade. Quantos Ex: Gênero; Classe social; Gradação de cor. Cor vermelha: quando eu digo que

têm de algo.
a cor é vermelha, eu só posso dizer que é vermelho, não coloco mais detalhes,
Exemplo: Estatura – Nível sérico de cálcio – Idade
não tendo assim como diferenciar e colocar em ordem.
a) Quantitativa DISCRETA: quando não tem lógica fracionar, ou seja, Obs: podem ser codificadas ↝ Muitas vezes atribuímos números para qualificar.
quando não podemos colocar vírgulas. Conjunto de resultados
Ex: 1 para bom – 2 para médio.
possíveis pode ser finito ou enumerável. (Números inteiros)

Ex: Nascidos vivos – Número de células – Abortos.


Carol Andrade – Medicina

a) Nominal: São aquelas que não podem ser hierarquizadas ou discreta ou contínua ou qualitativa ordinal ou nominal dependendo de como você

ordenadas. esta apresentando o caso.

i. Binomiais: Masculino ou feminino; Sim ou não; verdadeiro ou Podemos utilizar codificações


falso.
Interação biológica x interação estatística
ii. Polinomiais: Tipo sanguíneo (A/B/AB/O); gênero.
 Possíveis causas de uma interação (estatística) observadas:
a) Ordinal: São aquelas que podem ser colocadas em ordem. o Erros aleatórios;
Ex: Classe social – Variação colorimétrica ↝ vermelho claro, vermelho escuro ↝ o Fatores de confusão em uma única estratificação;
o Medidas de erro em um único estrato;
podemos colocar em ordem da mais clara para a mais escura. o A dose (nível de exposição) pode ser maior em um estrato do que
Qualitativa nominal binominal: Só classificamos em 2. em outro.
 Interação biológica:
Qualitativa nominal polinominal/categórica: + de dois.
o Compatível com os mecanismos fisiopatológicos conhecidos;
Qualitativa ordinal: classe, nível, grau. o Condizente com mecanismos postulados;
Peculiaridade: tempo de modo geral ↝ é um tipo de quantitativa contínua o Novos achados que podem fornecer indícios importantes para
mecanismos causais desconhecidos.
quando levamos em consideração os anos e meses incompletos, mas se levarmos
em consideração os

Anos e meses completos ela se torna quantitativa discreta, tendo assim, uma
discretização da situação.

Exemplo: prontuário que tem escrito anos completos, nesse caso ele é uma

quantitativa discreta, porém, você pode transformar a quantitativa discreta em

qualitativa ordinal ↝ quando no local da idade você coloca se é jovem,

adolescente, criança, adulto, idoso, com isso, percebemos que para ser quantitativa

Trabalho Estatístico
FASES DO TRABALHO ESTATÍSTICO: DEFINIÇÃO DO PROBLEMA: algo que você deseja ter resposta. É necessário:
o Formular corretamente o problema a ser estudado;
o Revisão sobre o objeto de estudo: revisar se tem algum sentido.
Carol Andrade – Medicina

o Observações próprias ou outros estudos; o Secundário: Quando o investigador para verificar as sua hipóteses de
o Estabelecer perguntas. trabalho utiliza- se de dados já existentes, arquivados, registrados ou
Ex: O efeito da droga “x” aumenta com a dose testada? publicados.
Baixo custo.
Pessoas com Diabetes do tipo I vivem mais que as com tipo II?
Fonte Primária Secundária
A frequência do nível de bilirrubina alta em recém-nascidos estão dentro do Detalhamento com Baixo, ou nenhum custo de
esperado? Vantagens respeito ao interesse da obtenção.
 DEFINIÇÃO DO OBJETIVO: pesquisa.
Alto custo de obtenção Dificuldade em encontrar
o Definir exatamente os objetivos do estudo
Desvantagens e planejamento. dados que respondam o
o Sempre são alcançados? Você tem que ter consciência que podem ter problema.
objetivos que não vão ser alcançados;
o Estabelecer os objetivos antes da coleta dos dados
Obs: Não é o objetivo, mas sim quem realmente coletou.
Objetivo: pode afirmar a pergunta que você fez.
Fontes de dados: Vai da menor precisão para a maior precisão e do menor custo para
Ex: avaliar o efeito da droga com o aumento da dose.
 PLANEJAMENTO: -
o maior custo.
Dados de registro -
o Como e quando vai fazer/resolver o problema; Questionário de autopreenchimento
o Determinar o procedimento que vai ser realizado; QUALIDADE Entrevistas por telefone CUSTO
o Quais os dados deverão ser coletados Entrevistas pessoais
o Censo ou amostra?
o É ou não viável?
+ Exame físico
Testes médicos, Medidas ambientais.
+
 COLETA DE DADOS: Críticas:
o Primária: O pesquisador vai coletar de forma direta, como por o Verificar os dados coletados;
exemplo, um prontuário. o Evitar erros que afetariam os resultados;
 Quando o investigador não encontra dados publicados o Perguntas mal compreendidas, omissões, trocas de respostas, etc.
adequados ao seu estudo, parte para a realização de um o Existem dois tipos de criticas:
inquérito, isto é, os dados são levantados diretamente na 1. Críticas externas: Corrigir imperfeições ↝ alguém não entendeu uma
população ou amostra no momento da investigação. informação.
 O pesquisador coleta os dados; Detalhamento da informação; 2. Crítica interna: Verificar a exatidão das informações ↝ algo não está
Alto custo de obtenção e planejamento. certo.
 Tem que passar pelo comitê de ética.
 ARMAZENAMENTO DOS DADOS
o Tabulação dos dados
Carol Andrade – Medicina

o Armazenamento ↝ pode ser em: Mapas, Tabelas, Mídias digitais, online.

 INTERPRETAÇÃO DOS DADOS


o Tirar conclusões: se deu errado você interpreta como algo positivo, pois
pode ser feito de outro modo.
o Calcular medidas que resumem os dados e auxiliam a responder um
problema.
Obs:

 Quando criamos perguntas elas vão servir para nortear, ou seja, para que você
não fuja do tema. Ajuda a estabelecer os objetivos, serve também para você
saber a população que vai ser estudada, o teste estatístico.
 Os objetivos devem começar com verbos no infinitivo.
 Erros no trabalho estatístico: existem dois tipos:
o Erros grosseiros: erros que podem ser evitados;
o Erros sistemáticos: erros que não podem ser evitados.

Exemplos:

 O efeito da droga “x” aumenta com a dose estabelecida? (rs=0,47; p>0,40)


 Pessoas com Diabetes do tipo I vivem mais que as com tipo II?
Diabetes N Média (anos)
Tipo I 98 52,7ª
Tipo II 95 63,2ª
Médias indicadas pela mesma letra não diferem significadamente entre si pelo teste de Tukey
(alfa = 5%).

Amostra e amostragem
 O QUE É AMOSTRA (N)? São subconjuntos representativos de uma população ou universo (N) ↝ conjunto

de elementos que possuem algumas características em comum. Indivíduos foram


Carol Andrade – Medicina

randomicamente selecionados para serem estudados como representantes de uma ser parcelas de área fixa, de área variável ou unidades amostrais não-
população. superficiais, como pontos e linhas amostrais.

 POR QUE REALIZAR UMA AMOSTRA?  Selecionar a amostra, após ser decidido qual deve ser o respectivo tamanho.

o Mais fácil, menos tempo, menor custo.  Populações heterogêneas ↝ mais pessoas entrevistadas;

o A população pode ter dimensão infinita;  Menor precisão ↝ Maior tamanho da amostra para poder ter um maior

o Melhor detalhamento ↝ maior atenção; detalhamento;

o O estudo da população pode levar a destruição ↝ as pessoas podem não  Para entender a diversidade dos dados é necessário que tenha mais

querer participar do estudo; indivíduos;

o Inacessibilidade dos elementos.  Variáveis qualitativas nos traz a necessidade de ter uma amostra maior que a

 Em uma população seria quase que impossível chegar ao final. quantitativa, pois apresenta maior chance de diversidade.

 É encima do objetivo do trabalho que conseguimos chegar à resposta.  Mais eficaz se você fizer uma entrevista cara a cara; quanto mais preciso for o

seu instrumento de medida = menos será a quantidade de entrevistados.

 PARA REALIZAR A AMOSTRA É NECESSÁRIO:  É necessário testar o questionário antes.

o Explicitar os objetivos ↝ evitando dúvidas; Obs: Por conta da sua natureza estatística, o tamanho da amostra é muito
o Definir a população a ser amostrada;
importante para a pesquisa quantitativa e deve ser definido com bastante cuidado.
o Escolher variáveis para serem estudadas;
Isso porque a pesquisa quantitativa gera métricas precisas que se baseiam em uma
o Especificar o grau de precisão desejado;
amostra determinada ↝ podem, inclusive, ser replicadas para o universo estudado
o Escolher os instrumentos de medida e a forma de abordagem;
como um todo.
o Escolher a unidade amostral ↝ a menor parte distinta e identificável da
 COMO VOCÊ ESTABELECE UMA AMOSTRA?
população;
o Ser suficientemente grande ↝ representativa;
o Executar a prova experimental ↝ verificar potenciais erros.
Suficiente grande = entrevista maior quantidade que o tamanho amostrado
Unidade amostral: Unidade na qual são observadas e medidas as caracterí-
ideal.
sticas quantitativas e qualitativas da população. A amostra é composta
pelo conjunto de unidades amostrais. Cada unidade amostral gera uma
única observação da variável de interesse. As unidades amostrais podem
Carol Andrade – Medicina

o Escolhas ao acaso ↝ todos os componentes tem a mesma chance de ser o Erro: reação inversa com o tamanho da amostra.

escolhido e de modo independente; Fazer escolha ao acaso, pois tem  À medida que quisermos algo mais confiável = precisamos de uma amostra

subjetividade, ou seja, evitando a parcialidade na hora da escolha. maior;

Softwares; Sites; Tabelas de números aleatórios...  Quanto maior o tamanho da população, maior é o tamanho da amostra, mas
não é porque a população dobra que temos a necessidade de dobrar, pois as

 CÁLCULO DO TAMANHO DA AMOSTRA características vão se repetindo ↝ nem sempre quando a população aumenta

 Qual o tamanho ideal? a amostra precisa aumentar.

o Depende: Fórmula: n = número de indivíduos na amostra


Z = Valor crítico que corresponde ao grau de confiança desejado –
 Tamanho da população-alvo: quanto ao número de elementos
normalmente é 95% (a gente que escolhe)
que a compõe, pode-se classificar em finitas e infinitas. p= proporção que esperamos encontrar ↝ substituir por 0,5.

 Do tipo de problema: Caracterizar uma variável ainda não e = Margem de erro ou erro máximo de estimativa;
↝ Identifica a diferença máxima entre a média amostral e a
investigada na população; comparar duas populações; ver se
verdadeira média populacional.
duas variáveis estão associadas; teremos algumas situações
 Nível de consciência alto ↝ N alto;
que não temos referência para comparar.
 Margem de erro baixa ↝ amostra alta (n);
 Do tipo de variável: Qualitativas geralmente precisam de
 Erro amostral: diferença entre um resultado amostral e o verdadeiro resultado
amostras maiores.
populacional.
 Magnitude do erro aceito: temos a necessidade de errar
 Maior tamanho da amostra ↝ Menor erro amostral (inversamente
pouco, ou seja, precisamos de uma amostra maior; Nível de
proporcionais);
confiança.
 Não podemos evitar a ocorrência de erros amostrais.
 Do poder desejado para o teste, isto é, da probabilidade de
 O tamanho da amostra depende da sua necessidade;
que a amostra identifique uma diferença ou um efeito real.
 Confiança maior = amostra maior
 Do tempo, verba, mão de obra e dificuldade de obterem os
 Erro maior = amostra menor.
dados e da complexidade do experimento.
 Geralmente:
 Amostra maior = menor chance de erro.
o Margem de erro = 4/5%
Carol Andrade – Medicina

o Confiança = 95%  O ERRO AMOSTRAL e o TAMANHO DA AMOSTRA seguem sentidos contrários.

Tamanho da amostra
- +
Erro Amostral

População Erro amostral Nível de Distribuição da Resultado


confiança população  ERRO NÃO-AMOSTRAL: erros grosseiros, erros que poderíamos evitar.

1000 4 95% 50 376 Ocorrem erros não amostrais quando:


1000 6 95% 50 211 o Os dados amostrais são coletados, registrados ou analisados
1000 2 95% 50 707 incorretamente.
1000 2 99% 50 806 o Há uma utilização de um instrumento defeituoso durante a realização de

mensurações.
MAIOR erro = MENOR amostra o Um questionário ou formulário possui questões formuladas de modo
Menor erro = MAIOR amostra tendencioso.
MAIOR confiança = MAIOR amostra

De acordo com o nosso levantamento = 1000 pessoas; só tínhamos dinheiro para


AMOSTRAGEM: é o processo de obtenção de uma amostra em uma
200, ou seja, o erro vai aumentar porem você continua com a pesquisa identifica a
determinada base da população, são as técnicas.
porcentagem de erro = mesmo sendo maior.
Parte da estatística que estuda as técnicas de coleta de amostras.

Desenvolvida por meio de procedimentos de amostragem.


 Uma amostra não representa perfeitamente uma população, pois há uma
Tipo de amostragem:
margem de erro que denominaremos ERRO AMOSTRAL.
 PROBABILÍSTICA: quando cada unidade amostral na população tem uma
 ERRO AMOSTRAL: é a diferença entre um resultado amostral e o verdadeiro
probabilidade de pertencer à amostra. Baseada em indivíduos que foram
resultado populacional;
escolhidos por sorteio. Cada indivíduo tem probabilidade igual de pertencer a
 Não podemos evitar a ocorrência do ERRO AMOSTRAL;
um dos grupos selecionados para o estudo.
Carol Andrade – Medicina

o Objetivo: Garantir que procedimentos estatísticos possam ser de nesse). À medida que você entrevista uma pessoa = vai ter mais

empregados de modo a auxiliar o pesquisador a fazer interferências uma indicação – de acordo com o julgamento dos seus próprios

mais precisas a respeito da população estudada ↝ processo mais entrevistados.

confiável. Exemplo:

o A amostragem probabilística possibilita maiores interferências sobre a


Amostra por quota:
população estudada.
População com N = 480
o É considerada padrão ouro, pois garante que estatisticamente os
H = 200 (I = 40 * II = 60 * III = 100)
resultados do estudo possam ser generalizados para a população de
M = 280 (I = 80 * II = 80 * III = 120).
onde foi retirada, ou seja, quando cada unidade amostral na

população tem probabilidade de pertencer à amostra.


Não tenho tempo de entrevistar 480, vou entrevistar 120, ou seja,
 NÃO-PROBABILÍSTICA: quando a probabilidade não é conhecida. Fácil acesso;
com isso a amostra diminuiu 4x.
Não teve sorteio, foi por ordem de chegada/acessibilidade. Ou seja, os
H = 200/40 = 50. I = 40/10 = 4; II = 60/15 = 4; III = 100/25 = 4.
indivíduos não foram selecionados por sorteio.
o Tipos: M = 280/4 = 70. I = 80/20 = 4; 80/20 = 4; 120/30 = 4.

1. Amostra por conveniência: Seleção de indivíduos mais acessíveis.

Tempo, custo, acessibilidade – maior viés de seleção. Oportunista. EXTRA


2. Amostra por julgamento: Seleção de membros que julga ser  População e amostra: (das definições anteriores)
boas fontes de informação (precisa); Seleção de indivíduos através  População objetivo: é formada pelo conjunto de indivíduos (ou
de critérios da própria pessoa; você escolhe indivíduos de acordo elementos) que queremos abranger em nosso estudo e para os quais
desejamos que as conclusões da pesquisa. Os indivíduos da população
com seus próprios critérios; porem pode acarretar erros.
têm pelo menos uma característica em comum.
3. Amostra por quota: Seleciona um número predefinido de
 População amostral: conjunto de indivíduos da população que estão
indivíduos em cada uma das várias categorias ↝ Mais utilizada. de fato acessível para serem amostrados.
4. Amostra por bola de neve: após entrevistar um individuo o o Amostra: é a parcela da população amostral efetivamente
mesmo indica outro para pesquisa (pode ser duas pessoas novas selecionada para a realização do estudo, segundo um processo
ou que já foram indicados – fazendo com que acarrete uma bola de seleção adequado.
Carol Andrade – Medicina

o Parâmetro: é uma característica fixa e desconhecida da I. quarteirões;


população a qual se tem interesse em estudar. II. ruas (face dos quarteirões);
 Os parâmetros representam quantidades numéricas que podem ser III. departamentos;
interpretadas pelo pesquisador, como por exemplo: média; proporção; IV. prateleiras;
variação; taxa de crescimento; etc... V. caixas;
Exemplos: VI. lotes de produtos;
1. Proporção de crianças com a cobertura vacinal completa (estudo VII. etc...
PI);  Sistema de referência: é uma listagem completa de todos os
2. número de latrocínios em Minas Gerais, por região administrativa; unidades da população amostral (aptas a serem selecionadas na
3. percentual de intenção de votos para um candidato numa pesquisa amostra);
eleitoral;  Amostragem probabilística: é a pesquisa por amostragem realizada
4. tempo até a cura de pacientes submetidos a um novo tratamento segundo critérios bem definidos da teoria estatística das
ou a uma nova droga; probabilidades. Na amostragem probabilística todas as unidades da
5. medida do desempenho escolar de crianças expostas à violência população amostral devem ter a mesma probabilidade de serem
doméstica do pai contra a mãe. selecionadas.
 Estimativa: valor calculado a partir dos dados obtidos pela amostra
para se estimar o valor desconhecido do parâmetro.
Exemplo: média amostral, proporção amostral, variância amostral, etc...
 Unidade amostral: é o indivíduo (ou elemento) da população
amostral sobre o qual a medida de interesse será observada.
As unidades amostrais podem ser os próprios elementos da
população amostral ou podem ser formadas por grupos de elementos,
compondo o que será chamado de conglomerado.
Conglomerados podem ser formados por:

Procedimento de amostragem
SIMPLES OU RANDÔMICA OU CASUAL OU OCASIONAL: Atribui um número de  Só precisamos saber a quantidade de indivíduos, enumerar e realizar o sorteio.

ordem a cada unidade amostral. Com isso, a probabilidade de escolha é igual.

 Mais fácil de ser feita.


Carol Andrade – Medicina

 Este tipo de amostragem é mais utilizado quando a população for considerada Ex: Gênero, idade, classe social.
homogênea ↝ Serve para populações com características mais parecidas;
Diferença de por quota e estratificada: a por quota não faz um sorteio e a
 Dificuldade: população muito grande gastaria mais tempo, pois teríamos que
estratificada faz.
chegar em todos os indivíduos.

Ex: Urnas, Programas, Tabela aleatórias.

Como calcular?

ESTRATIFICADA: população é composta de subpopulações bem definidos e os 1. Subdividimos a população x em extratos.

estratos devem ser levados em consideração. N = 180

 Utilizada em uma população considerada heterogênea em relação ao atributo Homens (81) Mulheres (99)

Faixa 1 Faixa 2 Faixa 3 Faixa 1 Faixa 2 Faixa 3


que se quer pesquisar ↝ vai ocorrer mais variações.
 A variável de interesse apresenta diferentes comportamentos em cada um dos 33 27 21 51 27 21

estratos.

 Subdividimos a população em grupos, podendo levar em consideração (idade,


2. Vamos fazer uma amostra baseada na população:
gênero, classe social);
 Dividimos também cada faixa;
 Parecida com a por quota, mas difere, pois na estratificada realizamos sorteio.
 Para refletir a amostra com proporcionalidade.
 Muito eficiente; Boa qualidade.
N = 60 ↝ 180/60 = 3
 Mimetizamos a população.
Homens (81)/3 = 27 Mulheres (99) / 3 = 33
 Para estratificar uma população precisamos:
Faixa 1 Faixa 2 Faixa 3 Faixa 1 Faixa 2 Faixa 3
1. Verificar os estratos;
33/3 = 27/3 = 21/3 = 51 / 3 = 27 / 3 = 21 / 3 =
2. Calcular os tamanhos relativos (proporções); 11 9 7 17 9 7

3. Determinar o tamanho dos estratos;

4. Realizar o sorteio ↝ dentro do estrato ou dentro da população preenchendo SISTEMÁTICA: ordenação natural das unidades.
os espaços reservados para o estrato.
 Os elementos precisam estar em ordem.

 Não deve apresentar periocidade;


Carol Andrade – Medicina

 Mais indicado para populações homogêneas; 1-2-3-4-5-6-7-8-9-10-11-12-13-14-15-16-17-18-19-20-... 200

Ex: Prontuários, quarteirões, fila, prateleira. Obs: O 3 é o i. O segundo número vai ser = i + k; para saber o próximo numero

N/n = k você faz i + 2k e assim por diante.

k = intervalo de amostragem, sendo um número inteiro, faz-se então um sorteio;  O sorteio é feito sempre antes para ter mais qualidade;

Constante que dará uma sequencia aritmética da escolha dos indivíduos.  A quantidade dos sorteios é decidida através dos princípios da pesquisa.

N = população

n = amostra CONGLOMERADOS: População subdividida em plenos grupos.

Exemplo: Em uma clínica, composta de vários profissionais, são atendidos 40 Pode ser feito com populações homogêneas e heterogenias.

Ex: grupo de cada sala, corredor, prédio, curso.


pacientes por dia, totalizando 200 em uma semana com 5 dias úteis. O gerente quer

saber a opinião dos pacientes a respeito do atendimento da clínica em uma Como realizar?
determinada semana e fazer uma pesquisa por telefone para saber a opinião de 50
1. Identificar os conglomerados
destes pacientes.
2. Sorteio entre os conglomerados – o pesquisador pode criar os seus critérios.
 Não é homogamia, pois de segunda até sexta pode variar o
3. Analisar todos os indivíduos do conglomerado.
comportamento.
 O ideal é entrevistar pacientes de cada dia da semana. Exemplo: Bairro de uma cidade; quarteirão é um conglomerado; sorteio; analisa

 Seg/Terç/Quarta/Quinta/Sexta: Manhã = 20 e Tarde = 20 em cada dia


todas as casas do quarteirão sorteado.
1. Colocar em ordem: Organizamos pelo dia e pelo turno.
1 2 3 4 5 6
1-2-3-4-5-6-7-8-9-10-11-12-13-14-15-16-17-18-19-20-... 200 7 8 9 10 11 12
2. Calculamos o Valor de K 13 14 15 16 17 18

K = N/n – K = 200/50 – K = 4 19 20 21 22 23 24

3. Sorteio entre: 1, 2, 3, 4.

a. Resultado = 3 (entrar em contato com esse paciente);  Pode fazer uma amostragem baseada no mapeamento, pois pode ter um viés

4. Soma + 4 e vai entrevistando sempre somando mais 4. ↝ o sorteio pode ter interferido.
Carol Andrade – Medicina

Distribuição de frequência
 Distribuição e divisão; 1 2 3 4 7

 Organizar as informações que estão espalhadas, transformando elas em 1 2 3 4 8

informações de fácil visualização.

INFORMAÇÕES BAGUNÇADAS ↝ INFORMAÇÕES ORGANIZADAS. 3. FREQUÊNCIA simples ou absoluta (f ou fi): é a quantidade de vezes que um
mesmo valor de um dado é repetido.

1. DADOS BRUTOS: são os dados originais que ainda não foram numericamente Quantidade de vezes que algo apareceu.

organizados ↝ DADOS BAGUNÇADOS. Nº de filhos Frequência

Número de filhos = N = 25 O 3

2 1 1 3 4 1 5
2 5
3 4 7 8 2
3 4
0 5 5 2 1 4 3
0 0 3 4 6 5 2
6 1

2. ROL: é a ordenação dos valores obtidos em ordem crescente ou descrente de 7 1

grandeza numérica ou qualitativa ↝ DADOS ORGANIZADOS EM ORDEM. 8 1

0 1 2 3 5 INTERVALOS

 Intervalo aberto: quando o intervalo é só maior/menor que o número;


0 1 2 3 5
 Intervalo fechado: Quando o intervalo é igual ou menor/maior que o número.
0 1 2 4 6
Carol Andrade – Medicina

 Intervalo fechado e intervalo aberto: começam em 1 e chegam até próximo a


2. Ou seja, o 2 não vai participar, pois ele estar no intervalo aberto. Frequência = quantidade de filhos no intervalo – 8 = quantidades de filhos entre
 Intervalo aberto e fechado: o 1 não participa, pois estar no intervalo aberto, 0 e até 2.
0 |- 2 = inclusão do limite inferior (0) e exclusão do limite superior (2)
mas 2 participa pois estar no intervalo fechado.
Sugestão ↝ Número de classes = K = √n
 Intervalo aberto e aberto: os números depois de 1 e antes de 2 vão participar,
Como estabelecer?
o 1 e o 2 não vão pois estão no intervalo aberto.
o Critérios:
 Intervalo fechado e fechado: o 1 e o 2 participam, pois os dois estão no
1. Baseado na literatura (SEMPRE) = copia e cola classes de outro
intervalo fechado.
estudo. Vantagem: ganho de tempo; comparação.
Resumindo
2. Estudo novo: guia ↝ sugestão; fórmula = K = raiz de n.
1 |---| 2 Número maior ou igual a 1 e 3. Bom senso = o que você achar mais viável.
Intervalo fechado – fechado menor ou igual a 2.
Classes sempre com o mesmo tamanho = mesma amplitude.
↝ começa no 1 e acaba no 2. 1 e 2 participam do grupo.

1 |--- 2 Fechado – aberto ↝ começa 1 pertence ao grupo, mas o 2


AMPLITUDE DE UM INTERVALO DE CLASSE (hi): é a diferença entre o limite superior
no 1 e não chega no 2. não.
1 --- 2 Aberto – aberto ↝ começa e inferior de uma classe.

depois do 1 e termina antes 1 e 2 não participam  O mais indicado é que a amplitude seja a mesma em todas as classes.
do 2.

1 ---| 2 Aberto – fechado ↝ Maior 1 não participa, mas o 2


Nº de filhos Frequência
que 1 e menor ou igual a 2 participa.
0 |--- 2 8
4. CLASSES: agrupamentos de valores num intervalo.
2 |--- 4 9
Nº de filhos Frequência
4|--- 6 5
0 |--- 2 8
6|---| 8 3
2 |--- 4 9
4|--- 6 5
Exemplo: h2= 4 (limite superior) - 2 limite (inferior) = 2.
6|---| 8 3
Carol Andrade – Medicina

PONTO MÉDIO DE UMA CLASSE (Xi): é o ponto que divide o intervalo em duas 6|---| 8 3 0,12

partes iguais.

 Ele representa o intervalo de classes. Exemplo: 8/25 = 0,32 ↝ 9/25 = 0,36 ↝ 5/25 = 0,20 ↝ 3/25 = 0,12 ↝ 0,32 + 0,36 +

Como calcular? É a soma da divisão dos valores, ou seja, você soma o intervalo
0,20 + 0,12 = 1.

em cada classe e divide por dois.

Nº de filhos x Frequência FREQUÊNCIA ACUMULADA (Fi): é a soma de todas as frequências abaixo do limite

0 |--- 2 1 8 superior de uma classe considerada. Soma das frequências anteriores.

2 |--- 4 3 9 Nº de filhos Frequência Fr Fi


4|--- 6 5 5 0 |--- 2 8 0,32 8
6|---| 8 7 3 2 |--- 4 9 0,36 17

Exemplo: x2 = (2+4)/2= 3 4|--- 6 5 0,20 22


6|---| 8 3 0,12 25

FREQUÊNCIA RELATIVA (fr): proporção de observações de um valor (ou de uma


Exemplo: F2: 8 + 9 = 17
classe) em relação ao número total de observações.

 É o que comparamos com outro.

 Pode ser uma frequência relativa simples ou porcentagem. FREQUÊNCIA RELATIVA ACUMULADA (Fri): soma de todas as frequências relativas

 Compara um valor com o total; anteriores. Ou então pegamos Fi e dividimos pelo total

 A soma deve ser = 1 Exemplo: Fr2: 17/25 = 0,68

 Representa quanto alguma coisa faz parte do todo.


Nº de filhos Frequência Fr Fi Fri
Nº de filhos Frequência Fr
0 |--- 2 8 0,32 8 0,32
0 |--- 2 8 0,32
2 |--- 4 9 0,36 17 0,68
2 |--- 4 9 0,36
4|--- 6 5 0,20 22 0,88
4|--- 6 5 0,20
6|---| 8 3 0,12 25 1
Carol Andrade – Medicina

Resumindo: Segundo passo: Subdivisão em classes:

K = raiz de 25 = 5.
1. Colocar em Rol
 Deve-se distribuir tudo em 5 grupos.
2. Frequência (f)
 Precisa começar com o primeiro.
3. Subdivisão em classes
 Intervalo de classes = 1,5/5 = 0,3
4. Ponto médio (xi)
i Classes Xi Fi Fri Fri % Fi Fri
5. Frequência relativa (fr)
1,66 + 5/25 = 20% 5 5/25 =
6. Frequência acumulada (Fi) 1,96/2 =
1 1,66|---1,96 5 0,2 0,2
7. Frequência relativa acumulada (Fri) 1,81

Exemplo: Pesos de crianças prematuras. n=25


1,96 + 5/25 = 20% 10 10/25
2,26 / 2 =
2 1,96|---2,26 5 0,2 = 0,4
2,91 3,16 1,89 1,93 2,26 2,11

1,66 3,02 2,56 2,78 1,98 2,26 + 4/25 = 16% 14 14/25


2,56 / 2 =
2,46 1,92 2,33 2,12 2,23 3 2,26|---2,56 4 0,16 = 0,56
2,41
1,86 3,12 2,76 2,24 3,08
2, 56 + 4/25 = 16% 18 18/25
2,02 2,98 2,45 2,45 3,01
2,86 / 2 =
4 2,56|---2,86 4 0,16 = 0,72
Amplitude total= At= maior valor – menor valor 2,71

Intervalo de classes = C= At\k 2,86 + 7/25 = 28% 25 25/25


3,16 / 2 =
Primeiro passo: Colocar em Rol 5 2,86|---|3,16 7 0,28 =1
3,01

Interpretacao:

 Explique o que significa ou representa os valores de fr2?

Frequência relativa da classe 2 é igual a 20% das crianças que nasceram


Amplitude total: 1,66|---|3,16
prematuras e tiveram pesos de 1,96 a menor que 2,26. Ou seja, igual ou maior que
At = 3,16-1,66 = 1,5
1,96 e menor que 2,26.
Carol Andrade – Medicina

 Explique o que significa ou representa os valores de Fri2?

40% das crianças prematuras nasceram com o peso maior ou igual a 1,66 e menor
que 2,26.

ESTATÍSTICA DESCRITIVA
Tabelas Obs: não pode ter uma linha que feixe a tabela.
 “forma não discursiva de apresentar informações das quais o dado numérico
 Caso feche a tabela ela vai ter uma conformação de quadro.
se destaca como informação Central”.
 Quadro 01, 02... é uma ferramenta didática, elemento textual para
 PONTOS PRINCIPAIS: números (informação central – não 100%), dados.
apresentar alguma informação extra, dica.
 Tabelas de grupamentos simples: mostram os valores obtidos e o numero de
o Cabeçalho separado do restante do texto: Logo após a primeira linha
vezes que cada valor foi observado.
horizontal; precisa ter um destaque de separação (negrito por ex).
 Tabelas de grupamentos por intervalo de classes: resumir dados com
o Sem linhas verticais;
valores que variam muito.
o Fonte: utilizada para evitar plagio; aumenta a confiança; segurança (evita a
Ex: Peso, altura – dados quantitativos contínuos (precisamos enxugar).
responsabilidade de um erro);

 CONSTITUIÇÃO: Obs: caso o dado for fonte própria, segundo o IBGE e ABNT deve-se

o Titulo: suficiente claro e superior; precedido de um numero; precisa ser


colocar “próprio autor”.
autossuficiente (para que o leitor não precise voltar o texto para
o Rodapé: não é obrigatório; utilizado para observações, dicas, abreviações,
compreender a tabela); elemento obrigatório.
símbolos.
Obs: O ideal é que o titulo responda essas três perguntas: O que? Quando?

Onde?

o Quadro: é o corpo da tabela;

o Linha limitante inferior e superior: 2 linhas: horizontal superior e

horizontal inferior – limitantes.


Carol Andrade – Medicina

2 colunas – variáveis/características – N %

Tabela 5 slide: evolução em longo prazo dos 221 procedimentos – muito vago!

 Variáveis qualitativas

Titulo muito vago


Carol Andrade – Medicina

 Protocolos: Observar a legenda da tabela para saber o significado de alguns

componentes.

 Obs: nessa tabela M1 M2 M3 = cada resultado significa um processo diferente.

Letra maiúscula e minúscula = significa condições diferentes;


 0,56BCb e 0,51Ca = numericamente diferente e estatisticamente iguais, pois no

rodapé dizia que se eles tivessem uma letra maiúscula igual seriam
 Exemplo de tabela correta:
estatisticamente iguais.

 SEMPRE CORRELACIONAR COM O RODAPÉ

Obs Importante:

 Empate técnico: existe uma sobreposição


 Quando existe sobreposição = não podemos elencar certeza;

 95% grau de confiança; caso ele fizesse 100 vezes esse estudo em 95% das

vezes ele teria o mesmo resultado.

 Os 5% seria a exceção – devemos observar essa exceção!


Gráficos
 Visão mais imediata de como se distribuem os valores;
 Nas publicações são chamadas de figuras;

 Mostrar através de desenhos o que não conseguis mostrar na tabela;


 Exemplo de tabelas sem composição ideal:
 Forma mais rápida de observar.

 Título – obrigatório e no pé do desenho;


 O que estou querendo mostra nesse gráfico? Quando queremos mostrar

informações mais visuais, algo mais rápido, algo que você consegue ter

conclusões mais rápidas.

Obs: Se for uma informação mais precisa é melhor escolhermos a tabela.


Carol Andrade – Medicina

 Nunca devemos mostrar gráfico e tabela do mesmo assunto;  Representação gráfica para distribuição de dados numéricos, ou seja, um

 Que tipos de dados tenho? modelo estatístico para a organização dos dados, exibindo a frequência que

 Tipos de Gráficos: uma determinada amostra de dados ocorre.

GRÁFICO DE BARRAS (OU DE COLUNAS):  Mostra os dados a respeito de classes – mais comum na área de saúde;

 Utilizado, em geral, para representar dados de uma tabela de frequências  Justapostas = um colado no outro, pois na medida que termina uma classe

associadas a uma variável qualitativa. começa a outra.

 Nesse tipo de gráfico, cada barra retangular representa a frequência ou a  Mais comum em variáveis quantitativas: peso, largura, comprimento,

temperatura, volume, tempo, entre outras grandezas.


FREQUÊNCIA RELATIVA da respectiva opção da variável.
 Base do gráfico = intervalo das classes.
 Barras: retângulo na horizontal;
 Largura da barra = de acordo com o intervalo de classes.
 Coluna: retângulo na vertical.
 Altura: quantidade/frequência relativa;
 Quanto mais alto = maior quantidade.
 Amplitude: precisa ser igual = mesmo intervalo de classes;

 Histograma x Gráficos em barras: O histograma é uma variação do


HISTOGRAMA: gráfico de barras. Enquanto o gráfico de barras descreve os dados em
 Mais utilizado para variáveis continuas. barras e categorias separadas, o histograma representa os dados da
 Pode ser como barras verticais ou barras horizontais; mesma categoria no intervalo analisado, por isso, sem espaço entre as
 As áreas dos retângulos resultantes devem ser proporcionais à frequência. barras.
 Pode representar dados de frequência simples e acumulada, assim como

relativa. OGIVA:
 Gráfico em linha usado para registrar a frequência acumulada.
Carol Andrade – Medicina

 O processo de construção é o mesmo usado para o gráfico em linhas.  Tempo = principal variável.

 Este gráfico é útil para verificar quando os elementos da amostra estão abaixo

de uma determinada medida.

 Gráfico acumulado;
 FREQUÊNCIA ACUMULADA;

GRÁFICO DE SETORES:
 Também conhecido como gráfico de pizza;
O 8 representa quem tirou até 4.  Utilizado, em geral, para representar partes de um todo – compara uma parte

com o todo.

 Frequência relativa.

Obs: para saber o dia subtrai com o anterior. Ex: 31 – 23 = 8 – 8 pessoas acima da

média (7)

FC: ponto médio


PICTOGRAMA
Até = acumulada = ponto médio: ponto que representa a classe.
 A fim de tornar os gráficos mais atraentes, os meios de comunicação, como

revistas, jornais, entre outros, costumam ilustrá-los com imagens relacionadas


GRÁFICO DE LINHAS (ou de segmentos): ao contexto do qual as informações fazem parte.
 Utilizado, em geral, para representar a evolução dos valores de uma variável no  Assim como nos gráficos tradicionais, as dimensões das imagens devem ser
decorrer do tempo. proporcionais ao dados apresentados;
Carol Andrade – Medicina

 Mais didático;  Utilização de letras nos gráficos: mesma referencia da tabela –


 Não pode ser usado em trabalhos científicos; observar o rodapé para correlacionar; fazer comparações.
 Comum para situações comuns;

 Não tem uma métrica proporcional;


 Ex: revistas, sites, visualização de projetos.

 Infográficos.

 Não é um gráfico científico; utilizado para pessoas mais leigas.

Exemplos:
Carol Andrade – Medicina

MEDIDAS
Tendência Central Média ponderada: para cada valor deve-se levar em conta o valor do seu peso. É
calculada através do somatório das multiplicações entre valores e pesos divididos
Média aritmética: Dado obtido pela soma de todos os e dados e dividido pelo
pelo somatório dos pesos.
número deles. É considerada uma medida de tendência central e é muito utilizada
 Temos que analisar o peso.
no cotidiano.
Exemplo: Alcebíades participou de um concurso, onde foram realizadas provas de
 Mais utilizada no dia a dia;

 Simples de entender; como se pudéssemos distribuir valores e encontrar um Português, Matemática, Biologia e História. Essas provas tinham peso 3, 3, 2 e 2,

ponto comum entre eles; respectivamente. Sabendo que tirou 8,0 em Português, 7,5 em Matemática, 5,0 em

 Todos os números têm o mesmo peso, mas com frequências (fi) diferentes. Biologia e 4,0 em História, qual foi a média que ele obteve?

 Símbolo da média: 8,3 + 7,5.3 + 5.2 + 4.2 / Soma dos pesos = 64,5 / 10 = 6,5

Outlier: valor aberrante ou valor atípico é uma observação que apresenta um


grande afastamento das demais da série (que esta "fora" dela)
Exemplo:
 A presença implica em prejuízos a interpretação dos resultados dos testes
1. De um paciente foi acompanhado os valores de glicose (mg/dL), em jejum, por estatísticos.
5 semanas.  Apresenta um afastamento das demais séries;

 Ponto fora da curva.

 Acarreta um prejuízo a interpretação;


Qual o valor médio de glicose por semana? 580 / 5 = 116 mg/dL

2. A tabela abaixo apresenta as notas em bioestatística de uma turma de 30


 Interfere na média – afetou muito, mas não necessariamente estar errado;
alunos. Qual a média da turma?
 É necessário saber interpretar;
3.4 + 4,5.5 + 5.2 + 6,5.3 + 7.6 + 8.5 +  Analisar se é verídico e se é possível;
9.4 + 10.1 / 30 = 6,066
 É necessário apontar que o outlier aconteceu;
Carol Andrade – Medicina

 Serve para demonstrar que é possível isso acontecer, mas é recomendável Para calcular:
dizer o porquê que isso aconteceu.
Outlier positivo: Média + 2 x DP  o outlier seria o próximo número.
 Sempre estar localizado no inicio ou no final dos números.
Outlier negativo: Média – 2 x DP
 Pode ser também indicativo de erro, ou seja, precisamos saber a plausibilidade
Observação: só calculamos o outlier negativo quando pede na questão.
dos dados.

Exemplo: Mediana: É o valor numérico que separa a parte superior dos dados da parte

inferior. É utilizado como um possível parâmetro de localização.

 Valor central de um conjunto de dados, para sabermos esse valor central os

valores precisam estar em ordem.

Obs: O outlier não vai influenciar tanto quando tiver a presença de muitos dados,  Valor que separa o conjunto de dados maior e menor.

50% - Mediana - 50%


com isso podemos dizer que, quanto maior a quantidade de dados menos é a
□ 1º passo: ordenar os dados;
influencia do outlier.
□ 2º passo: encontrar a posição;
Amostra Interferência Outlier
□ 3º passo: calcular se necessário.

Como encontrar a posição da mediana?


Amostra Interferência Outlier
□ Número de dados impar = mediana é o elemento central;
 Mesmo se tivermos mais de um número que apresente uma discrepância □ Número de dados par = mediana é a média dos dois valores centrais
grande entre os outros, os dois serão considerados outlier.
n+1/2 n/2 e n/2+1
Exemplo: Rende brasileira: 5 mil = media mascarada por conta das pessoas mais

ricas, pois mais da metade da população aprenda renda mensal de 1.1 mil reais.

Outlier positivo: Quando a média aumenta.

Outlier negativo: Quando a média diminui.


Carol Andrade – Medicina

Exemplo: 1. A tabela abaixo apresenta as notas em bioestatística de uma turma de 30


alunos. Qual a mediana da turma?
1. Com o conjunto de dados {8,5,1,3,10} Qual a posição da mediana e seu Fi

valor? Qual a média?


R: 3–3– 3–3–4,5– 4,5-4,5-4,5 – 4,5 – 5
4

R: Média: 1 + 3 + 5 + 8 + 10/2 = 13,5. Mediana: 5


11

14

20 – 5 – 6,5 – 6,5 – 6,5 – 7 – 7- 7- 7 – 7 -7


25 – 8 -8 -8-8-8-9-9-9-9-10 = 7
29

2. Com o conjunto de dados {3,5,10,7,9} Qual a mediana? Qual a média? 30

R: Média: 3 + 5 + 7 + 9 + 10/2 = 17. Mediana: 7


Moda: é o valor que detém o maior número de observações, ou seja, o valor ou

valores mais frequentes, ou ainda "o valor que ocorre com maior frequência num

conjunto de dados, isto é, o valor mais comum”.


3. Com o conjunto de dados {1,11,6,8,3,10}. Qual a posição da mediana e seu  A moda não é necessariamente única, ao contrário da média ou da mediana. É
valor? Qual a média? especialmente útil quando os valores ou observações não são numéricos.
 Conjunto de dados mais frequentes.

R: Média: 1 + 3 + 6 + 8 + 10 + 11/2 = 19,5. Mediana: 6 + 8/2 = 7  Conseguimos ter uma moda de nome de pessoas por ex, porem não

conseguimos ter média e mediana.

 Podemos ter dados qualitativos.


 Outlier não interfere na mediana, pois não queremos observar os extremos,
Exemplo:
mas sim o central. O outlier interfere apenas na média.
 Podemos calcular a mediana caso tenha outlier para caracterizar o nosso 1. A moda de {ótimo, bom, ótimo, bom, ruim, regular, bom}: bom.
conjunto de dados. 2. A série {1, 3, 5, 5, 6, 6} apresenta duas modas (BIMODAL): 5 e 6.

Obs: A mediana é muito forte na presença de valores extremos, enquanto que a 3. A série {1, 3, 2, 5, 8, 7, 9} não apresenta moda (AMODAL).

4. A série {1, 3, 5, 5, 6, 6, 7, 7} apresenta mais do que duas modas


média é muito sensível.
(MULTIMODAL): 5, 6 e 7.
exemplo:
Carol Andrade – Medicina

Ou seja: Amplitude:
□ Modal =Uma moda;
 Quando a média não é suficiente para avaliar um conjunto de dados, é
□ Bimodal = Duas modas;
necessário saber como a média varia ou como ela se dispersa do conjunto de
□ Multimodal = + de 2 modas;
valores da população ou amostra.
□ Amodal = Nenhuma moda.
 Medida de dispersão mais simples; Leva em consideração os extremos;
Exemplos:
 Diferença entre o maior número e menor; Precisamos ter um ponto central.

1. Idade de 20 alunos do 6º ano {12, 11, 12, 13, 12, 11, 13, 12, 12, 11, 14, 13, 13,  Outlier interfere muito nesse parâmetro, pois tratamos com o extremo.

12, 11, 12, 13, 14, 11, 14}.  Não é a mais utilizada.

2. A tabela abaixo apresenta as notas R:


12 em bioestatística de uma turma de 30 Quem teve o desempenho mais regular?
alunos. Qual a moda?
R: Após calcularmos a variância, o aluno 2 foi o mais disperso.

R: 7
Variância:
1. Pega todos os valores e eleva o quadrado.
Consideracoes: Um conjunto de observações terá somente uma média e uma 2. Soma os valores.

mediana, mas poderá não ter moda ou ser mais de uma. Obs: Eleva ao quadrado, pois a soma da diferença dos valores da media somada

Medidas de dispersão daria 0.

 Quando os valores estão dispersos – espalhados.


 É necessário que identificarmos o que mais varia.

3. Divide a soma pela quantidade de valores para ficar justo.


 Dado populacional = n

 Dado amostral = n -1

 O -1 representa o erro amostral do cálculo.


Carol Andrade – Medicina

Soma das médias ao quadrado dividido pela quantidade – a média normal ao

quadrado.

O aluno 2 teve maior variância;


n chance de erro O aluno 2 foi mais disperso e irregular comparado ao aluno 1.
Sei mais da população = dados muito mais reais dela.
Para amostras:
 10 (amostra) – 1 (erro amostral)= 9 (maior interferência);
 Seria n – 1 (erro amostral);
 100 (amostra) – 1 (erro amostral) = 95 (menor interferência).
Quanto maior o n = maior a amostra = menor interferência do -1 (Erro amostral).
Amostra interferência do erro amostral
 Média ao quadrado;
4. Eleva a média ao quadrado.
 Multiplica por 5 ;
5. Multiplica por 5 e divide por n ou n-1. (Nesse exemplo iria anular, pois é um
 Divide por 4.
dado populacional).

Diferença, pois na amostra


população tiramos o erro amostra
=
6. Calcular a variância

 σ2 (sigma ao quadrado) = população Causa a diferença na variância.

 s² (S ao quadrado) = amostra Desvio padrão: Com estes dados podemos estabelecer o desvio padrão, que é a
 μ (Mi) = media da população;
raiz quadrada da variância.
 ̅ (X barra) = media da amostra.
 Raiz quadrada da variância.
Carol Andrade – Medicina

 Para diminuir a interferência final do que elevamos ao quadrado. Ou seja, para ser um outlier negativo o valor precisa ser abaixo de 0,08.

Então: Dp1 = √6,56 =2,56

Dp2 = √ 11,76 =3,42 (maior desvio = mais irregular – maior variação das notas Ou seja, para ser considerado outlier precisa ser acima de 10,36 ou abaixo de

em torno da sua média). 0,08.

Representação:  Para cada conjunto de dados conseguimos calcular o que é um outlier

Média; +/-, pois teve valores abaixo e acima da média; Desvio padrão. negativo e o que é um outlier positivo.

Aluno1 = 5,2±2,56 Exemplo: No caso para o aluno 1 não teríamos outlier, pois ele teria ter que

Aluno2 = 6,2±3,42
tirar acima de 10 ou abaixo de 0, nesse caso isso não poderia acontecer.
Quem teve o desempenho mais regular? O desvio padrão nesse caso foi muito alto, pois o n foi pequeno.
Comparando o aluno 1 com o aluno 2 = dentro da mesma média de 10 = o aluno Ou seja,
1 apresenta melhor desvio padrão. n interferência do desvio padrão.
 Só podemos comparar, pois estão na mesma unidade e escala.
Resumindo:
 Quando mais próximo de 0 = mais regular é o sistema / desvio padrão.

7, 7, 7, 7 – desvio padrão = 0.

Observacao:

 Outlier positivo = média + 2 desvio padrão

 Outlier negativo = média - 2 desvio padrão


Exemplo:
Exemplo::
1. Calcular a variância para a amostra de teores de determinada substância:
 Outlier positivo Aluno 1: 3,9; 2,7; 2,8; 3,1; 3,5; 3,9; 2,7.
5,2 + (2.52 x 2) = 10,36 A média é = 3,2286
Ou seja, para ser um outlier positivo o valor precisa ser acima de 10,36.

 Outlier negativo Aluno1:

5,2 – (2,52 x 2) = 0,08


Carol Andrade – Medicina
R

1. Elevamos todos os números ao quadrado: 15, 21; 7,29; 7,84; 9,61; 12,25;
15,21; 7,29.
2. Soma todos os valores = 74,7
3. Dividimos os valores por n-1 = 74,7/7-1 = 12,45 A pulsação é mais estável do que o ácido úrico?
2
4. Pegamos a média e elevamos ao quadrado = 3,2286 = 10,4238658;
5. Multiplicamos esse valor por n = 10,4238658 x 7 = 72,97 R: CVp = 8,7/68,7 = 7,896 = +/- 79%
6. Dividimos o resultado por n – 1 = 72,97/6 = 12,1616.
CVa = 5,56 / 1,03 = 5,398 = +/- 54%
7. Calculamos a variância = resultado do primeiro calculo – resultado do
Não, pois quanto menor o CV mais homogêneo é o conjunto de dados, então o
segundo = 12,45 – 12,1616 = 0,2883. ácido úrico é mais,
8. Caso precise calcular o desvio padrão é só pegar o valor da variância e
tirar a raiz = √0,2883 = 0,537

Coeficiente de variação (CV): variabilidade dos dados em relação à média.


Consideracoes
Quanto menor o CV mais homogêneo é o conjunto de dados.
 Caso cada valor da série seja multiplicado por um valor K, a variância será
É utilizado quando comparamos dois grupos ou duas variáveis que não são
multiplicada por K² e o desvio por K.
compatíveis, a principio.
 Mesmo se uma constante k é somada a cada valor do conjunto, o desvio
 Usualmente expresso em porcentagem, indicando o percentual que o desvio
continuará o mesmo.
padrão é menor.
 Pode ser bastante útil na comparação de duas variáveis ou dois grupos que a
Revisando :
princípio não são comparáveis.

 CV = desvio padrão/média  Desvio padrão = S

 Média = x
Exemplo:

1. Em um grupo de pacientes foram tomadas as pulsações (batidas por

minuto) e dosadas as taxas de ácido úrico (mg/100ml). As médias e os

desvios padrão foram:


Carol Andrade – Medicina

Gráfico Levey-Jennings: é utilizado para o controle da qualidade interna do Exemplos:

laboratório, vai ser realizado a na alise em materiais de controle e os resultados


1. Criança com 2 anos e 10 meses com 95cm – muito próxima da média que
vão ser lançados em gráfico. É um gráfico ótimo para representar uma pesquisa,
é a verde  nesse caso espera-se que ela esteja ok.
em caso de analise de sangue. Antes de fazer um exame de sangue, precisamos
2. Criança com a mesma idade, mas com 1m  bem mais distante da média,
verificar o aparelho.
chegou quase no risco  desenvolvimento rápido no crescimento.
No exemplo os quatro pontos ultrapassaram a linha amarela, ou seja, são outlier,
3. Criança com 2 anos com 1.05m  passou muito da média  outlier.
pois ultrapassaram muito a relação.

 Crescimento entre as duas linhas laranja: crescimento de distribuição normal –

padrão  espera-se que 68% da população fiquem nesse meio.

 O restante da população 32% estariam acima ou abaixo – não é tão comum,

 Quanto mais distante da média = mais instável. mas acontece.

 Quanto mais próximo da média = mais estável.  Faixas vermelhas  95% de chances das crianças estarem dentro dessas faixas.

 Acima da faixa vermelha  2,5% de chances

 Cartão de vacinação: podemos fazer o acompanhamento do crescimento e  Abaixo da faixa vermelha  2,5% de chances

desenvolvimento.  Uma coisa que acontece menos de 3 vezes na faixa de 100%  raro de

acontecer, pode ser indicativo de um problema.

o As linhas do cartão são equidistantes.


Carol Andrade – Medicina

TIPOS DE DISTRIBUIÇÃO
Simetria: um lado igual ao outro.

Distribuição simétrica: Uma distribuição é dita simétrica quando apresenta o


mesmo valor para a moda, a média e a mediana. Ou seja, essas medidas,

teoricamente, coincidem no ponto central da distribuição.

 Distribuição de dados quando o lado esquerdo é muito igual ao direito. Gráfico  Histograma: cada coluna representa uma classe, como cada uma das
 Uma distribuição que de modo geral temos valores bem parecidos para moda, classes acaba e começa a outra elas teriam que ser justapostas  uma colada na
media e mediana. outra.
 Eixo que indica que o formato de distribuição é o mesmo à esquerda e à

direita.

 Utilizamos a média como um apoio.

 No exemplo elas têm a mesma amplitude. Os vermelhos são os pontos médios


e a soma dos valores teria que dar 100% ou 1 (representação).

Exemplo: valor de referencia do colesterol  correlação com o gráfico. O nosso  Caso a gente faça um risco no meio, diríamos que é uma distribuição simétrica,

pois um lado ficou muito parecido com outro.


colesterol tem uma distribuição normal, o valor de 200 está no pico – seria a
Segundo gráfico: a moda estaria no 4, pois apresenta a maior frequência –
média, moda e mediana do gráfico. À medida que vamos nos afastando do 200 a
barrinha, ou seja, é o que mais se repete.
frequência vai diminuindo, ou seja, vai ficando mais raro. O 200 seria um
Os desvios são iguais de um lado e do outro, com isso divide em dois lados iguais
parâmetro.
50% de um lado e 50% do outro  seria a mediana, pois é a medida de tendência

central que divide um conjunto de dados com o mesmo valor de um lado e do

outro.
Carol Andrade – Medicina

Média  pegar de quem tem mais para quem tem menos para que todos fiquem

no mesmo nível. 1 – 7, 2 -6, 3 -5 e o 4 é o que está no meio, ou seja, somando

todos valores do lado esquerdo + a metade do 4 e somando todos os valores do

lado direito + a metade do 4 daria o mesmo valor. Ou seja, o 4 é a nossa média.

Distribuição assimétrica: presença de um dado que faça com que ocorra um


deslocamento da curva.

 Gráfico laranja: enviesamos a curva para direita, trazendo uma nova curva de

Terceiro gráfico: um dado muito distante, cortaríamos a simetria, pois um lado não dados. Seria uma assimetria positiva, pois ela aumentou a média  a média

estaria igual ao outro. que estava no meio, vai ser deslocada para o lado do outlier.

 Caso acontecesse o outlier do outro lado seria negativo.

 A simetria em torno de um eixo indica que o formato da distribuição é o Na distribuição assimétrica não temos uma igualdade – simetria, acontece quando

mesmo à esquerda e à direita desse eixo. temos um outlier ou então quando temos uma concentração de dados maior de

 Se uma distribuição é simétrica então a média é o seu ponto de simetria, um lado do que no outro por exemplo.

indicando que intervalos de mesma magnitude à esquerda e à direita da média Positiva: leva a média para o lado direito = aumentou a média.
têm as mesmas concentrações de valores. Gráfico laranja: distribuição assimétrica, não podemos cortar o gráfico em duas
Gráficos azuis: gráfico do meio é um gráfico bimodal – a média seria as pontas. porções iguais. Mostra mais ou menos a distribuição de renda no Brasil – a maior
Curva em U. parte da população tem uma renda menor e a menor parte da população tem uma

renda maior.

 Curva de distribuição assimétrica positiva  puxou a média para a direita.


Carol Andrade – Medicina

 Assimetria positiva: implica numa concentração maior dos menores valores,

possuindo uma cauda mais alongada à direita. Assim, majoritariamente, a

magnitude dos desvios à direita é maior que a magnitude à esquerda.

 Curva assimétrica é negativa  puxou o gráfico para a esquerda.

 Gráfico 1  Simétrico = média, mediana e moda =


 Média, moda e mediana não apresentam o mesmo valor.
 Gráfico 2  Assimetria positiva = media maior que as demais.
 A média sai mais do eixo do meio do que a mediana, pois o outlier interfere
 Gráfico 3  Assimetria negativa = media menor do que as demais.
bruscamente na média, faz com que a média seja mais deslocada.
 Gráfico boxplot: nos mostra com o traço de cima e o de baixo = desvio

Exemplo: Curva de potássio: pacientes com câncer de próstata apresentam uma o Primeiro gráfico: o valor de desvio para cima é igual ao de baixo.

o Seguindo gráfico: desvio mais para cima = mais para o lado positivo =
concentração baixa de potássio, onde os níveis normais são mais altos.
presença dos três pontinhos vermelhos = outlier = valores
Pacientes com câncer de próstata tem uma assimetria positiva e quem não tem
discrepantes.
uma assimetria negativa.
o Terceiro gráfico: desvio para baixo = teria três pontinhos vermelhos

para baixo.

Distribuição NormaL: A distribuição estatística é uma função que define uma

curva, e a área sob essa curva determina a probabilidade de ocorrer o evento

por ela correlacionado. Existem vários tipos de distribuição estatística, como a

Resumindo: binomial, a poisson, a uniforme e a gaussiana.

 A distribuição gaussiana é a que ocorre com maior frequência na natureza, e

por este motivo recebeu a denominação de normal.

 Carl F. Gauss no início do século XIX:


Carol Andrade – Medicina

 É uma distribuição contínua e simétrica, cujo gráfico tem a forma de um sino.  A área mede 100%  area acima da média = 50%  simétrica.

 A distribuição normal é o resultado da atuação conjunta de causas aleatórias.

 Normal = mais corriqueiro = mais comum de aparecer.

 Pode ser chamada também de Gaussiana.


 Gráfico: Duas populações diferentes  comportamento da sistole e diastole.
 Curva comum da fisiologia humana, indicativa normal de que uma coisa pode
 Caso uma pessoa da população do Kenyon esteja em Londres e o médico
acontecer.
utilizou a curva londrina, mas a curva de londre é difenrete  exemplo da faixa
 Utilizamos esse nome, pois a primeira pessoa que estudou essa distribuição foi
= consideraria uma hipotensão do pacinete, mas caso compare com a do
Carl F. Gauss em XIX.
Kenyon não estaria.
 É uma distribuição continua e simétrica (nem todas as distribuições simétricas
 Alerta: uma boa anamnese pode fazzer com que entendemos melhor o
são normais, não pode ser em formato de U, chapéu de bruxa e nem pode
paciente e também o compare com a sua população. Apesar de existir
formar um platô muito grande).
padroes, mas temos que nos basear em dados micros.
 O desvio Padrão σ, é a distância entre a média e o ponto de inflexão da curva.

A área total sob a curva normal é igual a 1, pela própria equação da

probabilidade.

 Em virtude da simetria as áreas à direita e à esquerda do valor μ são iguais.

Obs: 7 – 7 – 7 – 7 = média = 7 / desvio = 0, pois todo valor que temos a mesma


Mesocúrtica:
média será 0. 1. A curva, teoricamente, jamais toca o eixo x;
 Tudo que for diferente da minha média terá um desvio. 2. A curva é simétrica em relação a média;
 Em caso de 1 para um lado e 1 para o outro o desvio vai ser 1 (negativo, pois 3. A média, moda e mediana são iguais;
foi abixo da media e positivo, pois foi acima da média). 4. A área sob a curva totaliza 1 ou 100%;
Carol Andrade – Medicina

5. Aproximadamente:

68% dos valores de x situam-se entre µ-σ e µ+σ;

95% µ-2σ e µ+2σ;

99,7% µ-3σ e µ+3σ.

I Desvio padrão = 68,36%

II Desvios padrão = 9,44%

III Desvios padrão = 99,73%

IV Desvios padrão = 99,994%

 A curva é mesocúrtica; Cúrtica = faz um cálculo de cima.

 Gráfico: Valores de desvio encima da média = 0, acima da média não teria

desvio.

 A área da curva mede 68,26%.


 Da média para 0 seria 34,13% e do outro lado também. Observações
 Quando vamos para dois desvios = a chance aumeta para aproximadamente
 Cerca de 95% das observações estão dentro 2 desvios padrão da média,
95%. exibidos pela área sombreada azul. 95% dos valores estará dentro de 1,96
 Temos a mesma base, mas as áreas são diferentes, pois quanto mais afastado desvios padrão da média (entre -1,96 e +1,96).
da média = mais raro de acontecer.
 Assim, menos de 5% (0,05) das observações estarão fora desta amplitude. Esta
 Não é porque o desvio dobrou que a probabildiade dobra, ela não dobra, ela
amplitude é a base por trás do nível alfa de 0,05 de diversos testes de
aumenta, a curva é exponencial, vai diminuindo enquanto você se afasta da
hipótese.
média.  Cerca de 68% das observações estão dentro de 1 desvio padrão da média (-1 a

+1), e cerca de 99,7% das observações estarão dentro de 3 desvios padrão da

média (-3 a +3).


Carol Andrade – Medicina

Exemplo: Estudo com media 90 e desvio padrao = 5.

4. Qual a chance de termos um paciente entre 80 e 100?

R: 95, 44%.
1. Qual é a chance de termos valores entre 90 e 95?

R: 34,13% em uma distribuição normal. Pois 90 seria a média – 5 = desvio

padrão.

5. Qual a probabilidade de ter um valor acima de 100%?

R: Entre 80 e 100 = +/- 95%; falta 5 para 100%  2,5 para cada lado = chance

de ser acima de 100 = 2,5% e abaixo de 80 = 2,5% = curva que não é comum

de acontecer.
2. A chance de ter entre 90 – 85?

R: 34, 13.  A curva mede 100% até 105 temos 99,773 – quanto falta para 100% = 0,27
3. Qual é a probabilidade de termos um paciente com valores de 85% –  0,135 para um lado e 0,135 para o outro.
95%?  Caso não for uma curva tranquila faremos  Z = (x- µ)/ σ
R: 68,26%.

Média = +/- o desvio padrão = 68,26 6. 90 – 92,5? Teremos quantos desvios?

R: Teremos meio desvio. Não teremos 34,13, pois é exponencial – não é linear.

Então na medida que aproximo da media eu aumento e a medida que eu

me afasto = diminuou, mas exponencialmente.


Carol Andrade – Medicina

Curva normal padronizada ou reduzida  III = 50 – II

 Qual é a área para 1 desvio padrão?


 Tabela de distribuição normal
o Informa a área entre a média e o valor de z R: 34,13  sempre é 34,13.

o Ex.: Quando z = (isto é, igual σ) a área é 0,3413 ou 34,13%  Olhamos a tabela (sempre vem na prova) = para 1,55 = para sair do

o Transformação de x em z  Z = (x- µ)/ σ ponto 0 e me distanciar até 1,55 desvio padrões teremos uma área de

0,4394  ÁREA II.


Exemplos:
 III = 50 – 43,94
1. Qual a área de Z acima de 1,55?  III = 6,06%

2. Um treinador deseja selecionar jogadores com estatura acima de 180

cm. Qual a porcentagem esperada de jogadores com este potencial,

sabendo que a estatura tem distribuição normal, média de 175 cm e

desvio de 6 cm?
 Z = desvio padrão = 1,55 desvios padrões;

 Z = distribuição normal.

 Destribuição normal = curva em forma de sino, média como eixo


principal de simetria. Um ponto em cima da média é 0, pois não tem

variação  tudo que se afasta da média é o desvio  representado por

sigma  cálculo usamos Z que vai nos dar a área. A curva completa mede
 Distribuição normal = precisa dizer, caso não venha = não pdoemos
1 ou 100%;
fazer esse cálculo.
 Ele quer um z acima de 1,55  área III;
 Curva de distribuição normal = curva em formato de sino com desvio
 Com isso teremos 3 áreas marcadas no gráfico  área 1, 2 e 3.
= 6, a média como ponto central = 1,75. Todo o valor de desvio acima
 Área I = 50%  metade da área que é 100%  A curva =1, cada lado
dessa média será 0.
0,5;
 Teremos 3 áreas:
 Área II + Área III = 50;
Carol Andrade – Medicina

o Área I = 50%

o Área II  precisamos calcular o Z para saber essa área; 2. O histograma a seguir representa dados de uma determinada amostra, sendo
o Área III = 50 – Área II que, no eixo horizontal, estão representados os pontos médios das classes, todas
 Calculamos o Z; com a mesma amplitude e, no eixo vertical, as frequências relativas, com seus
 Z = (x- µ)/ σ respectivos valores em cada classe. Qual a porcentagem de indivíduos entre 3,75 e
Z =180 (ponto em que eu quero chegar) – 175 (média) / 6 (desvio) 4,75 é:
Z = 5/6 = 0,83  Temos menos de 1 desvio  Área = 0,2967%;

 Área III = 50 – área II;


 Área III = 50 – 29,67 = 20,33  a cada 100 atetlas aproximadamente

entre 20 – 21 teram 180 cm  se tivermos 200 atlletas = 40, 66.

Exemplos:
R = 3,75  4,75 = 15 + 15/100 = 33%
1.Triglicerídeos são uma forma de gordura que circula na corrente sanguínea e é
armazenada no tecido adiposo do corpo. O nível alto de triglicerídeos está 3.Os valores de referência para os níveis de hemoglobina para homens e mulheres
associado a um aumento no risco de doenças do coração. Os níveis para que uma tem diferentes faixas, sendo 13 a 17,5 g/dL para homens e 13,2 a 15,6 g/dL para as
pessoa esteva com valores normais triglicerídeos tem que ser menor que 150 mulheres. Em uma determinada população foi mensurado os níveis de
mg/dL. Sabendo que em determinada população foram mensurados os hemoglobina das mulheres, sabendo que os resultados demonstraram ter
triglicerídeos, que os resultados demonstraram ter distribuição normal, com média distribuição normal, com média igual a 14,0 g/dL e desvio padrão de 1,6 g/dL.
igual a 149 mg/dL e desvio padrão de 5 mg/dL. Qual a probabilidade de um Qual a probabilidade, em porcentagem, de um indivíduo pertencente a esta
indivíduo pertencente a esta população está com até 150 mg/dL? população está dentro dos valores de referência (Z0,5=0,1915; Z1=0,3413;
(Z0,2=0,0793; Z1=0,3413; Z1,2=0,3849 Z2=0,4772). Z1,35=0,4115; Z2=0,4772).

R: Z = 150 – 149/5 = 0,2 Z = 13,2 – 14 / 1,6 = 0,5


Z 0,2 = 0,0793 = 7,93% Z = 15,6 – 14 / 1,6 = 1
R = área I = 50 + 7,93 = 57,93%. Z 0,5 + ZI = 53,28%
Carol Andrade – Medicina

TABELA
 A tabela não indica as pontas, mas sempre a distancia da media para onde

queremos chegar.

Observações
 Dados coletados de prontuários não necessariamente são do tipo  A variância de um conjunto de dados que não varia, ou seja, cujos
secundário. valores são uma constante, é zero.
 Uma das vantagens de se estabelecer uma pergunta a respeito do  Para representar os dados em um gráfico chamado de XXXXX é
problema investigado é aumentar a facilidade em escolher o teste necessário que os valores estejam em porcentagem. Assim,
estatístico. devemos definir a frequência relativa dos dados observados. O
 A estatística pode ser dividida em descritiva e inferencial. A interessante desse gráfico e que podemos mais facilmente
inferencial também pode ser chamada de indutiva e sua base está comparar a parte com o todo  Gráfico de setores.
alicerçada em cálculos de probabilidades. Outra característica deste
tipo de estatística é tomar decisões sobre a população baseado nos Fontes: Slides Prof. Thiago Araújo
dados das amostras.

Você também pode gostar