Escolar Documentos
Profissional Documentos
Cultura Documentos
Fornecer subsídios teóricos para que possam realizar as análises exploratórias Os métodos estatísticos trabalham com uma margem de erro associada à
de dados, determinar probabilidades de ocorrência de eventos, realizar conclusão, é entender porque deu errado.
inferências populacionais, determinar modelos estatísticos para dados Assim como se mente com as palavras, com os números pode ser feito o
Aprimorar os conhecimentos necessários à interpretação de dados estatísticos Ruim com a estatística e pior sem ela.
da área da saúde.
O conjunto de métodos estatísticos usados no tratamento da variabilidade e POR QUE ESTUDAR ESTATÍSTICA?
nas ciências médicas e biológicas. Números são mais precisos que palavras em conclusões científicas;
A bioestatística fornece métodos para se tomarem decisões ótimas na Dados sem tratamento são apenas dados;
presença de incerteza, estabelecendo faixas de confiança para a eficácia de É necessário transformar dados obtidos pelo método científico em
Auxilia e/ou é Preponderante para a seleção de objetos de pesquisa para O tratamento foi eficiente?
situações.
Carol Andrade – Medicina
Conclusões ↝ generalizar informações. Entre as duas não existe a melhor ou a pior, mas sim a bem feita e mal feita.
A base para elaboração de protocolos; Exemplo: amostra de sangue – estatística inferencial que usa dados de uma
Decisões na área de saúde se baseiam em evidências;
estatística descritiva.
Indicador para alguns diagnósticos;
Definição de políticas em saúde preventiva;
POPULAÇÃO OU UNIVERSO: Todo conjunto de unidades que apresenta(m)
Indicador de doenças de cunho hereditário;
característica em comum, pode ser qualquer objeto. Vai de acordo com o objetivo
Indicador de mudanças de procedimento para avaliação do paciente.
da pesquisa e dos critérios de inclusão e exclusão
descrever e sumarizar um conjunto de dados; dar a informação que discorre É importante entender para quem a pesquisa esta sendo direcionada;
um determinado momento. Ou seja, direcionada a coleta, o resumo e a A população estudada depende do objetivo da pesquisa.
apresentação de dados populacionais a partir da utilização de gráficos e POPULAÇÃO GEOGRÁFICA: toda população geral.
tabelas. POPULAÇÃO ESTATÍSTICA: segue o objetivo da pesquisa.
Exemplo: Quantas pessoas cursam curso superior.
Exemplo: Média ou porcentagem da amostra. as medições necessárias. Não faz uma interferência; Objetiva; Não tem intuito,
fumantes).
Controle Mudança na dieta de um paciente. momento, mas ele é único. Tipo de pesquisa mais barata.
grupo normal é necessário que você tenha um grupo controle que não tenha definidas. Base territorial (bairros, cidades) ou institucional (centros de saúde,
sofrido intervenção. fábricas).
UNIDADE DE OBSERVAÇÃO: Registra o que ocorre sem interferir no fenômeno o PERÍODO LONGITUDINAL: Destinam-se a estudar um processo ao longo do
que vai estudar. O pesquisador coleta a informação sobre os atributos ou faz tempo para investigar mudanças.
Carol Andrade – Medicina
Exemplo: Ensaios clínicos estudam o efeito de um fator, comparando medições RETROSPECTIVO: (estudo histórico): Realiza-se o estudo a partir de registros
PROSPECTIVO: (estudo contemporâneo); Monta-se o estudo no presente, e o Volta para o passado para saber a causa (Efeito ↝ Causa). Necessidade de uma
Presente ↝ Futuro (efeito ↝ causa). Caso-controle: compara um grupo de doentes (casos) e um grupo de pessoas
Monta-se o estudo no presente, e o mesmo é seguido para o futuro. São não doentes (controles).
utilizados quando se pretende conhecer o efeito de algum fator, sendo os O objetivo é verificar se os casos diferem significantemente dos controles em
dados gerados a partir do início do estudo. relação à exposição de um dado fator de risco.
CAUSA/EXPOSIÇÃO ↝ DOENÇA
Podemos ter um estudo, por exemplo, longitudinal experimental prospectivo b) Quantitativa CONTÍNUA: os valores formam um intervalo ou união de
ou um estudo longitudinal observacional retrospectivo. números reais. Quando faz sentido fracionar, ou seja, utilizar vírgulas.
Exemplo: José, sexo masculino, 25 anos e fumante. depende da aproximação (precisão) utilizada”.
(“discretização”).
TIPOS DE VARIÁVEIS:
Se usarmos faixas etárias (0 a 5 anos, ou adolescentes, adultos, idosos) é
VARIÁVEL: toda característica que pode variar de uma unidade para outra. É a
qualitativa ordinal.
característica de interesse que é medida em cada elemento da amostra ou
2. QUALITATIVA: São aquelas que se baseiam em qualidades e não podem
população.
ser mensuradas numericamente. Uma variável é qualitativa quando seus
Exemplo: Nome – Sexo – Idade – Nível de Hemoglobina (g/dL).
possíveis valores são categorias. É um adjetivo, são características sobre a
1. QUANTITATIVAS: Valores numéricos que expressam quantidade. Quantos Ex: Gênero; Classe social; Gradação de cor. Cor vermelha: quando eu digo que
têm de algo.
a cor é vermelha, eu só posso dizer que é vermelho, não coloco mais detalhes,
Exemplo: Estatura – Nível sérico de cálcio – Idade
não tendo assim como diferenciar e colocar em ordem.
a) Quantitativa DISCRETA: quando não tem lógica fracionar, ou seja, Obs: podem ser codificadas ↝ Muitas vezes atribuímos números para qualificar.
quando não podemos colocar vírgulas. Conjunto de resultados
Ex: 1 para bom – 2 para médio.
possíveis pode ser finito ou enumerável. (Números inteiros)
a) Nominal: São aquelas que não podem ser hierarquizadas ou discreta ou contínua ou qualitativa ordinal ou nominal dependendo de como você
Anos e meses completos ela se torna quantitativa discreta, tendo assim, uma
discretização da situação.
Exemplo: prontuário que tem escrito anos completos, nesse caso ele é uma
adolescente, criança, adulto, idoso, com isso, percebemos que para ser quantitativa
Trabalho Estatístico
FASES DO TRABALHO ESTATÍSTICO: DEFINIÇÃO DO PROBLEMA: algo que você deseja ter resposta. É necessário:
o Formular corretamente o problema a ser estudado;
o Revisão sobre o objeto de estudo: revisar se tem algum sentido.
Carol Andrade – Medicina
o Observações próprias ou outros estudos; o Secundário: Quando o investigador para verificar as sua hipóteses de
o Estabelecer perguntas. trabalho utiliza- se de dados já existentes, arquivados, registrados ou
Ex: O efeito da droga “x” aumenta com a dose testada? publicados.
Baixo custo.
Pessoas com Diabetes do tipo I vivem mais que as com tipo II?
Fonte Primária Secundária
A frequência do nível de bilirrubina alta em recém-nascidos estão dentro do Detalhamento com Baixo, ou nenhum custo de
esperado? Vantagens respeito ao interesse da obtenção.
DEFINIÇÃO DO OBJETIVO: pesquisa.
Alto custo de obtenção Dificuldade em encontrar
o Definir exatamente os objetivos do estudo
Desvantagens e planejamento. dados que respondam o
o Sempre são alcançados? Você tem que ter consciência que podem ter problema.
objetivos que não vão ser alcançados;
o Estabelecer os objetivos antes da coleta dos dados
Obs: Não é o objetivo, mas sim quem realmente coletou.
Objetivo: pode afirmar a pergunta que você fez.
Fontes de dados: Vai da menor precisão para a maior precisão e do menor custo para
Ex: avaliar o efeito da droga com o aumento da dose.
PLANEJAMENTO: -
o maior custo.
Dados de registro -
o Como e quando vai fazer/resolver o problema; Questionário de autopreenchimento
o Determinar o procedimento que vai ser realizado; QUALIDADE Entrevistas por telefone CUSTO
o Quais os dados deverão ser coletados Entrevistas pessoais
o Censo ou amostra?
o É ou não viável?
+ Exame físico
Testes médicos, Medidas ambientais.
+
COLETA DE DADOS: Críticas:
o Primária: O pesquisador vai coletar de forma direta, como por o Verificar os dados coletados;
exemplo, um prontuário. o Evitar erros que afetariam os resultados;
Quando o investigador não encontra dados publicados o Perguntas mal compreendidas, omissões, trocas de respostas, etc.
adequados ao seu estudo, parte para a realização de um o Existem dois tipos de criticas:
inquérito, isto é, os dados são levantados diretamente na 1. Críticas externas: Corrigir imperfeições ↝ alguém não entendeu uma
população ou amostra no momento da investigação. informação.
O pesquisador coleta os dados; Detalhamento da informação; 2. Crítica interna: Verificar a exatidão das informações ↝ algo não está
Alto custo de obtenção e planejamento. certo.
Tem que passar pelo comitê de ética.
ARMAZENAMENTO DOS DADOS
o Tabulação dos dados
Carol Andrade – Medicina
Quando criamos perguntas elas vão servir para nortear, ou seja, para que você
não fuja do tema. Ajuda a estabelecer os objetivos, serve também para você
saber a população que vai ser estudada, o teste estatístico.
Os objetivos devem começar com verbos no infinitivo.
Erros no trabalho estatístico: existem dois tipos:
o Erros grosseiros: erros que podem ser evitados;
o Erros sistemáticos: erros que não podem ser evitados.
Exemplos:
Amostra e amostragem
O QUE É AMOSTRA (N)? São subconjuntos representativos de uma população ou universo (N) ↝ conjunto
randomicamente selecionados para serem estudados como representantes de uma ser parcelas de área fixa, de área variável ou unidades amostrais não-
população. superficiais, como pontos e linhas amostrais.
POR QUE REALIZAR UMA AMOSTRA? Selecionar a amostra, após ser decidido qual deve ser o respectivo tamanho.
o Mais fácil, menos tempo, menor custo. Populações heterogêneas ↝ mais pessoas entrevistadas;
o A população pode ter dimensão infinita; Menor precisão ↝ Maior tamanho da amostra para poder ter um maior
o O estudo da população pode levar a destruição ↝ as pessoas podem não Para entender a diversidade dos dados é necessário que tenha mais
o Inacessibilidade dos elementos. Variáveis qualitativas nos traz a necessidade de ter uma amostra maior que a
Em uma população seria quase que impossível chegar ao final. quantitativa, pois apresenta maior chance de diversidade.
É encima do objetivo do trabalho que conseguimos chegar à resposta. Mais eficaz se você fizer uma entrevista cara a cara; quanto mais preciso for o
o Explicitar os objetivos ↝ evitando dúvidas; Obs: Por conta da sua natureza estatística, o tamanho da amostra é muito
o Definir a população a ser amostrada;
importante para a pesquisa quantitativa e deve ser definido com bastante cuidado.
o Escolher variáveis para serem estudadas;
Isso porque a pesquisa quantitativa gera métricas precisas que se baseiam em uma
o Especificar o grau de precisão desejado;
amostra determinada ↝ podem, inclusive, ser replicadas para o universo estudado
o Escolher os instrumentos de medida e a forma de abordagem;
como um todo.
o Escolher a unidade amostral ↝ a menor parte distinta e identificável da
COMO VOCÊ ESTABELECE UMA AMOSTRA?
população;
o Ser suficientemente grande ↝ representativa;
o Executar a prova experimental ↝ verificar potenciais erros.
Suficiente grande = entrevista maior quantidade que o tamanho amostrado
Unidade amostral: Unidade na qual são observadas e medidas as caracterí-
ideal.
sticas quantitativas e qualitativas da população. A amostra é composta
pelo conjunto de unidades amostrais. Cada unidade amostral gera uma
única observação da variável de interesse. As unidades amostrais podem
Carol Andrade – Medicina
o Escolhas ao acaso ↝ todos os componentes tem a mesma chance de ser o Erro: reação inversa com o tamanho da amostra.
escolhido e de modo independente; Fazer escolha ao acaso, pois tem À medida que quisermos algo mais confiável = precisamos de uma amostra
Softwares; Sites; Tabelas de números aleatórios... Quanto maior o tamanho da população, maior é o tamanho da amostra, mas
não é porque a população dobra que temos a necessidade de dobrar, pois as
CÁLCULO DO TAMANHO DA AMOSTRA características vão se repetindo ↝ nem sempre quando a população aumenta
Do tipo de problema: Caracterizar uma variável ainda não e = Margem de erro ou erro máximo de estimativa;
↝ Identifica a diferença máxima entre a média amostral e a
investigada na população; comparar duas populações; ver se
verdadeira média populacional.
duas variáveis estão associadas; teremos algumas situações
Nível de consciência alto ↝ N alto;
que não temos referência para comparar.
Margem de erro baixa ↝ amostra alta (n);
Do tipo de variável: Qualitativas geralmente precisam de
Erro amostral: diferença entre um resultado amostral e o verdadeiro resultado
amostras maiores.
populacional.
Magnitude do erro aceito: temos a necessidade de errar
Maior tamanho da amostra ↝ Menor erro amostral (inversamente
pouco, ou seja, precisamos de uma amostra maior; Nível de
proporcionais);
confiança.
Não podemos evitar a ocorrência de erros amostrais.
Do poder desejado para o teste, isto é, da probabilidade de
O tamanho da amostra depende da sua necessidade;
que a amostra identifique uma diferença ou um efeito real.
Confiança maior = amostra maior
Do tempo, verba, mão de obra e dificuldade de obterem os
Erro maior = amostra menor.
dados e da complexidade do experimento.
Geralmente:
Amostra maior = menor chance de erro.
o Margem de erro = 4/5%
Carol Andrade – Medicina
Tamanho da amostra
- +
Erro Amostral
mensurações.
MAIOR erro = MENOR amostra o Um questionário ou formulário possui questões formuladas de modo
Menor erro = MAIOR amostra tendencioso.
MAIOR confiança = MAIOR amostra
o Objetivo: Garantir que procedimentos estatísticos possam ser de nesse). À medida que você entrevista uma pessoa = vai ter mais
empregados de modo a auxiliar o pesquisador a fazer interferências uma indicação – de acordo com o julgamento dos seus próprios
confiável. Exemplo:
Procedimento de amostragem
SIMPLES OU RANDÔMICA OU CASUAL OU OCASIONAL: Atribui um número de Só precisamos saber a quantidade de indivíduos, enumerar e realizar o sorteio.
Este tipo de amostragem é mais utilizado quando a população for considerada Ex: Gênero, idade, classe social.
homogênea ↝ Serve para populações com características mais parecidas;
Diferença de por quota e estratificada: a por quota não faz um sorteio e a
Dificuldade: população muito grande gastaria mais tempo, pois teríamos que
estratificada faz.
chegar em todos os indivíduos.
Como calcular?
Utilizada em uma população considerada heterogênea em relação ao atributo Homens (81) Mulheres (99)
estratos.
4. Realizar o sorteio ↝ dentro do estrato ou dentro da população preenchendo SISTEMÁTICA: ordenação natural das unidades.
os espaços reservados para o estrato.
Os elementos precisam estar em ordem.
Ex: Prontuários, quarteirões, fila, prateleira. Obs: O 3 é o i. O segundo número vai ser = i + k; para saber o próximo numero
k = intervalo de amostragem, sendo um número inteiro, faz-se então um sorteio; O sorteio é feito sempre antes para ter mais qualidade;
Constante que dará uma sequencia aritmética da escolha dos indivíduos. A quantidade dos sorteios é decidida através dos princípios da pesquisa.
N = população
Exemplo: Em uma clínica, composta de vários profissionais, são atendidos 40 Pode ser feito com populações homogêneas e heterogenias.
saber a opinião dos pacientes a respeito do atendimento da clínica em uma Como realizar?
determinada semana e fazer uma pesquisa por telefone para saber a opinião de 50
1. Identificar os conglomerados
destes pacientes.
2. Sorteio entre os conglomerados – o pesquisador pode criar os seus critérios.
Não é homogamia, pois de segunda até sexta pode variar o
3. Analisar todos os indivíduos do conglomerado.
comportamento.
O ideal é entrevistar pacientes de cada dia da semana. Exemplo: Bairro de uma cidade; quarteirão é um conglomerado; sorteio; analisa
K = N/n – K = 200/50 – K = 4 19 20 21 22 23 24
3. Sorteio entre: 1, 2, 3, 4.
a. Resultado = 3 (entrar em contato com esse paciente); Pode fazer uma amostragem baseada no mapeamento, pois pode ter um viés
4. Soma + 4 e vai entrevistando sempre somando mais 4. ↝ o sorteio pode ter interferido.
Carol Andrade – Medicina
Distribuição de frequência
Distribuição e divisão; 1 2 3 4 7
INFORMAÇÕES BAGUNÇADAS ↝ INFORMAÇÕES ORGANIZADAS. 3. FREQUÊNCIA simples ou absoluta (f ou fi): é a quantidade de vezes que um
mesmo valor de um dado é repetido.
1. DADOS BRUTOS: são os dados originais que ainda não foram numericamente Quantidade de vezes que algo apareceu.
Número de filhos = N = 25 O 3
2 1 1 3 4 1 5
2 5
3 4 7 8 2
3 4
0 5 5 2 1 4 3
0 0 3 4 6 5 2
6 1
0 1 2 3 5 INTERVALOS
depois do 1 e termina antes 1 e 2 não participam O mais indicado é que a amplitude seja a mesma em todas as classes.
do 2.
PONTO MÉDIO DE UMA CLASSE (Xi): é o ponto que divide o intervalo em duas 6|---| 8 3 0,12
partes iguais.
Ele representa o intervalo de classes. Exemplo: 8/25 = 0,32 ↝ 9/25 = 0,36 ↝ 5/25 = 0,20 ↝ 3/25 = 0,12 ↝ 0,32 + 0,36 +
Como calcular? É a soma da divisão dos valores, ou seja, você soma o intervalo
0,20 + 0,12 = 1.
Nº de filhos x Frequência FREQUÊNCIA ACUMULADA (Fi): é a soma de todas as frequências abaixo do limite
Pode ser uma frequência relativa simples ou porcentagem. FREQUÊNCIA RELATIVA ACUMULADA (Fri): soma de todas as frequências relativas
Compara um valor com o total; anteriores. Ou então pegamos Fi e dividimos pelo total
K = raiz de 25 = 5.
1. Colocar em Rol
Deve-se distribuir tudo em 5 grupos.
2. Frequência (f)
Precisa começar com o primeiro.
3. Subdivisão em classes
Intervalo de classes = 1,5/5 = 0,3
4. Ponto médio (xi)
i Classes Xi Fi Fri Fri % Fi Fri
5. Frequência relativa (fr)
1,66 + 5/25 = 20% 5 5/25 =
6. Frequência acumulada (Fi) 1,96/2 =
1 1,66|---1,96 5 0,2 0,2
7. Frequência relativa acumulada (Fri) 1,81
Interpretacao:
40% das crianças prematuras nasceram com o peso maior ou igual a 1,66 e menor
que 2,26.
ESTATÍSTICA DESCRITIVA
Tabelas Obs: não pode ter uma linha que feixe a tabela.
“forma não discursiva de apresentar informações das quais o dado numérico
Caso feche a tabela ela vai ter uma conformação de quadro.
se destaca como informação Central”.
Quadro 01, 02... é uma ferramenta didática, elemento textual para
PONTOS PRINCIPAIS: números (informação central – não 100%), dados.
apresentar alguma informação extra, dica.
Tabelas de grupamentos simples: mostram os valores obtidos e o numero de
o Cabeçalho separado do restante do texto: Logo após a primeira linha
vezes que cada valor foi observado.
horizontal; precisa ter um destaque de separação (negrito por ex).
Tabelas de grupamentos por intervalo de classes: resumir dados com
o Sem linhas verticais;
valores que variam muito.
o Fonte: utilizada para evitar plagio; aumenta a confiança; segurança (evita a
Ex: Peso, altura – dados quantitativos contínuos (precisamos enxugar).
responsabilidade de um erro);
CONSTITUIÇÃO: Obs: caso o dado for fonte própria, segundo o IBGE e ABNT deve-se
Onde?
2 colunas – variáveis/características – N %
Tabela 5 slide: evolução em longo prazo dos 221 procedimentos – muito vago!
Variáveis qualitativas
componentes.
rodapé dizia que se eles tivessem uma letra maiúscula igual seriam
Exemplo de tabela correta:
estatisticamente iguais.
Obs Importante:
95% grau de confiança; caso ele fizesse 100 vezes esse estudo em 95% das
informações mais visuais, algo mais rápido, algo que você consegue ter
Nunca devemos mostrar gráfico e tabela do mesmo assunto; Representação gráfica para distribuição de dados numéricos, ou seja, um
Que tipos de dados tenho? modelo estatístico para a organização dos dados, exibindo a frequência que
GRÁFICO DE BARRAS (OU DE COLUNAS): Mostra os dados a respeito de classes – mais comum na área de saúde;
Utilizado, em geral, para representar dados de uma tabela de frequências Justapostas = um colado no outro, pois na medida que termina uma classe
Nesse tipo de gráfico, cada barra retangular representa a frequência ou a Mais comum em variáveis quantitativas: peso, largura, comprimento,
relativa. OGIVA:
Gráfico em linha usado para registrar a frequência acumulada.
Carol Andrade – Medicina
O processo de construção é o mesmo usado para o gráfico em linhas. Tempo = principal variável.
Este gráfico é útil para verificar quando os elementos da amostra estão abaixo
Gráfico acumulado;
FREQUÊNCIA ACUMULADA;
GRÁFICO DE SETORES:
Também conhecido como gráfico de pizza;
O 8 representa quem tirou até 4. Utilizado, em geral, para representar partes de um todo – compara uma parte
com o todo.
Frequência relativa.
Obs: para saber o dia subtrai com o anterior. Ex: 31 – 23 = 8 – 8 pessoas acima da
média (7)
Infográficos.
Exemplos:
Carol Andrade – Medicina
MEDIDAS
Tendência Central Média ponderada: para cada valor deve-se levar em conta o valor do seu peso. É
calculada através do somatório das multiplicações entre valores e pesos divididos
Média aritmética: Dado obtido pela soma de todos os e dados e dividido pelo
pelo somatório dos pesos.
número deles. É considerada uma medida de tendência central e é muito utilizada
Temos que analisar o peso.
no cotidiano.
Exemplo: Alcebíades participou de um concurso, onde foram realizadas provas de
Mais utilizada no dia a dia;
Simples de entender; como se pudéssemos distribuir valores e encontrar um Português, Matemática, Biologia e História. Essas provas tinham peso 3, 3, 2 e 2,
ponto comum entre eles; respectivamente. Sabendo que tirou 8,0 em Português, 7,5 em Matemática, 5,0 em
Todos os números têm o mesmo peso, mas com frequências (fi) diferentes. Biologia e 4,0 em História, qual foi a média que ele obteve?
Símbolo da média: 8,3 + 7,5.3 + 5.2 + 4.2 / Soma dos pesos = 64,5 / 10 = 6,5
Serve para demonstrar que é possível isso acontecer, mas é recomendável Para calcular:
dizer o porquê que isso aconteceu.
Outlier positivo: Média + 2 x DP o outlier seria o próximo número.
Sempre estar localizado no inicio ou no final dos números.
Outlier negativo: Média – 2 x DP
Pode ser também indicativo de erro, ou seja, precisamos saber a plausibilidade
Observação: só calculamos o outlier negativo quando pede na questão.
dos dados.
Exemplo: Mediana: É o valor numérico que separa a parte superior dos dados da parte
Obs: O outlier não vai influenciar tanto quando tiver a presença de muitos dados, Valor que separa o conjunto de dados maior e menor.
ricas, pois mais da metade da população aprenda renda mensal de 1.1 mil reais.
14
valores mais frequentes, ou ainda "o valor que ocorre com maior frequência num
R: Média: 1 + 3 + 6 + 8 + 10 + 11/2 = 19,5. Mediana: 6 + 8/2 = 7 Conseguimos ter uma moda de nome de pessoas por ex, porem não
Obs: A mediana é muito forte na presença de valores extremos, enquanto que a 3. A série {1, 3, 2, 5, 8, 7, 9} não apresenta moda (AMODAL).
Ou seja: Amplitude:
□ Modal =Uma moda;
Quando a média não é suficiente para avaliar um conjunto de dados, é
□ Bimodal = Duas modas;
necessário saber como a média varia ou como ela se dispersa do conjunto de
□ Multimodal = + de 2 modas;
valores da população ou amostra.
□ Amodal = Nenhuma moda.
Medida de dispersão mais simples; Leva em consideração os extremos;
Exemplos:
Diferença entre o maior número e menor; Precisamos ter um ponto central.
1. Idade de 20 alunos do 6º ano {12, 11, 12, 13, 12, 11, 13, 12, 12, 11, 14, 13, 13, Outlier interfere muito nesse parâmetro, pois tratamos com o extremo.
12, 11, 12, 13, 14, 11, 14}. Não é a mais utilizada.
R: 7
Variância:
1. Pega todos os valores e eleva o quadrado.
Consideracoes: Um conjunto de observações terá somente uma média e uma 2. Soma os valores.
mediana, mas poderá não ter moda ou ser mais de uma. Obs: Eleva ao quadrado, pois a soma da diferença dos valores da media somada
Dado amostral = n -1
quadrado.
s² (S ao quadrado) = amostra Desvio padrão: Com estes dados podemos estabelecer o desvio padrão, que é a
μ (Mi) = media da população;
raiz quadrada da variância.
̅ (X barra) = media da amostra.
Raiz quadrada da variância.
Carol Andrade – Medicina
Para diminuir a interferência final do que elevamos ao quadrado. Ou seja, para ser um outlier negativo o valor precisa ser abaixo de 0,08.
Dp2 = √ 11,76 =3,42 (maior desvio = mais irregular – maior variação das notas Ou seja, para ser considerado outlier precisa ser acima de 10,36 ou abaixo de
Média; +/-, pois teve valores abaixo e acima da média; Desvio padrão. negativo e o que é um outlier positivo.
Aluno1 = 5,2±2,56 Exemplo: No caso para o aluno 1 não teríamos outlier, pois ele teria ter que
Aluno2 = 6,2±3,42
tirar acima de 10 ou abaixo de 0, nesse caso isso não poderia acontecer.
Quem teve o desempenho mais regular? O desvio padrão nesse caso foi muito alto, pois o n foi pequeno.
Comparando o aluno 1 com o aluno 2 = dentro da mesma média de 10 = o aluno Ou seja,
1 apresenta melhor desvio padrão. n interferência do desvio padrão.
Só podemos comparar, pois estão na mesma unidade e escala.
Resumindo:
Quando mais próximo de 0 = mais regular é o sistema / desvio padrão.
7, 7, 7, 7 – desvio padrão = 0.
Observacao:
1. Elevamos todos os números ao quadrado: 15, 21; 7,29; 7,84; 9,61; 12,25;
15,21; 7,29.
2. Soma todos os valores = 74,7
3. Dividimos os valores por n-1 = 74,7/7-1 = 12,45 A pulsação é mais estável do que o ácido úrico?
2
4. Pegamos a média e elevamos ao quadrado = 3,2286 = 10,4238658;
5. Multiplicamos esse valor por n = 10,4238658 x 7 = 72,97 R: CVp = 8,7/68,7 = 7,896 = +/- 79%
6. Dividimos o resultado por n – 1 = 72,97/6 = 12,1616.
CVa = 5,56 / 1,03 = 5,398 = +/- 54%
7. Calculamos a variância = resultado do primeiro calculo – resultado do
Não, pois quanto menor o CV mais homogêneo é o conjunto de dados, então o
segundo = 12,45 – 12,1616 = 0,2883. ácido úrico é mais,
8. Caso precise calcular o desvio padrão é só pegar o valor da variância e
tirar a raiz = √0,2883 = 0,537
Média = x
Exemplo:
Quanto mais próximo da média = mais estável. Faixas vermelhas 95% de chances das crianças estarem dentro dessas faixas.
Cartão de vacinação: podemos fazer o acompanhamento do crescimento e Abaixo da faixa vermelha 2,5% de chances
desenvolvimento. Uma coisa que acontece menos de 3 vezes na faixa de 100% raro de
TIPOS DE DISTRIBUIÇÃO
Simetria: um lado igual ao outro.
Distribuição de dados quando o lado esquerdo é muito igual ao direito. Gráfico Histograma: cada coluna representa uma classe, como cada uma das
Uma distribuição que de modo geral temos valores bem parecidos para moda, classes acaba e começa a outra elas teriam que ser justapostas uma colada na
media e mediana. outra.
Eixo que indica que o formato de distribuição é o mesmo à esquerda e à
direita.
Exemplo: valor de referencia do colesterol correlação com o gráfico. O nosso Caso a gente faça um risco no meio, diríamos que é uma distribuição simétrica,
outro.
Carol Andrade – Medicina
Média pegar de quem tem mais para quem tem menos para que todos fiquem
Gráfico laranja: enviesamos a curva para direita, trazendo uma nova curva de
Terceiro gráfico: um dado muito distante, cortaríamos a simetria, pois um lado não dados. Seria uma assimetria positiva, pois ela aumentou a média a média
estaria igual ao outro. que estava no meio, vai ser deslocada para o lado do outlier.
A simetria em torno de um eixo indica que o formato da distribuição é o Na distribuição assimétrica não temos uma igualdade – simetria, acontece quando
mesmo à esquerda e à direita desse eixo. temos um outlier ou então quando temos uma concentração de dados maior de
Se uma distribuição é simétrica então a média é o seu ponto de simetria, um lado do que no outro por exemplo.
indicando que intervalos de mesma magnitude à esquerda e à direita da média Positiva: leva a média para o lado direito = aumentou a média.
têm as mesmas concentrações de valores. Gráfico laranja: distribuição assimétrica, não podemos cortar o gráfico em duas
Gráficos azuis: gráfico do meio é um gráfico bimodal – a média seria as pontas. porções iguais. Mostra mais ou menos a distribuição de renda no Brasil – a maior
Curva em U. parte da população tem uma renda menor e a menor parte da população tem uma
renda maior.
Exemplo: Curva de potássio: pacientes com câncer de próstata apresentam uma o Primeiro gráfico: o valor de desvio para cima é igual ao de baixo.
o Seguindo gráfico: desvio mais para cima = mais para o lado positivo =
concentração baixa de potássio, onde os níveis normais são mais altos.
presença dos três pontinhos vermelhos = outlier = valores
Pacientes com câncer de próstata tem uma assimetria positiva e quem não tem
discrepantes.
uma assimetria negativa.
o Terceiro gráfico: desvio para baixo = teria três pontinhos vermelhos
para baixo.
É uma distribuição contínua e simétrica, cujo gráfico tem a forma de um sino. A área mede 100% area acima da média = 50% simétrica.
probabilidade.
5. Aproximadamente:
desvio.
R: 95, 44%.
1. Qual é a chance de termos valores entre 90 e 95?
padrão.
R: Entre 80 e 100 = +/- 95%; falta 5 para 100% 2,5 para cada lado = chance
de ser acima de 100 = 2,5% e abaixo de 80 = 2,5% = curva que não é comum
de acontecer.
2. A chance de ter entre 90 – 85?
R: 34, 13. A curva mede 100% até 105 temos 99,773 – quanto falta para 100% = 0,27
3. Qual é a probabilidade de termos um paciente com valores de 85% – 0,135 para um lado e 0,135 para o outro.
95%? Caso não for uma curva tranquila faremos Z = (x- µ)/ σ
R: 68,26%.
R: Teremos meio desvio. Não teremos 34,13, pois é exponencial – não é linear.
o Ex.: Quando z = (isto é, igual σ) a área é 0,3413 ou 34,13% Olhamos a tabela (sempre vem na prova) = para 1,55 = para sair do
o Transformação de x em z Z = (x- µ)/ σ ponto 0 e me distanciar até 1,55 desvio padrões teremos uma área de
desvio de 6 cm?
Z = desvio padrão = 1,55 desvios padrões;
Z = distribuição normal.
sigma cálculo usamos Z que vai nos dar a área. A curva completa mede
Distribuição normal = precisa dizer, caso não venha = não pdoemos
1 ou 100%;
fazer esse cálculo.
Ele quer um z acima de 1,55 área III;
Curva de distribuição normal = curva em formato de sino com desvio
Com isso teremos 3 áreas marcadas no gráfico área 1, 2 e 3.
= 6, a média como ponto central = 1,75. Todo o valor de desvio acima
Área I = 50% metade da área que é 100% A curva =1, cada lado
dessa média será 0.
0,5;
Teremos 3 áreas:
Área II + Área III = 50;
Carol Andrade – Medicina
o Área I = 50%
o Área II precisamos calcular o Z para saber essa área; 2. O histograma a seguir representa dados de uma determinada amostra, sendo
o Área III = 50 – Área II que, no eixo horizontal, estão representados os pontos médios das classes, todas
Calculamos o Z; com a mesma amplitude e, no eixo vertical, as frequências relativas, com seus
Z = (x- µ)/ σ respectivos valores em cada classe. Qual a porcentagem de indivíduos entre 3,75 e
Z =180 (ponto em que eu quero chegar) – 175 (média) / 6 (desvio) 4,75 é:
Z = 5/6 = 0,83 Temos menos de 1 desvio Área = 0,2967%;
Exemplos:
R = 3,75 4,75 = 15 + 15/100 = 33%
1.Triglicerídeos são uma forma de gordura que circula na corrente sanguínea e é
armazenada no tecido adiposo do corpo. O nível alto de triglicerídeos está 3.Os valores de referência para os níveis de hemoglobina para homens e mulheres
associado a um aumento no risco de doenças do coração. Os níveis para que uma tem diferentes faixas, sendo 13 a 17,5 g/dL para homens e 13,2 a 15,6 g/dL para as
pessoa esteva com valores normais triglicerídeos tem que ser menor que 150 mulheres. Em uma determinada população foi mensurado os níveis de
mg/dL. Sabendo que em determinada população foram mensurados os hemoglobina das mulheres, sabendo que os resultados demonstraram ter
triglicerídeos, que os resultados demonstraram ter distribuição normal, com média distribuição normal, com média igual a 14,0 g/dL e desvio padrão de 1,6 g/dL.
igual a 149 mg/dL e desvio padrão de 5 mg/dL. Qual a probabilidade de um Qual a probabilidade, em porcentagem, de um indivíduo pertencente a esta
indivíduo pertencente a esta população está com até 150 mg/dL? população está dentro dos valores de referência (Z0,5=0,1915; Z1=0,3413;
(Z0,2=0,0793; Z1=0,3413; Z1,2=0,3849 Z2=0,4772). Z1,35=0,4115; Z2=0,4772).
TABELA
A tabela não indica as pontas, mas sempre a distancia da media para onde
queremos chegar.
Observações
Dados coletados de prontuários não necessariamente são do tipo A variância de um conjunto de dados que não varia, ou seja, cujos
secundário. valores são uma constante, é zero.
Uma das vantagens de se estabelecer uma pergunta a respeito do Para representar os dados em um gráfico chamado de XXXXX é
problema investigado é aumentar a facilidade em escolher o teste necessário que os valores estejam em porcentagem. Assim,
estatístico. devemos definir a frequência relativa dos dados observados. O
A estatística pode ser dividida em descritiva e inferencial. A interessante desse gráfico e que podemos mais facilmente
inferencial também pode ser chamada de indutiva e sua base está comparar a parte com o todo Gráfico de setores.
alicerçada em cálculos de probabilidades. Outra característica deste
tipo de estatística é tomar decisões sobre a população baseado nos Fontes: Slides Prof. Thiago Araújo
dados das amostras.