Bioestatística

Profa Claudia M. G. G. Franchi

APOSTILA DE BIOESTATÍSTICA

Curso: Tecnologia em Radiologia Médica

Profa. Claudia Franchi

1

Bioestatística

Profa Claudia M. G. G. Franchi

Sumário
1. Capítulo 1 – Noções Básicas ........................................................................................... 5 1.1. Variáveis ...................................................................................................................... 5 1.2. 1.3. 1.4. 1.4.1. 1.4.2. 1.4.3. 1.4.4. 1.5. 2. Apuração de Dados ..................................................................................................... 5 População e Amostra .................................................................................................. 6 Técnicas de Amostragem ............................................................................................ 6 Amostra Casual Simples ......................................................................................... 6 Amostra Sistemática ................................................................................................ 7 Amostra Estratificada .............................................................................................. 7 Amostra de Conveniência........................................................................................ 8 Exercícios – Capítulo 1 ................................................................................................ 8

Capítulo 2 - Apresentação de Dados em Tabelas ....................................................... 10 2.1. Componentes das Tabelas ........................................................................................ 10 2.2. 2.3. Tabelas de Contingência ........................................................................................... 11 Exercícios – Capítulo 2 .............................................................................................. 12

3.

Capitulo 3 - Tabelas de Distribuição de Frequências................................................... 13 3.1. Tabela primitiva ou dados brutos: .............................................................................. 13 3.1.1. 3.2. 3.3. 3.4. ROL ....................................................................................................................... 13 Distribuição de frequência sem intervalos de classe .................................................. 13 Distribuição de frequência com intervalos de classe .................................................. 13 Exercícios – Capítulo 3 .............................................................................................. 17

4.

Elementos de uma distribuição de frequência (com intervalos de classe) ................ 20 4.1. Classe ....................................................................................................................... 20 4.2. 4.3. 4.4. 4.5. 4.6. 4.7. Limite superior e limite inferior da classe ................................................................... 20 Amplitude de classe................................................................................................... 20 Amplitude total da distribuição ................................................................................... 20 Amplitude total da amostra (ROL) .............................................................................. 21 Ponto Médio de classe............................................................................................... 21 Exercícios – Capítulo 4 .............................................................................................. 21

5.

GRÁFICOS ESTATÍSTICOS ............................................................................................ 24 5.1. Gráfico de Barras....................................................................................................... 24 5.2. 5.3. 5.4. 5.5. Gráfico de Colunas .................................................................................................... 25 Gráfico de Setores ..................................................................................................... 25 Gráfico de Linhas....................................................................................................... 26 Exercícios – Capítulo 5 .............................................................................................. 27

6.

REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO ............................................... 28 6.1. Histograma ................................................................................................................ 28 6.2. 6.3. Polígono de Frequências ........................................................................................... 28 Exercícios – Capítulo 6 .............................................................................................. 29
2

Bioestatística

Profa Claudia M. G. G. Franchi

7.

MEDIDAS DE POSIÇÃO .................................................................................................. 30 7.1. Introdução.................................................................................................................. 30 7.2. 7.2.1. 7.2.2. 7.2.3. 7.2.4. 7.3. 7.3.1. 7.4. 7.5. 7.5.1. 7.5.2. 7.5.3. 7.5.4. 7.6. 7.7. 7.7.1. 7.7.2. 7.7.3. 7.8. 7.8.1. 7.9. 7.10. Média Aritmética: ................................................................................................... 30

Dados não agrupados ........................................................................................... 30 Desvio em relação à média: .................................................................................. 30 Propriedades da média aritmética ......................................................................... 31 Dados agrupados sem intervalo de classe ............................................................ 31 Exercícios – Capítulo 7 .............................................................................................. 32 Dados agrupados com intervalo de classe ............................................................ 33 Exercícios: ................................................................................................................. 34 MODA - Mo .............................................................................................................. 35 Dados não agrupados ........................................................................................... 35 Dados agrupados sem intervalo de classe ............................................................ 35 Dados agrupados com intervalo de classe ............................................................ 36 Cálculo da Moda: Método mais elaborado pela fórmula de CZUBER: ................... 36 Exercícios: ................................................................................................................. 37 MEDIANA ............................................................................................................ 38

Dados não agrupados ........................................................................................... 38 Dados agrupados .................................................................................................. 39 Dados Agrupados sem intervalo de classe ............................................................ 39 Exercícios: ................................................................................................................. 39 Dados Agrupados com intervalos de classe .......................................................... 41 Resolva: .................................................................................................................... 42 Exercícios – Capítulo 7 .............................................................................................. 43

8.

Medidas de Dispersão ou de Variabilidade ................................................................... 47 8.1. Dispersão ou variabilidade ......................................................................................... 47 8.2. 8.2.1. 8.2.2. 8.2.3. 8.3. 8.3.1. 8.4. 8.4.1. 8.5. 8.5.1. 8.6. 8.7. 8.8. Amplitude Total .......................................................................................................... 48 Dados não agrupados ........................................................................................... 48 Dados agrupados sem intervalo de classe ............................................................ 48 Dados agrupados com intervalo de classe ............................................................ 49 Variância / Desvio padrão ...................................................................................... 49 Dados não agrupados ........................................................................................... 51 Resolva: .................................................................................................................... 51 Dados Agrupados sem intervalo de classe ............................................................ 52 Exercícios: ................................................................................................................. 53 Dados Agrupados com intervalo de classe ............................................................ 54 Exercícios: ................................................................................................................. 54 Coeficiente de Variação ............................................................................................. 55 Exercícios – Capítulo 8 .............................................................................................. 56
3

Bioestatística

Profa Claudia M. G. G. Franchi

9.

Bibliografia ...................................................................................................................... 58

4

Bioestatística

Profa Claudia M. G. G. Franchi

1.

CAPÍTULO 1 – NOÇÕES BÁSICAS

Nas áreas médicas, biológicas e engenharias, coletam-se dados de pessoas, de animais experimentais e de fenômenos físicos e químicos. Interessam aos pesquisadores dessas áreas, dados sobre mortalidade infantil, eficiência de medicamentos, incidência de doenças, causa de morte, etc. Os dados referem-se a variáveis que são classificadas em Estatística, como qualitativas, ordinais e quantitativas.

1.1.

Variáveis

Em estatística, uma variável é um atributo mensurável que tipicamente varia entre indivíduos. As variáveis são divididas em qualitativas e quantitativas.  Variável Quantitativa - São aquelas que são numericamente mensuráveis, por exemplo, a idade, a altura, o peso. Estas ainda se subdividem em:

Variável Quantitativa Contínua: São aquelas que assumem valores dentro de um conjunto contínuo, tipicamente os números reais. São exemplos, o peso ou a altura de uma pessoa.  Variável Quantitativa Discreta: São aquelas que assumem valores dentro de um tempo finito ou enumerável, tipicamente números inteiros. Um exemplo é o número de filhos de uma pessoa.

Variável Qualitativa - São aquelas que se baseiam em qualidades e não podem ser mensuráveis numericamente. Estas ainda se subdividem em:

Variável Qualitativa Ordinal: São aquelas que podem ser colocadas em ordem, por exemplo, a classe social (A,B,C,D, ou E) e a variável "Peso" medida em 3 níveis (pouco pesados, pesados, muito pesados). São variáveis qualitativas ordinais também, grau de instrução, status social, estágio da doença.  Variável Qualitativa Nominal: São aquelas que não podem ser hierarquizadas ou ordenadas, como a cor dos olhos, o local de nascimento, peso, altura.

1.2.

Apuração de Dados

Os dados são registrados em fichas, com várias outras informações. Para obter apenas os dados é preciso fazer uma apuração. Se a variável é qualitativa ou ordinal, a apuração resume-se a simples contagem. Por exemplo, para obter o número de nascidos vivos de cada sexo, é preciso tomar os prontuários e escrever numa folha de papel: Feminino Masculino Depois, é preciso examinar os prontuários e fazer um traço, na linha correspondente a um dos sexos, toda vez que o prontuário registrar que o nascido vivo é desse sexo. No exemplo, cada traço representa um nascido vivo e cada quadrado, cortado pela diagonal, representa cinco nascidos vivos. O total é dado pelo número de traços de cada linha. Feminino Masculino = 52 = 48
5

Bioestatística

Profa Claudia M. G. G. Franchi

Se a variável é quantitativa, a apuração consiste em anotar cada valor observado. Por exemplo, para apurar dados de peso ao nascer, basta escrever os pesos, uma folha de papel. O número do prontuário, escrito ao lado do peso ao nascer, facilita a posterior verificação da apuração. Veja o exemplo:
Número do Prontuário 10.525 10.526 ..... ..... ..... 10.624 Peso ao nascer 3,25 2,00 ..... ..... ..... 3,20

1.3.

População e Amostra

Entende-se por população, o conjunto de elementos que têm em comum, determinada característica. Todo subconjunto não vazio e com menor numero de elementos do que a população constitui uma amostra dessa população. As populações podem ser finitas, como o conjunto de alunos de uma escola em determinado ano ou, infinitas, como o número de vezes que se pode jogar um dado. Para certas finalidades, as populações finitas muito grandes são consideradas infinitas. Como exemplo, considere as pessoas do sexo masculino com mais de 35 anos de idade, residentes na cidade de São Paulo. O número dessas pessoas é matematicamente finito, mas tão grande que um registrador ao analisar uma amostra de 500 pessoas, pode considerar a população como infinita. Os pesquisadores trabalham com amostras, por vários motivos. Primeiro, é fato que as populações finitas só podem ser estudadas através de amostras. Por exemplo, por maior que seja o número de vezes que uma pessoa possa pesar um corpo sólido, o resultado será sempre uma amostra por que, teoricamente, todo corpo pode ser pesado um número infinito de vezes. Depois, as populações finitas muito grandes só podem ser estudadas através de amostras. Por exemplo, o número de cobaias existentes no mundo em determinado período é, matematicamente, finito, mas as pesquisas que usam cobaias só podem ser feitas com amostras, por que nenhum pesquisador dispõe de todas as cobaias do mundo para o seu trabalho. Finalmente, o estudo cuidadoso de uma amostra tem mais valor científico do que o estudo sumário de toda a população. Por exemplo, para estudar o efeito do flúor sobre a prevenção de cáries em crianças, é melhor submeter uma amostra de crianças a exames periódicos minuciosos, do que examinar rapidamente todas as crianças antes, e determinado tempo após o uso do flúor.

1.4.

Técnicas de Amostragem

Definida a população, é preciso estabelecer a técnica de amostragem, isto é, o procedimento que será adotado para escolher os elementos que irão compor a amostra. Conforme a técnica utilizada, tem-se um tipo de amostra.

1.4.1. Amostra Casual Simples
A amostra casual simples é composta por elementos retirados ao acaso da população. Então todo elemento da população tem igual probabilidade de ser escolhido para a mostra. Um exemplo ajuda a entender essa técnica de amostragem.
6

Bioestatística

Profa Claudia M. G. G. Franchi

Imagine que um professor quer obter uma mostra casual simples dos alunos de sua escola. Para isso, pode organizar um sorteio com fichas numeradas, de zero a nove. Para fazer o sorteio, o professor retira uma ficha de uma urna e anota o número. Esse número será o primeiro dígito do número do aluno que será sorteado para a amostra. Feito isso, o professor recoloca a ficha na urna, mistura, retira outra ficha e anota o número, que será o segundo dígito do número do aluno que será sorteado para a amostra. Esse procedimento deve ser repetido até que sejam retirados todos os dígitos do número do aluno sorteado. Se a escola tem, por exemplo, 832 alunos, os números dos alunos têm três dígitos. Para sortear um aluno, é preciso retirar três fichas da urna, uma de cada vez, sempre lembrando que a ficha retirada deve ser recolocada na urna antes de nova retirada. O número de um dos alunos sorteados poderia ser, por exemplo, 377 assim obtido: Primeira ficha: 3 Segunda ficha: 7 Terceira ficha: 7 É claro que devem ser desprezados números maiores do que 832 (se a escola tem 832 alunos, nenhum aluno recebeu número maior do que 832), números que já foram sorteados e o número 000. O professor sorteia tantos números quantos são os alunos que ele quer na amostra.

1.4.2. Amostra Sistemática
Na amostra sistemática, os elementos são escolhidos não por acaso, mas por um sistema. No exemplo, o professor terá organizado uma amostra sistemática se, em lugar de sortear os alunos, chamar para a amostra todo aluno com número terminado em determinado dígito. Veja o esquema dado em seguida. O professor chamou, para a amostra, todos os alunos com números terminados em zero, assinalados no esquema com asteriscos. Então organizou uma amostra sistemática.
N
o

Nome

N

o

Nome

N

o

Nome

1 . . *10 . . *20

21 . . *30 . . *40

41 . . *50 . . *60

Quando a população está organizada, é mais fácil obter uma amostra sistemática do que uma amostra casual simples. Por exemplo, para obter uma amostra de 2% dos prontuários dos pacientes de uma clínica, é mais fácil pegar o último de cada 50 prontuários do que fazer um sorteio até conseguir 2% do total de prontuários. As amostras sistemáticas são muito usadas, mas exigem especial preocupação com o sistema de seleção. Por exemplo, se os elementos da população estão em fila, não se devem selecionar os “primeiros”, ou os “últimos”, nem mesmo “os do meio”, é preciso percorrer toda a fila e escolher, por exemplo, o décimo de cada grupo de dez.

1.4.3. Amostra Estratificada
A amostra estratificada é composta por elementos provenientes de todos os estratos da população. No exemplo, se o professor considera que os alunos de diferentes séries apresentam reais
7

Bioestatística

Profa Claudia M. G. G. Franchi

diferenças, cada série é um estrato. O professor deve então, obter uma amostra de cada série (estrato) e depois reunir todas as amostras, em uma só. Essa amostra final é estratificada. Devem ser obtidas amostras estratificadas sempre que a população for constituída por diferentes estratos. Por exemplo, se as pessoas que residem nos vários bairros de uma cidade são diferentes, cada bairro é um estrato. Para obter uma amostra de pessoas dessa cidade, seria razoável obter uma amostra de cada bairro e depois reunir todas as informações numa amostra estratificada.

1.4.4. Amostra de Conveniência
A amostra de conveniência é formada por elementos que o pesquisador reuniu simplesmente por que dispunha deles. Então, se o professor tomar os alunos de sua classe como amostra de toda a escola, estará usando uma amostra de conveniência. Os estatísticos têm muitas restrições ao uso de amostras de conveniência. Mesmo assim, as amostras de conveniência são comuns na área de saúde, onde se fazem pesquisas com pacientes de uma só clínica ou de um só hospital. Mais ainda, as amostras de conveniência constituem muitas vezes a única maneira de estudar determinado problema. De qualquer forma, o pesquisador que utiliza amostras de conveniência precisa de muito sendo crítico. Os dados podem ser tendenciosos. Por exemplo, para estimar a probabilidade de morte por desidratação não se deve recorrer aos dados de um hospital. Como só são internados os casos graves, é possível que a mortalidade entre pacientes internados seja muito maior do que entre pacientes não internados. Consequentemente, a amostra de conveniência – constituída, neste exemplo, por pacientes internados no hospital – seria tendenciosa. Finalmente, o pesquisador que trabalha com amostras sempre pretende fazer inferência, isto é, estender os resultados da amostra para toda a população. Então é muito importante caracterizar bem a amostra e estender os resultados obtidos na amostra apenas para a população de onde a amostra proveio.

1.5.

Exercícios – Capítulo 1

1. Os prontuários dos pacientes de um hospital estão organizados em um arquivo, por ordem alfabética. Qual é a maneira mais rápida de amostrar 1/3 do total dos prontuários? 2. Um pesquisador trem dez gaiolas que contém cada uma, seis ratos. Como o pesquisador pode solucionar dez ratos para a mostra? 3. Para levantar dados sobre o número de filhos por casal, em uma comunidade, um pesquisador organizou um questionário que enviou, pelo correio, a todas as residências. A resposta ao questionário era facultativa, pois o pesquisador não tinha condições de exigir a resposta. Nesse questionário perguntava-se o número de filhos por casal morador na residência. Você acha que os dados assim obtidos têm algum tipo de tendenciosidade? 4. Um pesquisador pretende levantar dados sobre o número de moradores por domicílio usando a técnica de amostragem sistemática. Para isso, o pesquisador visitará cada domicílio selecionado. Se nenhuma pessoa estiver presente na ocasião da visita, o pesquisador excluirá o domicílio da amostra. Esta última determinação introduz tendenciosidade? Por quê? 5. Muitas pessoas acreditam que as famílias se tornaram menores. Suponha que, para estudar essa questão, foi selecionada uma amostra de 2.000 casais e perguntou-se quantos filhos eles tinham, quantos filhos tinham seus pais e quantos filhos tinham seus avós. O procedimento introduz tendenciosidade nos dados? Por quê?
8

Bioestatística

Profa Claudia M. G. G. Franchi

6. Dada uma população de 4 indivíduos, X, W, Y, Z, quantas amostras casuais simples de tamanho 2 podem ser obtidas? Quais são essas amostras? 7. Dada uma população de 8 elementos, A, B, C, D, E, F, G, e H, descreva três formas diferentes de obter uma amostra sistemática de 4 elementos. 8. Dada uma população de 40 alunos, descreva uma forma de obter uma amostra casual simples de 6 alunos. 9. Organize uma lista com 10 nomes de pessoas em ordem alfabética. Depois escreva uma forma de obter uma amostra sistemática de 5 indivíduos. 10. Em uma pesquisa de mercado para serviços odontológicos tomou-se a lista telefônica, onde os nomes dos assinantes estão organizados em ordem alfabética do último sobrenome, e se amostrou o décimo de cada 10 assinantes. Critique esse procedimento. 11. Classifique as variáveis em qualitativa (nominal ou ordinal) e quantitativa (discreta ou contínua) e dê exemplo de um valor (numérico ou não numérico) para cada item. a) b) c) d) e) f) g) h) i) Estado civil de uma pessoa: Marcas de carros em um estacionamento: Salário de um funcionário de uma empresa: Número de acidentes de trabalho em uma empresa: Cor dos cabelos das modelos de uma agencia de modelos: Cor dos olhos: Grau de instrução: Número de filhos de um casal: Peso e altura dos alunos de uma escola:

9

Bioestatística

Profa Claudia M. G. G. Franchi

2.

CAPÍTULO 2 - APRESENTAÇÃO DE DADOS EM TABELAS

Os dados devem ser apresentados em tabelas construídas de acordo com as normas técnicas ditadas pela Fundação Instituto Brasileiro de Geografia e Estatística – IBGE.

2.1.

Componentes das Tabelas

As tabelas têm título, corpo, cabeçalho e coluna indicadora. O título explica o que a tabela contém. O corpo é formado pelas linhas e colunas de dados. O cabeçalho especifica conteúdo das colunas, e a coluna indicadora especifica o conteúdo das linhas. Como exemplo, veja a tabela a seguir:
População brasileira residente, com 15 anos e mais, segundo a alfabetização, de acordo com o senso demográfico de 1980

Alfabetização Sabem ler e escrever Não sabem ler e escrever Sem declaração
Fonte: IBGE (1988)

Frequência 54.793.268 18.716.847 31.828

Na tabela acima, observe o título:
População brasileira residente, com 15 anos e mais, segundo a alfabetização, de acordo com o senso demográfico de 1980

O cabeçalho é constituído pelas palavras: Alfabetização A coluna indicadora é constituída pelas especificações: Sabem ler e escrever Não sabem ler e escrever Sem declaração O corpo da tabela é formado pelos números: 54.793.268 18.716.847 31.828 Frequência

As tabelas podem apresentar, além das frequências, as frequências relativas e o total. Para obter a frequência relativa de uma dada categoria, divide-se a frequência dessa categoria pela soma das frequências. O resultado, multiplicado por 100, é uma porcentagem. O total da coluna é escrito entre dois traços horizontais.

10

Bioestatística

Profa Claudia M. G. G. Franchi

População brasileira residente, com 15 anos e mais, segundo a alfabetização, de acordo com o senso demográfico de 1980 Alfabetização Sabem ler e escrever Não sabem ler e escrever Sem declaração Total.......................................................
Fonte: IBGE (1988)

Frequência 54.793.268 18.716.847 31.828 73.541.943

Frequência Relativa 74,51 25,45 0,04 100,00

As tabelas podem conter fonte ou notas. A fonte dá indicação da entidade, ou do pesquisador, ou dos pesquisadores que publicaram ou forneceram os dados. Como exemplo na tabela citada como exemplo, a fonte é o IBGE, pois foi essa fundação que publicou os dados. As notas devem esclarecer aspectos relevantes do levantamento dos dados ou da apuração. Observe a tabela abaixo. A nota informa que só foram apurados nascimentos ocorridos no ano de registro. Nascidos vivos registrados segundo o ano do registro Ano do Registro 1984 1985 1986
Fonte: IBGE (1988) Nota: Nascimentos ocorridos no ano de registro

Frequência 2.559.038 2.619.604 2.779.253

2.2.

Tabelas de Contingência

Muitas vezes os elementos da amostra ou da população são classificados de acordo com dois fatores. Os dados devem então ser apresentados em tabelas de contingência, isto é, em tabelas de dupla entrada, cada entrada relativa a um dos fatores. Como exemplo, veja a tabela abaixo que representa o número de nascidos vivos registrados. Note que eles estão classificados segundo dois fatores: o ano de registro e o sexo.

Nascidos vivos registrados segundo o ano de registro e o sexo Ano de Registro 1984 1985 1986 Sexo Masculino 1.307.758 1.339.059 1.418.050 Feminino 1.251.280 1.280.545 1.361.203 Total 2.559.038 2.619.604 2.779.253

Fonte: IBGE (1988) Nota: Nascimentos ocorridos no ano de registro

As tabelas de contingência podem apresentar frequências relativas, além de frequências simples. As frequências relativas dão estimativas de riscos, isto é, dão estimativas de probabilidades de dano. Veja o exemplo abaixo:
11

Bioestatística

Profa Claudia M. G. G. Franchi

Recém-nascidos Segundo a Época do Ataque de Rubéola na Gestante e a Condição de Normal ou Defeituoso
Época do ataque Condição Total Frequência Relativa de defeituosos

Até o 3º mês Depois do 3º mês
Fonte: HILL et all. (1958)

Normal 36 51

Defeituoso 14 3

50 54

28,0% 5,6%

As frequências relativas apresentadas na tabela acima estimam o risco de um recém-nascido ser defeituoso em função da época em que a gestante foi atacada de rubéola. Note que a frequência relativa de defeituosos (risco) é maior quando a gestante foi atacada de rubéola no primeiro trimestre da gestação. Diz-se então que a época do ataque de rubéola é um fator de risco na ocorrência de recémnascidos defeituosos.

2.3.

Exercícios – Capítulo 2

1. Faça uma pesquisa sobre os dados dos seus colegas de sala e monte tabelas com as seguintes variáveis: a. b. c. d. e. f. g. Idade Sexo Cidade de Residência Idade Número de Filhos Estado Civil Número de Irmãos

12

Bioestatística

Profa Claudia M. G. G. Franchi

3.

CAPITULO 3 - TABELAS DE DISTRIBUIÇÃO DE FREQUÊNCIAS

É um tipo de tabela que condensa uma coleção de dados conforme as frequências (repetições de seus valores).

3.1.

Tabela primitiva ou dados brutos:

É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma ideia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

3.1.1. ROL
É a tabela obtida após a ordenação dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

3.2.

Distribuição de frequência sem intervalos de classe

É a simples condensação dos dados conforme as repetições de seu valores. Para um ROL de tamanho razoável esta distribuição de frequência é inconveniente, já que exige muito espaço. Veja exemplo abaixo:
Dados 41 42 43 44 45 46 50 51 52 54 57 58 60 Total Frequência 3 2 1 1 1 2 2 1 1 1 1 2 2 20

3.3.

Distribuição de frequência com intervalos de classe

Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores em vários intervalos de classe.
13

Bioestatística Classes 41 45 3 45 49 53 57 49 4 53 1 57 5 61 Total 20 Frequências 7

Profa Claudia M. G. G. Franchi

As tabelas com grande número de dados são cansativas e não dão ao leitor visão rápida e global do fenômeno. Para isso, é preciso que os dados estejam organizados em uma tabela de distribuição de frequências. A partir de agora, explicaremos passo a passo, a construção desse tipo de tabela usando, como exemplo os dados na tabela Peso ao nascer de nascidos vivos em quilogramas. Imagine que, para dar uma ideia sobre o peso ao nascer de nascidos vivos, o pesquisador irá apresentar não os pesos observados, mas o número de nascidos vivos por faixas de peso. Deve, então, construir uma tabela de distribuição de frequências. Peso ao nascer de nascidos vivos, em quilogramas
2.522 2.720 3.125 2.250 3.220 3.000 3.725 2.890 3.110 3.520 3.100 3.200 2.780 3.155 2.150 3.300 3.250 3.200 3.720 2.800 2.900 2.950 2.480 3.800 2.500 3.550 3.000 4.100 3.200 3.450 3.100 3.150 2.800 2.900 1.900 3.600 3.200 3.300 2.900 2.500 3.600 2.500 2.300 2.950 3.000 3.750 3.150 3.200 2.500 2.900 3.200 4.100 2.400 2.700 2.450 3.400 2.400 3.120 3.400 3.200 2.700 3.150 2.800 2.700 3.300 3.200 3.200 2.800 4.600 1.720 2.750 4.200 2.100 4.450 2.900 2.920 2.720 2.900 2.000 2.720 2.480 3.900 2.500 2.480 2.450 3.400 3.400 1.570 3.800 2.700 2.900 3.700 2.120 3.150 2.400 3.450 3.120 2.120 2.450 2.700 ....... .......

Primeiro, é preciso definir as faixas de peso que recebem tecnicamente o nome de classes. Observe os dados apresentados na tabela acima. O menor valor é de 1.570 Kg e o maior é de 4.600 Kg. Podem então ser definidas classes de 1,5 a 2,0 Kg, de 2,0 a 2,5 Kg, e assim por diante, como mostra o esquema dado a seguir:
1,5 2,0

14

Bioestatística

Profa Claudia M. G. G. Franchi

2,0

2,5

2,5

3,0

3,0

3,5

3,5

4,0

4,0

4,5

4,5

5,0

Na classe de 1,5 a menos de 2,0 Kg são colocados desde nascidos com 1,5 Kg até os que nasceram com 1.999 Kg; na classe de 2,0 a menos de 2,5 Kg, são colocados desde nascidos com 2,0 Kg até os que nasceram com 2,499 Kg, e assim por diante. Logo, cada classe cobre um intervalo de 0,5 Kg, ou seja, cada intervalo de classe é de 0,5 Kg. É mais fácil trabalhar com intervalos de classe iguais. As distribuições das frequências, obtidas a partir da tabela do Peso ao nascer de nascidos vivos, em quilogramas, é dada a seguir: Classe 1,5 2,0 = 16 2,0 2,5 3,0 2,5 = 31 3,0 = 34 3,5 = 11 3,5 4,0 = 4 4,0 4,5 4,5 = 1 5,0 Frequência = 3

Denominam-se extremos de classe os limites dos intervalos de classe. Deve ficar muito claro se os valores iguais aos extremos devem ou não ser incluídos na classe. Recomenda-se adotar a notação 1,5 2,0, 2,0 2,5 etc. Isto significa que o intervalo „e fechado à esquerda, isto é, pertencem à classe os valores iguais ao extremo inferior (por exemplo, 1,5 na primeira classe). Também significa que o intervalo é fechado à direita, isto é, não pertencem à classe os valores iguais ao extremo superior (por exemplo, 2,0 na primeira classe).

15

Bioestatística

Profa Claudia M. G. G. Franchi

Numa tabela de distribuição de frequências também podem ser apresentados os pontos médios da classe. O ponto médio é dado pela soma dos extremos da classe, dividia por 2. Para a classe 1,5 2,0, o ponto médio é:

Uma tabela típica de distribuição de frequências tem então, três colunas: a da esquerda, onde estão escritas as classes; a do meio, onde estão escritos os pontos médios; e a da direita, onde estão escritas as frequências, isto é, o numero de elementos de cada classe. Veja a tabela a seguir: Nascidos vivos segundo o peso ao nascer, em quilogramas Classe 1,5 2,0 2,25 2,0 2,5 2,75 2,5 3,0 3,25 3,0 3,5 3,75 3,5 4,0 4,25 4,0 4,5 4,75 4,5 5,0 1 4 11 34 31 16 Ponto Médio 1,75 Frequência 3

Nem sempre estarão definidos o extremo inferior da primeira classe ou o extremo superior da última classe. Observa a tabela abaixo. O extremo superior da última classe não esta definido. Esta tabela também exemplifica o uso de intervalos de classe diferentes. Mulheres com 30 anos de Idade Segundo a Pressão Sanguínea Sistólica, em Milímetros de Mercúrio Classe 90 100 100 105 105 110 110 115 115 120 120 125 125 130 130 135 135 140 Ponto Médio 95 102,5 107,5 112,5 117,5 122,5 127,5 132,5 137,5 Frequência 6 11 12 17 18 11 9 6 4
16

Bioestatística

Profa Claudia M. G. G. Franchi

140 150 150 160 160 e mais

145 155 ...

4 1 1

As tabelas de distribuição de frequências mostram a distribuição da variável, mas perdem em exatidão. Isso porque todos os dados passam a ser representados pelo ponto médio da classe a que pertencem. Por exemplo, a tabela acima mostra que seis mulheres apresentaram pressão sanguínea sistólica com o ponto médio igual a 95, mas não d‟a informação exata sobre a pressão de cada uma delas. O numero de classes deve ser escolhido pelo pesquisador, em função do que ele quer mostrar. Em geral, convém estabelecer de 5 a 20 classes. Se o numero de classes for demasiado pequeno (por exemplo, 3) perde-se muita informação. Se o numero de classes for grande (por exemplo, 30) tem-se pormenores desnecessários. Mas não existe um numero “ideal” de classes, embora existam até formulas para estabelecer quantas classes devem ser construídas. Uma dessas fórmulas „e a seguinte:

Onde n é o número de dados. O número de classes é um inteiro próximo de k. Para entender como se aplica esta fórmula, veja a tabela peso ao nascer dos nascidos vivos, como n=100, tem-se que:

ou seja, deveriam ter sido construídas 7 ou 8 classes. É importante deixar claro, aqui, que o resultado obtido por esta formula pode ser usado como referencia, mas cabe ao pesquisador determinar o numero de classes que pretende organizar. Finalmente, quando se constrói uma tabela de distribuição de frequências, é melhor usar, como extremos de classes, números fáceis de trabalhar. No caso do peso ao nascer dos nascidos vivos, foram definidas 7 classes e foram estabelecidos extremos com valores fáceis, como 1,5 e 2,0.

3.4.

Exercícios – Capítulo 3

1. De acordo com o IBGE (1988), a distribuição dos suicídios ocorridos no Brasil em 1986, segundo a causa atribuída foi a seguinte: 263 por alcoolismo, 198 por dificuldade financeira, 700 por doença mental, 189 por outro tipo de doença, 416 por desilusão amorosa e 217 por outras causas. Apresente essa distribuição em uma tabela. 2. Construa uma tabela de distribuição de frequências para apresentar os dados da tabela abaixo, apresente também as frequências relativas: Pressão arterial, em milímetros de mercúrio, de cães adultos anestesiados e após laparotomia 130,0 107,5 135,0 100,0 134,5 105,0 125,0 130,0 145,0 158,5 120,0 100,0 135,0 125,0 110,0 111,5 107,5 127,5 104,5 102,5 99,0 120,0 90,5 101,5 90,5 116,0 143,0 104,5 102,5 107,5 82,5 115,0 136,5 101,5 124,0
17

Bioestatística

Profa Claudia M. G. G. Franchi

121,5 107,5

135,0 140,0

102,0 121,5

119,5 107,5

115,5 113,0

125,5 93,0

117,5 103,5

3. De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de Trânsito, 27.306 casos de vitimas fatais, assim distribuídos: 11.712 pedestres, 7.116 passageiros e 8.478 condutores. Faça uma tabela para apresentar esses dados. Apresente também as frequências relativas e o total. 4. De posse da tabela abaixo, calcule as frequências relativas de não sobreviventes.
Pacientes com câncer de mama segundo a faixa de idade por ocasião Do diagnostico e sobrevivência por três anos Sobrevivência Faixa de idade Menor de 50 anos De 50 a 70 anos Mais de 70 anos Fonte: MORRISON (1973) Sim 11 18 15 Não 6 8 9

5. De posse da tabela abaixo, calcule as frequências relativas em cada linha, isto „e, calcule a proporção de estabelecimentos de saúde, públicos e particulares, de cada espécie. Estabelecimentos de saúde, públicos e particulares Por espécie. Brasil, 1985. Estabelecimentos Públicos Particulares 1.002 5.132 150 156 1.531 6.136 14.393 472

Faixa de idade Hospital Pronto-socorro Policlínicas Outros
Fonte: IBGE (1988)

6. Construa uma tabela de distribuição de frequências para apresentar os dados da tabela abaixo usando intervalos de classes iguais. Depois faça outra tabela, com os seguintes intervalos: 1 dia, 2 ou 3 dias, de 4 a 7 dias, de 8 a 14 dias, mais de 14 dias. Tempo de internação, em dias, de pacientes acidentados no trabalho, em um dado hospital 7 12 4 10 2 1 8 12 15 8 7 6 1 3 2 9 14 4 7 17 14 8 12 7 13 4 3 5 10 7 6 2 5 3 8 11

7. Ao nascer, os bebês são pesados e medidos, para saber se estão dentro das tabelas de peso e altura esperados. Estas duas variáveis são: a) qualitativas b) ambas discretas
18

Bioestatística

Profa Claudia M. G. G. Franchi

c) ambas contínuas d) contínuas e discretas e) discreta e contínua 8. A parcela da população convenientemente escolhida para representa-la é chamada de: a) variável b) rol c) amostra d) dados brutos e) nada podemos afirmar, porque a informação é incompleta

9. Um conjunto de 100 notas de matemática, de alunos do sexo masculino, tiradas dos arquivos da secretaria da escola, constitui: a) um rol b) uma tabela c) uma relação de dados brutos d) uma distribuição de frequência 10. Por definição, rol é qualquer série ordenada de valores referentes a uma mesma variável. Então, dadas as séries da mesma variável x: I. –2, 4, 5, 6, 7 II. 1, 3, 3, 6, 7 III. 8, 7, 5, 2, 1 IV. 5, 4, 4, -1 Podemos afirmar que: a) todas elas constituem róis b) só a série I constitui um rol c) a série II não é um rol, mas as outras sim d) apenas as séries I e IV não são róis e) somente a série III é um rol, as demais não

19

Bioestatística

Profa Claudia M. G. G. Franchi

4.

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA (COM INTERVALOS
DE CLASSE)

Classe 1,5 2,0

Ponto Médio 1,75

Frequência 3

2,25 2,0 2,5 2,75 2,5 3,0 3,25 3,0 3,5 3,75 3,5 4,0 4,25 4,0 4,5 4,75 4,5 5,0

16

31

34

11

4

1

4.1.

Classe

São os intervalos de variação da variável e é simbolizada por i e o número total de classes simbolizada por k. Exemplo, na tabela acima, K=7 e 2,5 3,0 é a terceira classe, onde i=3.

4.2.

Limite superior e limite inferior da classe

São os extremos de cada classe. O menor número é o limite inferior de classe ( li ) e o maior número é o limite superior ( Li ) da classe. Exemplo, em 2,5 3,0 l3=2,5 e L3=3,0. O símbolo representa um intervalo fechado à esquerda e aberto à direita. O dado 3,0 do ROL não pertence à classe 3 e sim a classe 4 representada por 3,0 3,5.

4.3.

Amplitude de classe

É obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por . Exemplo, na tabela acima, na classe k=1, hi = 2,0 - 1,5 = 0,5.

4.4.

Amplitude total da distribuição

É a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela anterior AT = 5,0–1,5 = 3,5.

20

Bioestatística

Profa Claudia M. G. G. Franchi

4.5.

Amplitude total da amostra (ROL)

É a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA = 4.600–1.570 = 3.030. (AT sempre será maior que AA).

4.6.

Ponto Médio de classe
2,5, o

É o ponto que divide o intervalo de classe em duas partes iguais. Exemplo, em 2,0 ponto médio x3= (2,0+2,5)/2= 2,25.

4.7.

Exercícios – Capítulo 4

1. A tabela abaixo apresenta a distribuição de frequência dos salários mensais em reais, de 65 empregados da companhia P & R.

1 2 3 4 5 6 7

5.000 ⊢ 6.000 6.000 ⊢ 7.000 7.000 ⊢ 8.000 8.000 ⊢ 9.000 9.000 ⊢ 10.000 10.000 ⊢ 11.000 11.000 ⊢ 12.000 Total ............................................

8 10 16 14 10 5 2 65

Determinar: a) b) c) d) e) f) g) h) A amplitude Total; O limite superior da quinta classe O limite inferior da sexta classe; A amplitude do quinto intervalo de classe; A classe do 40º empregado; A percentagem de empregados cuja renda ultrapassa R$10.000,00 por mês; A percentagem de empregados que ganham menos de R$8.000,00 por mês; A percentagem de empregados que ganham menos de R$10.000,00 e pelo menos R$6.000,00 por mês;

2. A tabela abaixo apresenta uma distribuição de frequência das áreas de 400 lotes:

Áreas 2 (m ) o N de Lotes

300

⊢ 14

400

⊢ 46

500

⊢ 58

600

⊢ 76

700

⊢ 68

800

⊢ 62

900

⊢ 48

1000

⊢ 22

1100

⊢ 6

1200

Com referência a essa tabela, determine: a) A amplitude total.
21

Bioestatística

Profa Claudia M. G. G. Franchi

b) c) d) e) f) g) h) i) j) k) l) m) n) o)

O limite superior da quinta classe. O limite inferior da oitava classe. O ponto médio da sétima classe. A amplitude do intervalo da segunda classe. A frequência da quarta classe. A frequência relativa da sexta classe. A frequência acumulada da quinta classe. O número de lotes cuja área não atinge 700m2. O número de lotes cuja área atinge e ultrapassa 800m2. A percentagem dos lotes cuja área não atinge 600m2. A percentagem dos lotes cuja área seja maior ou igual a 900m2. A percentagem dos lotes cuja área é de 500m2, no mínimo, mas inferior a 1000m2. A classe do 72º lote. Até que classe estão incluídos 60% os lotes.

3. A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus.
No de Acidentes No de Motoristas 0 20 1 10 2 16 3 9 4 6 5 5 6 3 7 1

Determine: a) b) c) d) e) O número de e a percentagem de motoristas que não sofreram nenhum acidente. O número e a percentagem de motoristas que sofreram pelo menos 4 acidentes. O número e a percentagem de motoristas que sofreram menos de 3 acidentes O número e a percentagem de motoristas que sofreram no mínimo 3 e no máximo 5 acidentes. A percentagem dos motoristas que sofreram no máximo 2 acidentes.

4. Complete a tabela abaixo:

i 1 2 3 4 5

Classes 0 ⊢ 8 8 ⊢ 16 16 ⊢ 24 24 ⊢ 32 32 ⊢ 40

fi 4 10 14 9 3

fr

f%

F

 = 40  = 1,00

5. Complete os dados que faltam na distribuição de frequência:

i 1 2 3

xi 0 1 2

fi 1 4

fri 0,05 0,15

Fi 4

22

Bioestatística

Profa Claudia M. G. G. Franchi

4 5 6 7 8

3 4 5 6 7

3 2

0,25 0,15

13 18 19

6. Complete os dados que faltam na distribuição de frequência:

i 1 2 3 4 5 6 7 8

Classes 0⊢ 2 2⊢ 4 4⊢ 6 8⊢ 10 10⊢ 12

xi 1 5 7

fi 4 8

Fi

30 27 15 10 72 83 93

13 14⊢ 16

100
7. Considerando as notas de um teste de inteligência aplicado a 100 alunos:

64 73 78 86 76 82 68 71 95 94

78 95 86 84 80 90 96 73 94 75

66 82 78 86 92 83 86 63 88 67

82 89 101 76 102 81 70 105 62 95

74 73 85 76 73 85 72 74 91 108

103 92 98 83 87 72 74 98 83 98

78 85 75 103 70 81 84 78 98 71

86 80 73 86 85 96 99 78 93 92

103 81 90 84 79 81 81 83 83 72

87 90 86 85 93 85 89 96 76 73

Forme uma distribuição de frequência.

23

Bioestatística

Profa Claudia M. G. G. Franchi

5.

GRÁFICOS ESTATÍSTICOS

São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir as tabelas estatísticas. Os gráficos são de extrema importância na visualização e interpretação de informações e dados acerca de temas de aspectos naturais, sociais e econômicos. Os gráficos são representações bastante difundidas em diferentes tipos de informativos, dentre eles, os principais estão em livros, revistas, jornais impressos, além da televisão e a internet, que fazem o uso continuamente para apresentar informações à população em geral ou grupos específicos de pesquisas. Diante dessas afirmações os gráficos consistem em uma representação constituída por formas geométricas elaboradas de maneira precisa, oriundas de dados numéricos resultados de pesquisas e organizadas em uma tabela. Os gráficos são classificados segundo sua forma e podem ser de colunas, de linhas e circulares. Existem normas adicionais para a construção de gráficos, ditadas pela fundação IBGE. Assim, todo gráfico deve apresentar título e escala. O título pode ser colocado tanto acima como abaixo do gráfico. As escalas devem crescer da esquerda para a direita, e de baixo para cima. As legendas explicativas devem ser colocadas de preferência, à direita do gráfico. Observe os tipos de gráficos a partir do exemplo da tabela com os dados da população brasileira residente, com 15 anos e mais segundo o estado conjugal. População Brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o censo demográfico de 1980 Estado conjugal Solteiros (1) Casados (2) Separados Viúvos Sem declaração Frequência 25.146.484 41.974.865 1.816.046 3.616.046 1.005.234 Percentual 34,18 57,06 2,47 4,92 1,37

Fonte: IBGE Nota: Estão computados, como separados, os separados, os desquitados e os divorciados (1) Exclusive as pessoas solteiras, vivendo em união consensual estável (2) Inclusive 4.939.528 pessoas vivendo em união consensual estável

5.1.

Gráfico de Barras

O gráfico de barras é usado para apresentar variáveis qualitativas ou ordinais. Para fazer um gráfico de barras, primeiro se traça o sistema de eixos cartesianos. Depois se colocam, no eixo das abscissas, as categorias da variável em estudo. Em seguida constroem-se barras retangulares, com base no eixo das abscissas e altura igual à frequência, ou à frequência relativa, da respectiva categoria. As barras devem ser desenhadas separadas para ficar claro que a variável é qualitativa ou ordinal.

24

Bioestatística

Profa Claudia M. G. G. Franchi

Figura 1: População brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o senso demográfico de 1980.

5.2.

Gráfico de Colunas

Figura 2: População brasileira residente, com 15 anos e mais, segundo o estado conjugal, de acordo com o senso demográfico de 1980.

5.3.

Gráfico de Setores

O gráfico de setores também é usado para apresentar variáveis qualitativas ou ordinais. Para fazer um gráfico de setores, primeiro se traça uma circunferência que, como se sabe, tem 360º. Essa circunferência representa o total, ou seja, 100%. Dentro dessa circunferência devem ser representadas as categorias da variável em estudo. Para isso, toma-se a frequência relativa de cada categoria e calcula-se o ângulo central, da seguinte maneira: se 100% correspondem a 360º, uma categoria com frequência relativa de f% terá um ângulo central x, tal que:

Logo, valor do ângulo central x será:

25

Bioestatística

Profa Claudia M. G. G. Franchi

Os ângulos centrais das demais categorias são obtidos da mesma maneira. Para fazer o gráfico de setores marcam-se, na circunferência, os ângulos calculados, separando-os com o traçado dos raios. Observe o gráfico de setores apresentado abaixo:

5.4.

Gráfico de Linhas

Gráfico de Linhas: É um gráfico que apresenta os dados por meio de linhas, sempre que as categorias utilizadas representarem um intervalo de tempo.

26

Bioestatística

Profa Claudia M. G. G. Franchi

5.5.

Exercícios – Capítulo 5

1. Faça um gráfico de barras e um gráfico de setores para apresentar os dados da tabela a seguir: Suicidas segundo o sexo. Brasil, 1986 Sexo Masculino ............. Feminino ..............
Fonte: IBGE: 1988

Frequência 3.562 1.192

Percentual 74,93 25,07

2. Utilizando o gráfico em colunas, represente a tabela:

3. Utilizando o gráfico em linhas, represente a tabela:

27

Bioestatística

Profa Claudia M. G. G. Franchi

6.

REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO
6.1. Histograma

Os dados apresentados em tabelas de distribuição de frequências são apresentados graficamente em histogramas. Para construir um histograma, primeiro se traça o sistema de eixos cartesianos. Depois, se os intervalos de classe são iguais, traçam-se barras retangulares com bases iguais, correspondendo aos intervalos de classe, e com alturas determinadas pelas respectivas frequências. Quando os intervalos de classe são diferentes, para construir um histograma é preciso calcular as densidades de frequência relativa. Entende-se por densidade de frequência relativa o quociente entre a frequência relativa e o intervalo de classe, isto é:

6.2.

Polígono de Frequências

Os dados apresentados na tabela de distribuição de frequências também podem ser apresentados em gráficos denominados polígonos de frequências. Para fazer esse tipo de gráfico, primeiro se traça o sistema de eixos cartesianos. Depois, se os intervalos de classe são iguais, marcam-se pontos com abscissas iguais aos pontos médios de classes e ordenadas iguais às respectivas frequências. Se os intervalos de classe são diferentes, marcam-se pontos com abscissas iguais aos pontos médios de classes e ordenadas iguais às respectivas densidades de frequência relativas. Para fechar o polígono, unem-se os extremos da figura com o eixo horizontal, nos pontos de abscissas iguais aos pontos médios de uma classe imediatamente inferior à primeira, e de uma classe imediatamente superior à última.

28

Bioestatística

Profa Claudia M. G. G. Franchi

6.3.

Exercícios – Capítulo 6

1. Consideremos os dados da Tabela a seguir.

Preço médio da gasolina comum para áreas selecionadas dos Estados Unidos, março de 1975, em centavos de dólar.
Área Atlanta Baltimore Boston Buffalo Chicago Cincinnati Cleveland Dallas Detroit Houston Kansas City Preço por galão 53.4 55.1 53.9 53.4 54.8 53.3 53.9 49.1 53.7 47.9 49.6 Área Los Angeles Milwaukee Minneapolis New York Philadelphia Pittsburgh St. Louis San Diego San Francisco Seattle Washington Preço por galão 53.5 50.1 50.3 55.2 52.9 53.4 52.3 55.3 56.8 52.7 55.2

Vamos supor que quiséssemos organizar aqueles preços em uma distribuição de frequências com cerca de 5 classes. Determinar a amplitude conveniente de cada intervalo, de tal forma que todos os intervalos de classe tenham iguais amplitudes, e construir a tabela de frequências fixando o limite inferior da primeira classe em 47.0. Construir o histograma e o polígono de frequência da distribuição. 2. A tabela seguinte representa as alturas (em cm) de 40 alunos de uma classe. 162 164 170 160 166 163 165 157 158 169 148 159 176 163 152 166 175 157 165 170 169 155 157 164 172 154 163 165 178 165 170 171 158 150 162 166 172 158 168 164

a) Calcular a amplitude total. b) Admitindo-se 6 classes, qual a amplitude do intervalo de classe? c) Construir uma tabela de frequências simples absoluta e relativa das alturas dos alunos admitindo que o limite inferior da 1a classe seja 148 cm. d) Determinar os pontos médios das classes. 3. Os dados seguintes representam 20 observações relativas ao índice pluviométrico em determinados municípios do Estado: 144 141 152 150 159 142 160 146 160 142 151 141 157 141 146 150 154 143 145 158

Construir a tabela de frequências simples e acumuladas (“abaixo de” e “acima de”) tanto absolutas quanto relativas.
29

Bioestatística

Profa Claudia M. G. G. Franchi

7.

MEDIDAS DE POSIÇÃO

7.1.

Introdução

São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência. As medidas de posições mais importantes são as medidas de tendência central ou promédias (verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais). As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana. Outros promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica e biquadrática. As outras medidas de posição são as separatrizes,que englobam: a própria mediana, os decis, os quartis e os percentis. .

7.2.

Média Aritmética:

É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores.

onde xi são os valores da variável e n o número de valores.

7.2.1. Dados não agrupados
Quando desejamos conhecer a média dos dados não agrupados em tabelas de frequências, determinamos a média aritmética simples. Exemplo: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 quilos, temos, para venda média diária na semana de:

7.2.2. Desvio em relação à média:
É a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:

30

Bioestatística

Profa Claudia M. G. G. Franchi

Designando o desvio por

, temos:

d1 = 10 - 14 = - 4 , ... d2 = 14 - 14 = 0 , d3 = 13 - 14 = - 1 , ... d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e. .. d7 = 12 - 14 = - 2.
.

7.2.3. Propriedades da média aritmética
1ª Propriedade: A soma algébrica dos desvios em relação à média é nula.

No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0

2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante.

Se no exemplo original somarmos a constante 2 a cada um dos valores da variável temos: Y = 12+16+15+17+18+20+14 / 7 = 16 quilos ou Y = .+ 2 = 14 +2 = 16 quilos

3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante.

Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável temos: Y = 30+42+39+45+48+54+36 / 7 = 42 quilos ou

7.2.4. Dados agrupados sem intervalo de classe

31

Bioestatística

Profa Claudia M. G. G. Franchi

Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por família: Nº de meninos 0 1 2 3 4 frequência = fi 2 6 10 12 4 34 Como as frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada pela fórmula:

..xi. 0 1 2 3 4

..fi. 2 6 10 12 4 34

..xi.fi . 0 6 20 36 16 78

Onde temos:

7.3.

Exercícios – Capítulo 7

1. Complete o esquema para cálculo da média aritmética da distribuição: xi fi Temos: 1 2 2 4 3 6 4 8 5 3 6 1

1 2 3 4

2 3 6 8

2

32

Bioestatística

Profa Claudia M. G. G. Franchi

5 6

3 1

7.3.1. Dados agrupados com intervalo de classe
Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio e determinamos a média aritmética ponderada por meio da fórmula:

Onde,

é o ponto médio da classe:

Consideremos a distribuição: I 1 2 3 4 5 6 Estaturas (cm) 150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174 fi 4 9 11 8 5 3 40 Pela mesma razão do caso anterior, vamos, inicialmente, abrir uma coluna para os pontos médios e outras para os produtos xi.fi. i 1 2 3 4 5 6 Estaturas (cm) 150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174 fi 4 9 11 8 5 3 xi 152 156 160 164 168 172 xi.fi 608 1404 1760 1312 840 516
33

Bioestatística

Profa Claudia M. G. G. Franchi

40

6440

Como, neste caso:

7.4.

Exercícios:

1. Complete o esquema para cálculo da média aritmética da distribuição de frequência:

Custo (R$)

1150 450 8 550 10 650 11 750 16 850 13 950 5 1050 1

Temos :

1 2 3 4 5 6 7

500

8 10 11 16 13 5

4.000

1.100

1

Logo,

34

Bioestatística

Profa Claudia M. G. G. Franchi

7.5.

MODA - Mo

É o valor que ocorre com maior frequência em uma série de valores. Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica.

.

7.5.1. Dados não agrupados
A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10.

Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Exemplo: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal.

.Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Exemplo: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal.

7.5.2. Dados agrupados sem intervalo de classe
Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior frequência. Ex: Qual a temperatura mais comum medida no mês abaixo: Temperaturas 0º C 1º C 2º C 3º C Frequência 3 9 12 6
35

Bioestatística

Profa Claudia M. G. G. Franchi

Resposta: 2º C é a temperatura modal, pois é a de maior frequência.

7.5.3. Dados agrupados com intervalo de classe
A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta.

Onde: l* = limite inferior da classe modal e L* = limite superior da classe modal Assim, para a distribuição: I 1 2 3 4 5 6 Estaturas (cm) 150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174 fi 4 9 11 8 5 3 40

Temos que a classe modal é i = 3, l* = 158 e L* = 152. Como,

Vem:

7.5.4. Cálculo da Moda: Método mais elaborado pela fórmula de CZUBER:

36

Bioestatística

Profa Claudia M. G. G. Franchi

na qual: = limite inferior da classe modal..... = amplitude da classe modal = ; = ; sendo: a frequência simples da classe modal; a frequência simples da classe anterior à classe modal a freqüência simples da classe posterior à classe modal Assim, para a distribuição da tabela das estaturas, temos:

Onde,

7.6.

Exercícios:

1. Complete o esquema para o cálculo da moda da distribuição de frequência: Custo (R$) fi 450 8 550 10 650 11 750 16 850 13 950 5 1050 1 1150

A classe modal é da ordem... Logo:

Temos, pois:

37

Bioestatística

Profa Claudia M. G. G. Franchi

7.7.

MEDIANA

A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras palavras, a medida de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos.

7.7.1. Dados não agrupados
Dada uma série de valores como, por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9 de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: 2, 5, 6, 9, 10, 13, 15, 16, 18 Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos à direita e à esquerda. Em nosso exemplo, esse valor é o 10, já que, nessa série, há quatro elementos acima dele e quatro abaixo.

Md = 10
Se, porém, a série dada tiver um número par de termos, a mediana será, por definição, qualquer dos números compreendidos entre os dois valores centrais da série. Convencionou-se utilizar o ponto médio. Assim, a série de valores: 1, 6, 7, 10, 12, 13, 18, 21 tem para a mediana a média aritmética entre 10 e 12. Logo:

Md=11

38

Bioestatística

Profa Claudia M. G. G. Franchi

7.7.2. Dados agrupados
Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se processa de modo muito semelhante àquele dos dados não agrupados, implicando, porém a determinação prévia das frequências acumuladas. Ainda aqui, temos que determinar um valor tal que divida a distribuição em dois grupos que contenham o mesmo número de elementos. Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos é dada por:

7.7.3. Dados Agrupados sem intervalo de classe
Nesse caso, é o bastante identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Tomemos a distribuição relativa à tabela abaixo correspondente à frequência acumulada:

Númerode meninos 0 1 2 3 4 2 6 10 12 4 35 Sendo: 2 8 18 30 34

A menor frequência acumulada que supera esse valor é 18, que corresponde ao valor 2 da variável, sendo este o valor mediano. Logo:

Md = 2 meninos

7.8.

Exercícios:

1. Complete o esquema para o cálculo da mediana das distribuições:

a)
2 3 4 7 6 12 8 8 10 4
39

Bioestatística

Profa Claudia M. G. G. Franchi

2 4 6 8 10

10 30

Como:

Temos que:

Md = ___________
b)
0 2 1 5 2 9 3 7 4 6 5 3

0 1 2 3 4 5

2 9

2

Como:

Temos que:

Md = ___________

40

Bioestatística

Profa Claudia M. G. G. Franchi

7.8.1. Dados Agrupados com intervalos de classe
Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, temos inicialmente que determinar a classe na qual se encontra a mediana – classe mediana. Tal classe será evidentemente, aquela correspondente à frequência acumulada imediatamente superior a .

Feito isto, um problema de interpolação resolve a questão, admitindo-se, agora, que os valores se distribuam uniformemente em todo o intervalo de classe. Assim, considerando a distribuição da tabela a seguir: i 1 2 3 4 5 6 Estaturas (cm) 150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174 fi 4 9 11 8 5 3 40 A 3ª Classe é a classe mediana. Temos: Fi 4 13 24 32 37 40

Como há 24 valores incluídos nas três primeiras classes da distribuição e como pretendemos determinar o valor que ocupa o 20º lugar, a partir do início da série, vemos que este deve estar localizado na terceira classe (i = 3), supondo que as frequências dessas classes estejam uniformemente distribuídas. Como há 11 elementos nessa classe e o intervalo de classe é igual a 4, devemos tomar a partir do limite inferior a distancia:

e a mediana será dada por:

Logo:

Na prática, executamos os seguintes passos:
41

Bioestatística

Profa Claudia M. G. G. Franchi

1º) Determinamos as frequências acumuladas. 2º) Calculamos 3º) Marcamos a classe correspondente à frequência acumulada imediatamente superior à - e em seguida, empregamos a fórmula:

na qual: é o limite inferior da classe mediana é a frequência acumulada da classe anterior à classe mediana é a frequência simples da classe mediana é a amplitude do intervalo da classe mediana Tomando como exemplo, a distribuição anterior, temos:

Logo, a classe mediana é a de ordem 3. Então:

Substituindo esses valores na fórmula, obtemos:

isto é:

Md = 160,5 cm

7.9.

Resolva:

1) Calcule a mediana da distribuição de frequência: Custo (R$) fi Temos: 450 8 550 10 650 11 750 16 850 13 950 5 1050 1 1150

42

Bioestatística

Profa Claudia M. G. G. Franchi

1 450 2 550 3 650 4 750 5 850 6 950 7 1050 1150 1050 950 850 750 650 550

8 10 11 16 13 5 1

8 18

Substituindo esses valores na fórmula, obtemos:

Logo,

7.10.

Exercícios – Capítulo 7

1. Considerando os conjuntos de dados: a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6. b) 20, 9, 7, 2, 12, 7, 20, 15, 7. c) 51,6; 48,7; 50,3; 49,5; 48,9; d) 15, 18, 20, 13, 10, 16, 14. Calcule: I. a média; II. a mediana;
43

Bioestatística

Profa Claudia M. G. G. Franchi

III. a moda; 2. Os salários-hora de cinco funcionários de uma companhia são: R$ 75, R$ 90, R$ 83, R$ 142 e R$ 88. Determine: a) a média dos salários-hora; b) o salário-hora mediano; 3. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7 e 7,2. Determine: a) a nota média; b) a nota mediana; c) a nota modal 4. Considerando a distribuição abaixo: 3 4 Determine: a) a média; b) a mediana; c) a moda; 5. Em uma classe de 50 alunos, as notas obtidas formaram a seguinte distribuição: 2 1 Calcule: a) a nota média; b) a nota mediana; c) a nota modal. 6. Determine a média aritmética de: a) 50 8 60 5 80 4 90 3 3 3 4 6 5 10 6 13 7 8 8 5 9 3 10 1 4 8 5 11 6 10 7 8 8 3

b) 50 20 58 50 66 30

44

Bioestatística

Profa Claudia M. G. G. Franchi

7. Determine os desvios em relação à média dos seguintes dados: 6, 8, 5, 12, 11, 7, 4, 15. Qual é a soma dos desvios?

8. Calcule a média aritmética, a mediana e a moda das distribuições de frequência abaixo: a)

5 8 14 10 7

44 b)

5 12 18 27 8

70 c)

18

45

Bioestatística

Profa Claudia M. G. G. Franchi

31 15 3 1 1 1

70 d)

10 9 8 6 3 3 1

40

46

Bioestatística

Profa Claudia M. G. G. Franchi

8.

MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
8.1. Dispersão ou variabilidade

Vimos anteriormente que um conjuntos de valores pode ser convenientemente sintetizado por meio de procedimentos matemáticos, em poucos valores representativos – média aritmética, mediana e moda. Tais valores podem servir de comparação para dar a posição de qualquer elemento do conjunto. No entanto, quando se trata de interpretar dados estatísticos, mesmo aqueles já convenientemente simplificados, é necessário ter-se uma ideia retrospectiva de como se apresentavam esses dados nas tabelas. Assim, não é o bastante dar uma das medidas de posição para caracterizar perfeitamente um conjunto de valores, pois, mesmo sabendo, por exemplo, que a temperatura média de duas cidades é a mesma, e igual a 24 oC, ainda assim somos levados a pensar a respeito do clima dessas cidades. Em uma delas poderá a temperatura variar entre limites de muito calor e de muito frio e haver, ainda, uma temperatura média de 24 oC, A outra poderá ter uma variação pequena de temperatura e possuir, portanto, no que se refere à temperatura, um clima mais favorável. Vemos então, que a média – ainda que considerada como um número que tem a faculdade de representar uma série de valores – não pode por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõe o conjunto. Consideremos os seguintes conjuntos de valores das variáveis x, y e z: X: 70, 70, 70, 70, 70 Y: 68, 69, 70, 71, 72 Z: 5, 15, 50, 120, 160 Calculando a média aritmética de cada um desses conjuntos, obtemos:

Vemos então, que os três conjuntos apresentam a mesma média aritmética: 70. Entretanto é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e Z, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média representativa. Chamado de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno de um valor de tendência central tomado como ponto de comparação, podemos dizer
47

Bioestatística

Profa Claudia M. G. G. Franchi

que o conjunto X apresenta dispersão ou variabilidade nula e que o conjunto Y apresenta uma dispersão ou variabilidade menor que o conjunto Z. Portanto, para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua medida de posição, a Estatística recorre às medidas de dispersão ou de variabilidade. Dessas medidas, estudaremos a amplitude total, a variância, o desvio padrão e o coeficiente de variação.

8.2.

Amplitude Total

8.2.1. Dados não agrupados

A Amplitude Total é a diferença entre o maior e o menor valor observado:

Exemplo: para os valores: 40, 45, 48, 52, 54, 62 e 70 Temos:

Quando dizemos que a amplitude total dos valore é 30, estamos afirmando alguma coisa do grau de sua concentração. É evidente que, quanto maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável. Relativamente aos três conjuntos de valores mencionados no início desse capítulo, temos: ATx = 70 – 70 = 0 (dispersão nula) ATy = 72 – 68 = 4 ATz = 160 – 5 = 155

8.2.2. Dados agrupados sem intervalo de classe
Nesse caso, ainda temos:

Exemplo: Considerando a tabela abaixo:

48

Bioestatística

Profa Claudia M. G. G. Franchi

0

1

2

3

4

2

6

12

7

3

Temos:

8.2.3. Dados agrupados com intervalo de classe
Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe:

Exemplo: Considerando a distribuição abaixo: i 1 2 3 4 5 6 Estaturas (cm) 150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174 fi 4 9 11 8 5 3 40 Temos:

A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários, o que quase sempre invalida a idoneidade do resultado. Ela é apenas uma indicação aproximada da dispersão ou variabilidade. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura de um dia ou no ano, no controle de qualidade ou como uma medida de cálculo rápido, e quando a compreensão popular é mais importante que a exatidão e a estabilidade.

8.3.

Variância / Desvio padrão

Como vimos, a amplitude total é instável por se deixar influenciar pelos valores extremos, que são, na sua maioria, devidos ao acaso.
49

Bioestatística

Profa Claudia M. G. G. Franchi

A variância e o desvio padrão são medidas que fogem a essa falha, pois levam em consideração a totalidade dos valores da variável em estudo, o que faz delas índices de variabilidade bastante estáveis e, por isso mesmo, os mais geralmente empregados. A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. Assim, representando a variância por , temos:

Ou, lembrando que

Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático é um inconveniente. Por isso mesmo, imaginou-se uma nova medida que têm utilidade e interpretação práticas, denominada desvio padrão, definida como a raiz quadrada da variância e representada por s:

Assim,

Se bem que a fórmula dada para o cálculo do desvio seja a que torna mais fácil a sua compreensão, ela não é uma boa fórmula para fins de computação, pois em geral, a média aritmética , é um número fracionário, o que torna pouco prático o cálculo das quantidades Podemos simplificar escrevendo a fórmula do seguinte modo: .

50

Bioestatística

Profa Claudia M. G. G. Franchi

Não apenas este método é usualmente mais prático, como também mais preciso. Quando a média não é exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. Para o cálculo do desvio padrão, consideremos os seguintes casos:

8.3.1. Dados não agrupados
Tomemos como exemplo, o conjunto de valores da variável x: 40, 45, 48, 52, 54, 62, 70 O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para e outra para . Assim:

40 45 48 52 54 62 70 371

1600 2025 2304 2704 2916 3844 4900 20.293

Como n = 7, temos:

Logo,

8.4.

Resolva:

1. Complete o esquema para o cálculo do desvio padrão, dados os valores da variável: 8, 10, 11, 15, 16, 18 Temos:
51

Bioestatística

Profa Claudia M. G. G. Franchi

8

64

n=

Logo,

Isto é,

8.4.1. Dados Agrupados sem intervalo de classe
Como, neste caso, temos a presença de frequências, devemos levá-las em consideração, resultando a fórmula:

Consideremos como exemplo a distribuição na tabela abaixo: 0 2 1 6 2 12 3 7 4 3

52

Bioestatística

Profa Claudia M. G. G. Franchi

O modo mais prático para se obter o desvio padrão é abrir, na tabela dada, uma coluna para os produtos seu respectivo e outra para , assim: , lembrando que para obter basta multiplicar cada pelo

0 1 2 3 4

2 6 12 7 3

0 6 24 21 12

0 6 48 63 48

Logo:

8.5.

Exercícios:

1. Complete o esquema paras o cálculo do desvio padrão na distribuição:

1 2 Temos:

2 5

3 8

4 6

5 3

6 1

1 2 3 4 5 6

2

2

2

53

Bioestatística

Profa Claudia M. G. G. Franchi

Logo:

8.5.1. Dados Agrupados com intervalo de classe
Tomemos como exemplo, a distribuição abaixo. Começamos por abrir as colunas i Estaturas (cm) (ponto médio), para e para .

1 2 3 4 5 6

150 |----- 154 154 |----- 158 158 |----- 162 162 |----- 166 166 |----- 170 170 |----- 174

4 9 11 8 5 3 40

152 156 160 164 168 172

608 1.404 1.760 1.312 840 516 6.440

92.416 219.024 281.600 215.168 141.120 88.752 1.038.080

Logo:

8.6.

Exercícios:

1. Complete o esquema par o cálculo do desvio padrão da distribuição:
54

Bioestatística

Profa Claudia M. G. G. Franchi

Custo (R$)

130 30 2 50 8 70 12 90 10 110 5

Temos:

i

1 2 3 4 5

40

2

8.7.

Coeficiente de Variação

O desvio padrão por si só não nos diz muita coisa. Assim, um desvio padrão de duas unidades pode ser considerado pequeno para uma série de valores cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar duas ou mais séries de valores, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada Coeficiente de Variação (CV):

55

Bioestatística

Profa Claudia M. G. G. Franchi

Exemplo: Tomemos os resultados das medidas das estaturas e dos presos de um grupo de indivíduos:

Estaturas Pesos Temos:

175 cm 68 Kg

5,0 cm 2,0 Kg

Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão que as estaturas.

8.8.
a) 1, 3, 5, 9

Exercícios – Capítulo 8

1. Calcule a amplitude total dos conjuntos de dados:

b) 20, 14, 15, 19, 21, 22, 20 c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2; d) -10, -6, 2, 3, 7, 9, 10

2. Calcule a amplitude total das distribuições:

Xi fi

2 1

3 3

4 5

5 8

6 5

7 4

8 2

Classes 1,5 Fi 4 1,6 8 1,7 12 1,8 15 1,9 12 2,0 8 2,1 4

2,2

3. Calcule os desvios padrões dos conjuntos de dados do exercício 1. 4. Calcule os desvios padrões dos conjuntos de dados do exercício 2.

56

Bioestatística

Profa Claudia M. G. G. Franchi

5. Dada a distribuição de cem lançamentos de cinco moedas simultaneamente:
Número de caras Número de coroas

0 4

11 14

12 34

13 29

14 16

5 3

Calcule o desvio padrão: 6. Sabendo que um conjunto de dados apresenta para média aritmética e para desvio padrão respectivamente, 18,3 e 1,47, calcule o coeficiente de variação: 7. Em um exame final de matemática, o grau médio de um grupo de 150 alunos foi de 7,8 e o desvio padrão, 0,80. Em estatística, entretanto, o grau médio foi de 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão?

8. Medidas as estaturas de 1.017 indivíduos, obtivemos

. O peso

médio desses indivíduos é 52 Kg, com um desvio padrão de 2,3 Kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? 9. Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão igual a 5,97 cm. Outro grupo de 125 moças tem uma estatura média de 161,9 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo? 10. Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo? 11. Uma distribuição apresenta as seguintes estatísticas: s=1,5 e VC=2,9%. Determine a média da distribuição

57

Bioestatística

Profa Claudia M. G. G. Franchi

9.

BIBLIOGRAFIA

1. CRESPO, Antônio A., Estatística Fácil, 19ª ed. atual. – São Paulo, Ed. Saraiva, 2009. 2. DORIA FILHO, Ulysses, Introdução à Bioestatística: para simples mortais, 14ª reimpressão – São Paulo, Ed. Elsevier, 1999.

3. GUEDES, Marilda Laurenti da silva, José da Silva, Bioestatística, Rio de Janeiro, CNPQ, 1988. 4. JAQUES, Sidia M. Callegari, Bioestatística – Princípios e Aplicações, São Paulo, Ed. Artmed 2003 – reimpressão: 2008. 5. VIEIRA, Sonia, Introdução à Bioestatística, Rio de Janeiro, Ed. Campus, 1997 – 5ª reimpressão.

58

Sign up to vote on this title
UsefulNot useful