Escolar Documentos
Profissional Documentos
Cultura Documentos
Abril / 2015
SUMÁRIO
INTRODUÇÃO....................................................................................................................... 4
1. CONCEITOS BÁSICOS.................................................................................................. 5
1.1. Estatística ................................................................................................................ 5
1.2. Método Científico ..................................................................................................... 5
1.2.1. Método Experimental ........................................................................................ 5
1.2.2. Método Estatístico ............................................................................................ 5
1.3. População ............................................................................................................... 6
1.4. Amostra e amostragem ........................................................................................... 7
1.5. Parâmetro, Estimador e Estimativa .......................................................................... 8
1.6. Censo ...................................................................................................................... 9
1.7. Visão sistêmica da estatística .................................................................................. 9
2. TIPOS DE VARIÁVEIS ................................................................................................... 9
2.1. Qualitativas .............................................................................................................. 9
2.2. Quantitativas.......................................................................................................... 10
3. APRESENTAÇÃO DE DADOS ..................................................................................... 10
3.1. Tabelas.................................................................................................................. 10
3.1.1. Componentes fundamentais de uma tabela .................................................... 11
3.1.2. Generalidades sobre as tabelas ..................................................................... 12
3.2. Séries Estatísticas ................................................................................................. 13
3.2.1. Série Cronológica, Temporal, Evolutiva, Histórica ou em Marcha de
Andamento ................................................................................................................... 13
3.2.2. Série Geográfica, Territorial ou de localização................................................ 13
3.2.3. Série Específica, Qualitativa ou Categórica .................................................... 13
3.2.4. Conjugação de Séries Estatísticas ................................................................. 14
3.3. Gráficos ................................................................................................................. 14
3.3.1. Gráficos para Variáveis Qualitativas ............................................................... 15
3.3.2. Gráficos para Variáveis Quantitativas ............................................................. 18
3.3.1. Distribuição de Frequências ........................................................................... 19
3.4. Medidas de Posição .............................................................................................. 24
3.4.1. Média Aritmética ............................................................................................. 24
3.4.2. Mediana.......................................................................................................... 26
3.4.3. Moda .............................................................................................................. 28
3.4.4. Separatrizes (quartis, decis, percentis) ........................................................... 30
3.5. Medidas de Dispersão ou de Variação .................................................................. 33
3.5.1. Medidas do tipo amplitude .............................................................................. 33
3.5.2. Medidas do tipo desvio ................................................................................... 34
4. PROBABILIDADE ......................................................................................................... 38
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
3
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
INTRODUÇÃO
Todos nós já ouvimos, em nosso dia a dia, alguém se referir à palavra estatística. Mas,
afinal, o que é estatística? O termo “estatística” originou-se do vocábulo latino Status.
Inicialmente essa palavra foi utilizada para definir a coleta e apresentação de dados
quantitativos de interesse do Estado, para fins militares e tributários, no intuito de obter
informações sobre suas populações, riquezas, etc. Posteriormente, o termo passou a ser
empregado para se referir à coleta, apresentação e análise dos dados quantitativos de modo
que fosse possível efetuar julgamentos racionais sobre os mesmos. Nesse sentido, ela é
frequentemente usada no plural; assim referimo-nos às estatísticas de natalidade,
mortalidade, de trânsito, etc. Embora este seja o conceito usual de estatística, na realidade
essas aplicações são consideradas de rotina e de importância secundária.
De acordo com a Revista do Instituto Internacional de Estatística, cinco homens (Hermann
Conring, Gottfried Achenwall, Johann Peter Süssmilch, John Graunt e William Petty) já
receberam a honra de serem chamados de fundadores da estatística, por diferentes autores.
Alguns autores dizem que é comum encontrar como marco inicial da estatística a publicação
do "Observations on the Bills of Mortality" (Observações sobre os Sensos de Mortalidade,
1662) de John Graunt.
Seus fundamentos matemáticos foram postos no século XVII com o desenvolvimento da
teoria das probabilidades por Pascal e Fermat, que surgiu com o estudo dos jogos de azar.
O método dos mínimos quadrados foi descrito pela primeira vez por Carl Friedrich Gauss
por volta do ano de 1794. O uso de computadores modernos tem permitido a computação
de dados estatísticos em larga escala e também tornaram possível novos métodos antes
impraticáveis.
A estatística, como parte da matemática aplicada, trata da coleta, da análise e da
interpretação de dados observados. Estudando os mais variados fenômenos das diversas
áreas do conhecimento, ela representa um valioso instrumento de trabalho.
Hoje, a importância da estatística cresce a partir do fato que ciências como a Física,
Química, Engenharia, Medicina, Economia, Biologia, Ciências Agronômicas, Ciências
Administrativas, Ciências Sociais e outras a utilizam como ferramenta. Quando aplicada às
ciências biomédicas recebe o nome de bioestatística, quando aplicada à psicologia recebe o
nome de psicometria, quando aplicada à economia recebe o nome de econometria, quando
aplicada a fenômenos biológicos recebe o nome de biometria.
Assim, justifica-se o estudo da estatística por estudantes de qualquer curso e por
profissionais cujas atividades envolvam dados quantitativos. Até mesmo os leigos são
permanentemente envolvidos com estatísticas. Vejamos como estas três categorias estão,
cotidianamente, envolvidas pela estatística:
a) Os estudantes necessitam da estatística, pois só assim eles saberão, dentro da
técnica, coletar, organizar, resumir e interpretar as anotações efetuadas em um
ensaio planejado, bem como para melhor entenderem os trabalhos científicos que
lhes são pertinentes;
b) Os profissionais, através de amostras, são alertados no controle de qualidade de
uma determinada indústria, sondam a opinião publica para averiguar a preferência
por um produto, etc.;
c) Os leigos são constantemente atingidos por rádios, televisões, jornais com dados do
tipo: custo de vida aumentou 5% no mês passado, certa emissora de rádio tem um
índice de 40,2% de audiência no horário de 8 às 10h, etc.
Portanto, a estatística é uma ciência que está presente no cotidiano da sociedade humana.
4
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
1. CONCEITOS BÁSICOS
1.1. Estatística
É um ramo da matemática que se interessa em obter conclusões a partir de dados
observados e nos métodos científicos para coleta, organização, resumo, apresentação,
análise e interpretação dos dados amostrais. Em outras palavras, a Estatística compreende
o planejamento e a execução de pesquisas, a descrição e análise dos resultados e a
formulação de predições com base nesses resultados. O método estatístico é um processo
utilizado para obter, apresentar e analisar características ou valores numéricos para uma
melhor tomada de decisões em situações de incerteza. A Estatística se divide em:
a) Estatística descritiva – parte da Estatística que procura somente descrever e
analisar certo grupo, sem tirar quaisquer conclusões de caráter mais genérico
sobre um grupo maior. A estatística descritiva procura sintetizar ou resumir um
conjunto de dados, chegando, no geral, a expressar esse conjunto por um único
elemento, como, por exemplo, a média. Tem por objetivo a coleta, organização,
apresentação dos dados amostrais, ou seja, descreve os aspectos importantes
de um conjunto de características observadas.
b) Inferência estatística – se uma amostra é representativa de uma população,
conclusões importantes sobre a população podem ser inferidas de sua análise. A
parte da Estatística que trata das condições de validade dessas inferências
chama-se inferência estatística ou estatística indutiva.
5
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
6
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
7
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
1.6. Censo
É o tipo de estudo estatístico que abrange todas as unidades de observação de uma
população.
Exemplo de censo: censo demográfico realizado pelo IBGE, a cada dez anos, no qual são
consultados todos os lares brasileiros.
1.7. Visão sistêmica da estatística
A Estatística pode ser entendida como sendo constituída por três áreas: a estatística
descritiva, o cálculo das probabilidades e a inferência estatística. A figura abaixo apresenta
uma visão sistêmica da Estatística.
2. TIPOS DE VARIÁVEIS
Na estatística variável é uma atribuição de um número a cada característica da unidade de
observação. As variáveis classificam-se em:
2.1. Qualitativas
Considera-se uma variável como qualitativa quando as modalidades que a compõem
formam um conjunto amorfo, não estruturado numericamente, ou seja, quando não há
ligação entre essas modalidades, independentemente do fato de constituírem um conjunto
completo. Assim, essas variáveis resultam de uma classificação por tipos ou atributos. Elas
podem ser:
a) Nominal: os valores são classificados em categorias ou classes não ordenadas, ou
seja, não existe nenhuma ordenação das possíveis realizações.
Exemplos de variável qualitativa nominal
Sexo (1-Macho e 0-Fêmea);
Tipo sanguíneo (1-tipo O, 2-tipo A, 3-tipo B, 4-tipo AB);
9
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
2.2. Quantitativas
Considera-se uma variável como quantitativa quando os dados são de caráter nitidamente
quantitativo e o conjunto dos resultados possui uma estrutura numérica. Essas variáveis são
classificadas em duas categorias:
a) Discretas: os valores formam um conjunto finito ou enumerável de números inteiros
positivos (0, 1, 2, 3,...), ou seja, podem assumir apenas determinados valores e
resultam de uma contagem.
Exemplos de variável quantitativa discreta
Quantidade de alunos matriculados em Estatística Aplicada;
Número de casos de raiva registrados em fortaleza nos últimos 5 anos;
Número de leitos disponíveis nos hospitais públicos de Fortaleza.
b) Contínuas: podem assumir qualquer valor dentro de uma determinada faixa de
valores e resultam de uma medição.
Exemplos de variável quantitativa contínua
Estatura e peso;
Concentração de um poluente;
Nível sérico de colesterol de um paciente;
Temperatura.
3. APRESENTAÇÃO DE DADOS
Coletados os dados, é conveniente organizá-los de maneira prática e racional, para o
melhor entendimento do fenômeno que estamos estudando. Jamais deveremos apresentar
os dados para análise sob a forma que se chegou, após a simples apuração, pois, na
maioria das vezes, o conjunto de valores é extenso e desorganizado requerendo grande
atenção para ser entendido.
Denominamos de Série Estatística a organização dos dados. Portanto, uma série
estatística pode ser definida como toda e qualquer coleção de dados estatísticos referentes
a uma mesma ordem de classificação quantitativa.
Sua apresentação pode ocorrer por meio de tabelas, gráficos e distribuições de freqüências.
3.1. Tabelas
A tabela é uma apresentação numérica dos dados e consiste em dispô-los em linhas e
colunas de forma ordenada, de acordo com as regras estabelecidas pelos diversos sistemas
estatísticos. Os componentes fundamentais de uma tabela são o título, o corpo e o rodapé.
O título deve conter informações suficientes para que sejam respondidas as seguintes
questões:
10
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
O que? → Referente ao fato. Fato é o fenômeno que foi investigado e cujos valores
numéricos estão sendo apresentados;
Onde? → Referente ao espaço geográfico. Espaço geográfico é o local ou região
onde o fato ocorreu;
Quando? → Correspondente à época. Época refere-se à data ou ao tempo em que o
assunto foi investigado.
O que diferencia uma série estatística de outra são exatamente estas três características,
constantes do título: fato, local e época, como veremos adiante.
11
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
12
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
13
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Tabela 6 – Participação das grandes Regiões do Brasil no Produto Interno Bruto no período
de 2005 a 2009
Grandes Participação do Produto Interno Bruto (%)
Regiões
2005 2006 2007 2008 2009
Norte 5,0 5,1 5,0 5,1 5,0
Nordeste 13,1 13,1 13,1 13,1 13,5
Sudeste 56,5 56,8 56,4 56,0 55,3
Sul 16,6 16,3 16,6 16,6 16,5
Centro-Oeste 8,9 8,7 8,9 9,2 9,6
Fonte: IBGE, em parceria com os Órgãos Estaduais de Estatística, Secretarias Estaduais de Governo
e Superintendência da Zona Franca de Manaus – SUFRAMA, 2012
Observamos que cada uma das colunas que contem os anos forma uma série geográfica
por Grande Região do Brasil. Do mesmo modo, temos séries históricas ao considerarmos,
isoladamente, cada uma das linhas da Tabela 6. Este tipo de tabela recebe a denominação
de tabela de dupla entrada.
3.3. Gráficos
A representação gráfica da distribuição de uma variável tem a vantagem de rápida e
conscientemente, informar sobre a sua variabilidade. Gráficos facilitam a visualização dos
valores e são amplamente utilizados na apresentação de dados estatísticos.
Na elaboração de gráficos, por motivos estéticos, deve-se levar em conta os seguintes
aspectos:
a) O gráfico, em seu conjunto, deve enquadrar-se em um retângulo de dimensões que
o torne agradável à vista;
b) As figuras não devem ser nem muito largas, nem muito estreitas, devendo obedecer
a um sentido estético;
c) O gráfico, por seu objetivo de simplificar, deve conter somente algumas divisões de
escala vertical; as linhas horizontais devem ser poucas, de modo a torná-lo
agradável à sua leitura e interpretação;
São elementos complementares de um gráfico:
14
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Gráfico 1 – População Economicamente Ativa (1000 pessoas) por grupo de idade observado
no Brasil no mês de julho de 2011
50 anos ou mais
Grupos de Idade
25 a 49 anos
18 a 24 anos
15 a 17 anos
10 a 14 anos
2010
2009
Mulheres
Anos
2008
Homens
2007
2006
15
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
90
80
Densidade demográfica
70
60
(hab./km²)
50
40
30
20
10
0
Norte Nordeste Sudeste Sul Centro-Oeste
Grandes Regiões do Brasil
2.000,00
dos Trabalhadores por Conta
Própria
1.500,00
dos Empregados no Setor
Privado - com Carteira de
1.000,00 Trabalho assinada
dos Empregados no Setor
Privado - sem Carteira de
500,00
Trabalho assinada
dos Empregados no Setor
0,00 Público
jul/11 ago/11 set/11 out/11 nov/11 dez/11
Meses
16
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
60.000.000
Domicílios Particulares
50.000.000
40.000.000
Zona Rural
30.000.000
Zona Urbana
20.000.000
10.000.000
0
1970 1980 1991 1996 2000 2010
Censos
Fonte: IBGE, 1996 - Contagem de População, 1970 (Amostra), 1980 (Amostra), 1991 (Amostra), 2000
(Universo) e 2010 (Universo) - Censo Demográfico
Gráfico 6 - Pessoas de 10 anos ou mais de idade, residentes no Brasil, por estado civil
Casado(a)
Desquitado(a) ou
37,03 separado(a) judicialmente
Divorciado(a)
54,78
Viúvo(a)
Solteiro(a)
1,94
4,55 1,69
17
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
3.3.2.1. Histograma
É usado para ilustrar o comportamento de valores agrupados em classes, ou seja, é o
gráfico de barras da freqüência de uma variável. Esse gráfico, bem como a Poligonal
Característica, o Polígono de Frequências, as Ogivas de Galton e Composto serão
detalhados posteriormente. Exemplo:
250
200
150
100
50
0
0a3 4a7 8 a 10 10 a 11 Mais de 11
Anos de Estudo
18
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
100.000.000
80.000.000
60.000.000
40.000.000
20.000.000
0
1970 1975 1980 1985 1995 2006
Anos
Fonte: IBGE – Censo Agropecuário
19
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
3.3.1.3. Rol
É o arranjo dos dados numéricos brutos em ordem crescente ou decrescente de grandeza.
Para o nosso exemplo ilustrativo da variável quantitativa contínua peso de 50 estudantes do
sexo masculino de certa universidade cearense, o rol está exposto na Tabela 8.
Tabela 8 – Dada brutos correspondentes ao peso de 50 estudantes do sexo masculino de
certa universidade cearense organizados em rol
63 69 74 75 76 77 78 79 80 80
81 82 83 83 84 85 86 87 87 88
88 89 89 90 90 90 90 91 92 93
93 94 94 95 96 97 98 98 99 100
101 102 102 104 105 106 107 110 112 117
20
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
21
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
3.3.1.5. Histograma
É a representação gráfica de uma distribuição de frequências por meio de retângulos
justapostos, de forma que a área de cada retângulo seja proporcional à frequência da classe
que ela representa, sendo as larguras dos retângulos proporcionais as amplitudes dos
intervalos de classe. É o gráfico em colunas justapostas (pois a variável é contínua) de uma
distribuição de frequências. O gráfico seguinte mostra o histograma da frequência absoluta
simples para o exemplo ilustrativo 1.
Gráfico 9 - Histograma de frequências simples dos pesos dos estudantes
18
16
14
12
Frequência
10
8
6
4
2
0
67 75 83 91 99 107 115
Peso dos estudantes (kg)
22
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
18
16
14
12
Frequência
10
8
6
4
2
0
59 67 75 83 91 99 107 115 123
Peso dos estudantes (kg)
63├ 71 2 2 50 (=48+2)
71├79 5 7 (=2+5) 48 (=43+5)
79├87 10 17 (=7+10) 43 (=33+10)
87├95 16 33 (=17+16) 33 (=17+16)
95├103 10 43 (=33+10) 17 (=7+10)
103├111 5 48 (=43+5) 7 (=2+5)
111├119 2 50 (=48+2) 2
Total n=50 - -
23
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
50
Frequência acumulada
40
30
20
10
0
67 75 83 91 99 107 115
Peso dos estudantes (kg)
Deve-se diferenciar por meio da notação apropriada a média populacional (µ) da amostral
( ). A média aritmética de uma população finita é calculada somando-se todos os valores da
população e dividindo-se pelo tamanho N da mesma, sendo representada pela letra grega µ
(pronuncia-se mi), cuja expressão é:
24
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Ponto Frequência
Classes Médio da Absoluta
Classe (Xi) Simples (fi)
63├ 71 67 2 134
71├79 75 5 375
79├87 83 10 830
87├95 91 16 1456
95├103 99 10 990
103├111 107 5 535
111├119 115 2 230
Total ─ n=50 ∑xi.fi = 4550
25
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
3.4.2. Mediana
Colocando-se os valores de uma série em ordem crescente ou decrescente, a mediana é o
valor que ocupa a posição central. Além e representar a série, ela serve para analisar sua
distribuição, bem como para comparar fenômenos da mesma espécie, o que também ocorre
com as outras medidas de posição.
26
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Onde:
Li = limite inferior da classe que contém a mediana;
n = número de elementos do conjunto de dados;
Faant = soma das frequências das classes anteriores à classe que contém a mediana;
Fmd = frequência absoluta simples da classe que contém a mediana; e
h = amplitude da classe.
Exemplo para dados agrupados
Abaixo, temos o quadro de distribuição de frequência do Exemplo ilustrativo 1. Assim,
deseja-se saber a mediana dos pesos dos estudantes para os dados agrupados.
27
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
3.4.3. Moda
Define-se moda (ou modas) de um conjunto o valor (ou valores) que mais se repete, ou seja,
de maior frequência.
28
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Xi fi
3 3
5 6
7 5
9 4
11 2
Total 20
No exemplo acima, observamos que a segunda classe é a que possui a maior frequência
simples, então, a moda para essa distribuição será 5.
b) Dados agrupados em classes
Existem vário métodos para o cálculo da moda, quando os dados estão agrupados em
classes, entre eles os de Czuber, o de King e o empírico de Pearson.
A classe que apresenta a maior frequência é denominada classe modal e o ponto médio
dessa classe é chamado moda bruta.
Iremos trabalhar com o método de King. Neste método, a moda é dada por:
Onde:
Li = limite inferior da classe modal;
Fant = frequência absoluta simples da classe anterior à que contém a moda;
Fpost = frequência absoluta simples da classe posterior à que contém a moda; e
h = amplitude da classe.
Exemplo para dados agrupados
Abaixo, temos o quadro de distribuição de frequência do Exemplo ilustrativo 1. Assim,
deseja-se saber a moda dos pesos dos estudantes para os dados agrupados.
Frequência
Classes Absoluta
Simples (fi)
63├ 71 2
71├79 5
79├87 10
87├95 16
95├103 10
103├111 5
111├119 2
Total 50
29
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Onde:
x = ordem da observação;
n = número total de observações da série; e
p = percentil, em porcentos, dessa observação.
30
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
O 1º quartil está entre a terceira e quarta ordem (entre as variáveis 19 e 24) → interpolação
linear! Q1 = 19 + (24 - 19). 0,5 = 21,5.
Q2 = md = 31.
O 3º quartil está entre a terceira e quarta ordem (entre as variáveis 38 e 39) → interpolação
linear! Q3 = 38 + (39 - 38). 0,5 = 38,5.
Exemplo ilustrativo 7 (quando n é par): calcular os quartis para o conjunto ordenado
abaixo:
Variável 10 12 12 16 20 23 25 28
Ordem 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª
O 1º quartil está entre a segunda e terceira ordem. Como nas duas a variável 12 se repete,
então Q1 = 12.
O 3º quartil está entre a sexta e sétima ordem (entre as variáveis 23 e 25) → interpolação
linear! Q3 = 23 + (25 - 23). 0,25 = 23,5.
31
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Onde:
i = 1,2,3, para o caso de quartis;
i = 1,2,...,9, para o caso de decis;
i = 1,2,...,99, para o caso de percentis;
Li = limite inferior da classe referida;
Faant = frequência acumulada da classe anterior à referida;
Fi = frequência absoluta simples da classe referida; e
h = amplitude da classe.
Exemplo para dados agrupados
Abaixo, temos o quadro de distribuição de frequência do Exemplo ilustrativo 1. Assim,
deseja-se saber setuagésimo quinto percentil dos pesos dos estudantes para os dados
agrupados.
32
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
33
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Exemplo ilustrativo 9 (para dados não agrupados): calcule o desvio médio para o
conjunto W = {2,3,5,8,9,10,19}.
34
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
35
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Atenção! Quanto maior for o tamanho da amostra (n) menor é o desvio, pois, nesse caso, a
média estimada se aproxima da média populacional ou paramétrica (µ).
Uma das grandes desvantagens que tem a variância é o fato de não ser medida na mesma
unidade dos dados originais. Este inconveniente controlado extraindo-se a raiz quadrada da
variância. Deste modo, o desvio padrão (s) é definido como a raiz quadrada da variância.
Propriedades
I. Variância
Somando-se ou subtraindo-se uma constante aos dados a variância não se altera;
36
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Multiplicando todos os dados por uma constante “K”, a nova variância ficará
multiplicada por “K2”;
II. Desvio Padrão
Somando-se ou subtraindo-se uma constante “K”aos dados, o desvio padrão não se
altera;
Multiplicando todos os dados por uma constante “K”, o novo desvio padrão fica
multiplicado por “K”;
Não se devem comparar diretamente duas ou mais medidas de dispersão. Por exemplo, não
se pode afirmar que uma variabilidade medida pelo desvio padrão de 11,20 kg para o peso,
é maior que uma variabilidade, também medida pelo desvio padrão, de 5,5 m para a altura.
É óbvio que não devemos comparar grandezas distintas como as referidas anteriormente
(peso e altura) em relação à sua variabilidade. Para isso, é necessário convertê-las para um
valor relativo. Para resolver esse problema, Karl Pearson, matemático inglês (1857-1936),
que contribuiu significativamente para a ciência estatística, desenvolveu uma medida
relativa, denominada coeficiente de variação (CV), que consta da divisão do desvio padrão
pela média aritmética e, geralmente, expresso em porcentagem, como a expressão abaixo:
37
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
4. PROBABILIDADE
Probabilidade, num conceito amplo, é o estudo dos fenômenos aleatórios. Os fenômenos
estudados em estatística são fenômenos cujo resultado, mesmo em condições normais de
experimentação, variam de uma observação para outra, dificultando dessa maneira a
previsão de um resultado futuro. Para explicação desses fenômenos, chamados de
aleatórios, adota-se o modelo matemático denominado teoria das probabilidades.
Para entender a inferência estatística, é preciso entender vários conceitos de probabilidade.
A probabilidade e a estatística estão estreitamente relacionadas, porque formulam opostos
de questões. Na probabilidade sabemos como um processo ou experimento funciona e
queremos predizer quais serão os resultados de tal processo. Em estatística não sabemos
como um processo funciona, mas podemos observar os resultados e utilizar as informações
sobre os mesmos para conhecer a natureza do processo ou do experimento.
O termo probabilidade é usado de modo muito amplo na conversação diária para sugerir
certo grau de incerteza sobre o que ocorreu no passado, o que ocorrerá no futuro e o que
está ocorrendo no presente.
Logo os modelos probabilísticos podem ser úteis em diversas áreas do conhecimento
humano, como em administração de empresas, ciências econômicas ou comércio exterior.
4.3. Evento
Evento é qualquer conjunto de resultados de um experimento. Sendo o evento um
subconjunto de S, indicaremos os eventos por letras maiúsculas: A, B, C e assim por diante.
Por exemplo, no experimento que consiste no lançamento de um dado, podemos definir o
evento A como “sair um número par”.
38
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
Ou seja:
O valor de P(A) é sempre uma fração compreendida entre zero e um, pois o número de
casos favoráveis nunca pode ser maior que o número de casos possíveis.
Os valores limites de probabilidade são:
a) P(A) = 0 quando A = 0, isto é, não há casos favoráveis; há certeza de não acontecer;
b) P(A) = 1 quando A = S, isto é, todos os casos são favoráveis, havendo certeza do
acontecimento.
A probabilidade do não-acontecimento costuma ser simbolizada pela letra “Q”, onde
Q(A) = 1-P(A). Logo: P(A) + Q(A) = 1.
Onde:
E(x) = esperança matemática de ocorrer o evento x;
39
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
n = número de tentativas;
p = probabilidade de sucesso, ou seja, probabilidade de ocorrer o evento x em uma tentativa
única.
Originalmente o conceito de esperança matemática surgiu em função de sua relação com
jogos de azar e, em sua forma mais simples, é o produto da quantia que um jogador pode
ganhar (o prêmio) pela probabilidade de que isso ocorra.
Exemplo ilustrativo 10: em uma caixa encontram-se 100 canetas, sendo 20 pretas,
50 vermelhas e 30 azuis. Qual o valor esperado de canetas azuis, em 20 retiradas de
uma caneta, se houve reposição da mesma na caixa?
Exemplo ilustrativo 11: Um lojista mantém extensos registros das vendas diárias de
certo aparelho. O quadro a seguir dá o número xi de aparelhos vendidos em uma
semana e a respectiva probabilidade:
Número (xi) 0 1 2 3 4 5
Probabilidade P(X=xi) 0,1 0,1 0,2 0,3 0,2 0,1
Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma
semana?
Solução:
Calculemos inicialmente E(X), que é o número esperado de aparelhos vendidos em uma
semana: E(X) = (0).(0,1) + (1).(0,1) + (2).(0,2) + (3).(0,3) + (4).(0,2) + (5).(0,1) = 2,70. Para x
unidades vendidas o lucro é 20x. Logo, o lucro esperado é de 20.R$ 2,70 = R$ 54,00.
40
Tópicos de Estatística Aplicada
Prof.: Dr. Jaime Martins de Sousa Neto
REFERÊNCIAS
BEZERRA, Antonio Marcos Esmeraldo. Estatística e Experimentação Agrícola. Fortaleza
2004 (Apostila).
CASTANHEIRA, N. P. Estatística aplicada para todos os níveis. 04. ed. Curitiba: Editora
IBPEX Ltda., 2007. v. 01. 305 p.
IBGE. Instituto Brasileiro de Geografia e Estatística. Censo Demográfico de 1940, 1950,
1960, 1970, 1980, 1991 e 2000.
—————. Censo Agropecuário de 1970, 1975, 1980, 1985, 1995 e 2006.
—————. Estatísticas do Registro Civil de 2006, 2007, 2008, 2009 e 2010.
—————. Países, 2012.
—————. Pesquisa Mensal de Emprego de 2011.
—————. Pesquisa Nacional por Amostra de Domicílios (PNAD) de 2002.
LOPES, Paulo Afonso. Probabilidades e Estatística. Rio de Janeiro: Reichmann & Affonso
Editores, 2000.
MELO, F. I. O. . Estatística Aplicada às Ciências Biológicas. I - Estatística Básica.
Fortaleza Ceará: Departamento de Fitotecnia - Universidade Federal do Ceará, 2000
(Apostilas).
WILLCOX, Walter (1938) The Founder of Statistics. Review of the International Statistical
Institute 5(4):321-328.
41