Você está na página 1de 52

Estatstica Aplicada

Autores: Prof. Edwin F. F. Silva


Prof. Wesley Cndido de Melo
Colaboradores: Prof. Santiago Valverde
Prof. Jean Carlos Cavaleiro
Prof. Daniel Scodeler Raimundo
Professores conteudistas: Edwin F. F. Silva e Wesley Cndido de Melo

Edwin F. F. Silva

Possui licenciatura em Fsica pela Universidade Catlica de Braslia (2005); especializao em Higiene das radiaes
ionizantes (Senacap, 2011); em Metodologia do Ensino e Aprendizagem em Matemtica (2009); ps-graduao em
Transporte (em andamento) pela Universidade de Braslia. Atualmente, professor da Faculdade Fortium, ministrando
aulas de clculo e estatstica nos cursos de Sistema de Informaes e Administrao, e da Universidade Paulista, no
curso de Engenharia. Atua em pesquisas relacionadas poluio sonora, na rea de polos geradores de viagens e
tambm como corretor de questes dos cursos de graduao a distncia da UNIP e como tutor do curso de RH da
UNIP Interativa.

Wesley Cndido de Melo

Possui licenciatura em Fsica pela Universidade Catlica de Braslia (2006); especializao em Matemtica
e Estatstica pela FACITEC (2008); ps-graduao em Transporte (em andamento) pela Universidade de Braslia.
Atualmente, professor da Universidade Paulista, ministrando aulas para os cursos de Engenharia, Gesto de RH
e Segurana Privada; da Faculdade JK, nos cursos de Administrao e Radiologia. Atua tambm como corretor de
questes dos cursos de graduao a distncia da UNIP e como tutor do curso de RH da UNIP Interativa. pesquisador
vinculado ao grupo de pesquisa em Poluio sonora com nfase em Rudos aeronuticos no curso de Fsica da
Universidade Catlica de Braslia.

Dados Internacionais de Catalogao na Publicao (CIP)

S586e Silva, Edwin F.

Estatstica aplicada / Edwin F. Silva; Wesley Cndido de Melo.


So Paulo: Editora Sol, 2012.

112 p., il.

Nota: este volume est publicado nos Cadernos de Estudos e


Pesquisas da UNIP, Srie Didtica, ano XVII, n. 2-064/12, ISSN 1517-9230.

1. Estatstica. 2. Distribuio de frequncias. 3. Probabilidades.


I. Ttulo.

CDU 519.2

Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrnico, incluindo fotocpia e gravao) ou arquivada em qualquer sistema ou banco de dados sem
permisso escrita da Universidade Paulista.
Prof. Dr. Joo Carlos Di Genio
Reitor

Prof. Fbio Romeu de Carvalho


Vice-Reitor de Planejamento, Administrao e Finanas

Profa. Melnia Dalla Torre


Vice-Reitora de Unidades Universitrias

Prof. Dr. Yugo Okida


Vice-Reitor de Ps-Graduao e Pesquisa

Profa. Dra. Marlia Ancona-Lopez


Vice-Reitora de Graduao

Unip Interativa EaD

Profa. Elisabete Brihy


Prof. Marcelo Souza
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli

Material Didtico EaD

Comisso editorial:
Dra. Anglica L. Carlini (UNIP)
Dra. Divane Alves da Silva (UNIP)
Dr. Ivan Dias da Motta (CESUMAR)
Dra. Ktia Mosorov Alonso (UFMT)
Dra. Valria de Carvalho (UNIP)

Apoio:
Profa. Cludia Regina Baptista EaD
Profa. Betisa Malaman Comisso de Qualificao e Avaliao de Cursos

Projeto grfico:
Prof. Alexandre Ponzetto

Reviso:
Andria Gomes
Geraldo Teixeira Jr.
Sumrio
Estatstica Aplicada

APRESENTAO.......................................................................................................................................................7
INTRODUO............................................................................................................................................................7

Unidade I
1 HISTRIA DA ESTATSTICA...............................................................................................................................9
1.1 Introduo estatstica.........................................................................................................................9
1.2 Importncia da estatstica..................................................................................................................11
1.3 Elementos fundamentais da estatstica....................................................................................... 12
1.3.1 Populao e amostra.............................................................................................................................. 12
1.4 Fases do mtodo estatstico.............................................................................................................. 13
1.5 Dados estatsticos................................................................................................................................. 13
1.6 Formas iniciais de tratamento dos dados................................................................................... 15
1.7 Notaes por ndices........................................................................................................................... 16
1.7.1 Notao sigma ().................................................................................................................................. 16
1.8 Sries estatsticas.................................................................................................................................. 19
2 APRESENTAO DE DADOS GRFICOS E TABELAS......................................................................... 21
2.1 Elementos bsicos das tabelas......................................................................................................... 27
3 MEDIDAS DE TENDNCIA CENTRAL: MDIA, MODA E MEDIANA PARA
DADOS SIMPLES................................................................................................................................................... 27
3.1 A mdia aritmtica simples (x)........................................................................................................ 28
3.2 A mdia aritmtica ponderada xp.................................................................................................. 30
3.3 A mediana (Md)..................................................................................................................................... 32
3.4 A moda...................................................................................................................................................... 35
3.5 Posio relativa da mdia, moda e mediana.............................................................................. 37
4 MEDIDAS DE DISPERSO PARA DADOS SIMPLES............................................................................... 37
4.1 Amplitude total...................................................................................................................................... 39
4.2 Desvio mdio absoluto........................................................................................................................ 40
4.3 Varincia................................................................................................................................................... 41
4.4 Desvio padro......................................................................................................................................... 46
4.5 Coeficiente de variao...................................................................................................................... 47

Unidade II
5 DISTRIBUIO DE FREQUNCIAS.............................................................................................................. 53
5.1 A construo de uma distribuio de frequncias para dados contnuos..................... 54
5.2 A construo de uma distribuio de frequncias para dados discretos....................... 60
5.3 Representaes grficas de dados agrupados.......................................................................... 61
6 AS MEDIDAS DE POSIO E VARIABILIDADE NUMA DISTRIBUIO DE FREQUNCIA.................70
6.1 As medidas de posio.........................................................................................................................71
6.1.1 A mdia........................................................................................................................................................ 71
6.1.2 A mediana................................................................................................................................................... 72
6.1.3 A moda......................................................................................................................................................... 73
6.2 As medidas de disperso numa distribuio de frequncia................................................. 74
6.2.1 O desvio mdio......................................................................................................................................... 74
6.2.2 Varincia...................................................................................................................................................... 75
6.2.3 Desvio padro............................................................................................................................................ 76
7 INTRODUO PROBABILIDADE.............................................................................................................. 81
7.1 Teorias dos conjuntos, espao amostral e eventos.................................................................. 82
8 PROBABILIDADE: ORIGEM, MTODOS E PRINCIPAIS TEOREMAS................................................. 92
8.1 Origens da probabilidade................................................................................................................... 93
8.1.1 Mtodos objetivos................................................................................................................................... 93
8.1.2 Mtodo subjetivo..................................................................................................................................... 97
8.2 Principais teoremas de probabilidade........................................................................................... 97
APRESENTAO

O objetivo deste material fazer com que o aluno tenha condies de interpretar um conjunto
de observaes de forma clara e objetiva, a fim de distinguir as limitaes e as vantagens do uso de
amostras, assim como os mtodos para sua obteno; tenha habilidade para descrever e interpretar
dados por meio de figuras (tabelas e grficos), estimativas pontuais e de variabilidade; calcular o intervalo
de confiana da proporo e mdia, assim como identificar sua aplicao; coletar e interpretar dados
de forma sistematizada e imprimir credibilidade a anlises quantitativas dos fenmenos de realidade
investigada.

Assim, esperamos contribuir da melhor forma possvel com seu aprendizado.

Com nossos cumprimentos,

Equipe organizadora.

INTRODUO

Desde a Antiguidade, a estatstica faz parte da vida das pessoas, mesmo que de forma indireta, mas o
certo que essa cincia est presente na vida das pessoas o tempo todo. Quando abrimos um jornal, por
exemplo, l est uma srie de grficos e tabelas que nos auxiliam no entendimento de determinado tema,
ou quando lemos uma reportagem que traz como tema a probabilidade de o mercado financeiro fechar
em alta ou em baixa, ou, ainda, virando a pgina desse mesmo jornal, temos a manchete divulgando os
dados do Censo 2010.

Diante desses fatos, nos perguntamos de que forma a estatstica pode nos ajudar, seja no levantamento
de dados para uma empresa saber como vo suas vendas, seja para saber os riscos de investir nas aes
de uma empresa, ou, ainda, como o governo pode determinar as caractersticas dos vrios aspectos,
sociais, econmicos e ambientais dos estados e at mesmo de nosso pas.

So perguntas como essas que a estatstica nos ajuda a responder, e ainda no podemos pensar
nessa cincia como se ela se limitasse a apenas compilar tabelas de dados e os ilustrar graficamente.
Dessa forma, de sua importncia conhecer as inmeras variveis associadas a ela, pois em qualquer
ramo da sociedade contempornea esto presentes os processos estatsticos. E o estudante que no
souber trabalhar com esses conceitos estar em desvantagem no mercado de trabalho.

Para tirar o mximo proveito da interpretao de um determinado fenmeno, deve-se seguir algumas
etapas, como, por exemplo, planejar a obteno de dados, interpretar e analisar os dados obtidos e
apresentar os resultados de maneira a facilitar a tomada de decises razoveis.

fundamental que o texto produzido neste material leve o aluno a pensar em situaes do seu
cotidiano e que dessa forma ele possa associar a teoria com a prtica vivenciada em seu dia a dia.
Pensando nisso, ele foi dividido em duas unidades, nas quais sero abordados, na primeira unidade:
sries estatsticas, grficos estatsticos, medidas de tendncia central, medidas de disperso, entre outros
7
Unidade I

temas; j na segunda unidade, sero apresentados: dados tabulares, distribuio de frequncia, medidas
de posio e variabilidade numa distribuio de frequncia, probabilidade, bem como alguns de seus
teoremas, entre outros temas.

8
ESTATSTICA APLICADA

Unidade I
Como a Unio realiza a distribuio de renda para os Estados, Municpios e o Distrito Federal? Como
saber quem deve receber mais ou menos verbas? Como saber se determinado trecho de uma via ou
rodovia ou no perigoso?

So questes como essas que a disciplina Estatstica procura responder.

1 HISTRIA DA ESTATSTICA

Na histria do desenvolvimento humano, a sociedade primitiva se deparou com os primeiros


problemas para saber o tamanho da sua populao, a quantidade de terras e suas riquezas, por isso teve a
necessidade de cont-las. Em decorrncia disso, os governantes das grandes civilizaes antigas zeram
indiretamente um estudo estatstico para saber os bens que seu Estado possua e como a populao
desse Estado estava distribuda.

No Antigo Egito, aproximadamente 3040 a.C., Herdoto pediu que fosse feito um estudo sobre a
riqueza da populao, com o objetivo de saber a quantidade de recursos econmicos e humanos para
realizar a construo das pirmides. Na China, aproximadamente 2238 a.C., o imperador Yao pediu que
fosse feito um estudo da populao, com objetivos industriais e comerciais.

A palavra estatstica foi sugerida pelo alemo Gottifried Achemmel (1719/1772) e associada
palavra latina status (Estado).

Essa cincia teve acelerado desenvolvimento a partir do sculo XVII, com os estudos de Bernoulli,
Fermat, Laplace, Gauss e outros que estabeleceram suas caractersticas atuais.

Saiba mais
Para uma abordagem mais detalhada da histria da estatstica, ler o
artigo: Conceitos iniciais e breve histrico da estatstica, disponvel em:
<http://mundobr.pro.br/uneal/wp-content/uploads/2010/04/01.conceitos_
inicias-historico-somatorio.pdf>. Acesso em: 12 jul. 2012.

1.1 Introduo estatstica

A todo instante, nos noticirios, em revistas, jornais, internet, ouvimos falar na palavra estatstica,
o que possvel perceber o quanto importante conhecermos a fundo essa cincia. Algumas de
suas aplicabilidades podem ser observadas nas pesquisas de opinio pblica e nos dados publicados
9
Unidade I

diariamente na imprensa. Na realidade, a estatstica contempla muitos outros aspectos, sendo de vital
importncia na interpretao de processos em que exista variabilidade.

De acordo com Dervalmar, possvel distinguir duas concepes para a palavra estatstica. No
plural, estatsticas indica qualquer coleo de dados quantitativos ou, ainda, ramo da matemtica que
trata da coleta, da anlise, da interpretao e da apresentao de massa de dados numricos. Assim,
por exemplo, as estatsticas demogrficas referem-se aos dados numricos sobre o quantitativo de
nascimentos, falecimentos, matrimnios, desquites etc. As estatsticas econmicas esto relacionadas
aos dados numricos como emprego, produo, vendas e com outras atividades ligadas aos vrios
setores da vida econmica.

No singular, estatstica indica a atividade humana especializada, ou um corpo de tcnicas, ou ainda


uma metodologia desenvolvida para a coleta, a classificao, a apresentao, a anlise e a interpretao
de dados quantitativos e a utilizao desses dados para a tomada de decises.

Estatstica um conjunto de mtodos e processos quantitativos que serve para estudar e medir os
fenmenos coletivos.

Para fins didticos, comum os livros-textos apresentarem a estatstica em duas grandes reas,
embora no se trate de reas isoladas: estatstica descritiva e estatstica inferencial.

estatstica descritiva: aquela que tem por objetivo descrever e analisar determinada populao,
utilizando mtodos numricos e grficos para se determinarem padres em um conjunto de
dados, e, assim, apresentar a informao em uma forma conveniente;

estatstica inferencial: aquela que tem por objetivo analisar e interpretar os dados coletados de
uma determinada populao, na maioria das vezes, a partir de resultados observados na amostra.
Constitui o conjunto de mtodos para a tomada de decises nas situaes em que h incerteza,
variaes ou outras generalizaes acerca de um conjunto maior de dados.

Exemplo 1: O grfico a seguir apresenta a participao relativa das bandeiras de cartes de crdito,
no quarto trimestre de 2010.

Master Card
Visa 38,4%
52,2%

Outras
9,4%

Figura 1 - Participao relativa das bandeiras (quantidade de transaes)

10
ESTATSTICA APLICADA

Por meio do grfico, possvel ver claramente que mais da metade das transaes so feitas com
a bandeira Visa e que aproximadamente 40% so feitas com a bandeira MasterCard. Como o grfico
descreve os tipos de bandeiras de cartes utilizadas em todas as transaes do quarto trimestre de 2010,
o grfico um exemplo de estatstica descritiva.

Exemplo 2: ndice Nacional de Preos ao Consumidor (INPC)

Sua apresentao envolve a sintetizao, em um nico dado, dos aumentos dos produtos de uma
cesta bsica. Trata-se de um exemplo de estatstica inferencial.

Exemplo 3: Anlise de mercado

Quando uma empresa pretende lanar um produto, precisa conhecer as preferncias dos consumidores
no mercado de interesse. Faz-se necessria uma pesquisa de mercado.

Exemplo 4: Ocorrncia de terremotos

Os gelogos esto continuamente coletando dados sobre a ocorrncia de terremotos. Gostariam de inferir
quando e onde ocorrero tremores e qual a sua intensidade. Trata-se, sem dvida, de uma questo complexa
que exige longa experincia geolgica, alm de cuidadosa aplicao de mtodos estatsticos.

1.2 Importncia da estatstica

Com o desenvolvimento humano e tecnolgico, temos presenciado grandes descobertas na rea


da sade, da engenharia, da economia etc.; por outro lado, tambm observamos os problemas que
se espalham pelo mundo, por exemplo, a ameaa com a degradao do meio ambiente, as epidemias
(H1N10) causando grandes preocupaes para os governantes e para a populao mundial. Como
ajudar pesquisadores, cientistas, engenheiros etc. a se nortearem com o que deve ser feito tanto para
criar novas possibilidades como tambm para solucionar os problemas existentes?

O mtodo estatstico lida com informaes, associando os dados ao problema, mostrando como e o
que coletar para obter concluses a partir de todos os dados, de tal forma que essas concluses possam
ser entendidas por outras pessoas. Assim, esse mtodo auxilia os vrios profissionais no planejamento e
na tomada de decises.

Saiba mais

O artigo A elaborao de estatsticas de mortalidade segundo causas


mltiplas apresenta uma aplicao da estatstica mostrando a sua
importncia para a tomada de decises. Disponvel em: <http://www.
scielosp.org/pdf/rbepid/v3n1-3/03.pdf>. Acesso em: 15 jul. 2012.

11
Unidade I

Vejamos alguns exemplos:

O governo anualmente divulga o censo sobre a dinmica da populao brasileira, apresentando seu
crescimento demogrfico, suas caractersticas e como vivem os brasileiros.

As grandes empresas fazem levantamentos sobre vendas, produo, inventrio, folha de pagamento
e outros dados, a fim de verificar se a empresa est crescendo, como seu crescimento est em relao a
outras empresas e como tomar decises futuras.

A anlise dos dados muito importante para fazer um planejamento adequado.

Saiba mais

Para mais informaes sobre o Censo, acesse o site do IBGE:


<http://www.ibge.gov.br>.

1.3 Elementos fundamentais da estatstica

1.3.1 Populao e amostra

Para o pesquisador, o estudo de qualquer fenmeno, seja ele natural, econmico, social ou biolgico,
necessita da coleta e da anlise de dados estatsticos. A coleta de dados parte inicial de qualquer
pesquisa.

Populao: o conjunto de todos os itens (pessoas, coisas e objetos) que interessam ao estudo de
um fenmeno coletivo.

Amostra: qualquer subconjunto no vazio de uma populao.

Amostragem: o meio de escolha da amostra e consiste na seleo criteriosa dos elementos a


serem submetidos ao estudo.

Parmetro: a denominao de uma caracterstica numrica estabelecida para toda uma populao.

Estimador: a caracterstica numrica estabelecida para toda a amostra.

Exemplo: pesquisas sobre tendncias de votao.

Em pocas de eleio, comum a realizao de pesquisas com o objetivo de conhecer as tendncias


do eleitorado. Para que os resultados sejam, de fato, representativos, deve-se atentar para que as
caractersticas da populao qual os resultados da pesquisa sero estendidos sejam to prximas
12
ESTATSTICA APLICADA

quanto possvel. A escolha da amostra, o questionrio, a entrevista, a sintetizao dos dados e a


representao dos resultados so as etapas desse tipo de pesquisa.

Parmetro uma Fenmeno coletivo Populao


proporo de votos so todos
para o candidato (Eleies para Prefeitura os eleitores
A obtida na de um municpio). habilitados do
populao municpio.
Amostra
Estimador
uma proporo
de votos para Amostra um grupo
o candidato A numrico de eleitores
obtida na amostra selecionado na
populao do municpio

Figura 2

1.4 Fases do mtodo estatstico

Em uma pesquisa, quando se deseja empreender um estudo estatstico completo, existem fases do
trabalho que devem ser trabalhadas para se chegar aos resultados finais do estudo.

As principais fases so:

definio do problema delimitao do problema;


planejamento organizao das aes que sero realizadas na pesquisa de campo;
coleta de dados ir a campo buscar as informaes;
apurao dos dados organizao das informaes coletadas;
apresentao dos dados grficos e tabelas;
anlise e interpretao dos dados por meio da linguagem matemtica (mdia, mediana,
moda, desvio padro, percentuais etc.).

Observe quais so as fases principais do mtodo estatstico compem a organizao de um projeto,


sua execuo e apresentao final.

1.5 Dados estatsticos

Quando se trabalha com a observao, a mensurao, a anlise e a interpretao de nmeros, esses


nmeros nos conduzem a ndices inflacionrios, ndices de desemprego, probabilidade de determinado
candidato ganhar as eleies etc. Esses nmeros, portanto, sero chamados de dados estatsticos, os
quais precisaro ser organizados e sumarizados para sua correta interpretao.

O dado bruto significa que os dados no esto numericamente organizados e processados.


o processamento e a organizao dos dados que os transformam em informao, enfatizando
13
Unidade I

seus aspectos mais importantes. A informao, portanto, resultado de um tratamento dos


dados.

Para organizar e processar os dados estatsticos, podem-se utilizar resumos visuais e numricos,
como grcos, mapas, tabelas e modelos numricos.

A mensurao ou a observao de itens como ndices de preos, renda mensal per capita de um Estado
etc. do origem aos dados estatsticos. Como esses itens originam valores que tendem a apresentar
certo grau de variabilidade quando so medidos sucessivas vezes, iremos cham-los, ento, de variveis.

importante identificar os quatro tipos de variveis: variveis contnuas, variveis discretas, variveis
nominais e variveis ordinais.

Variveis contnuas: podem assumir qualquer valor num intervalo contnuo (dado contnuo), ou
seja, ser um nmero real. Exemplos: altura, peso, velocidade etc.
Variveis discretas: em geral, originam-se da contagem de itens e s podem assumir valores
inteiros. Exemplos: nmero de alunos em sala de aula, nmero de professores que trabalham na
escola etc.
Variveis nominais: so aquelas que existem com o objetivo de definir categorias, e as observaes,
mensuraes e anlises so feitas levando-se em conta essas mesmas categorias. Exemplos de
categoria seriam: separao por sexo, estado civil, esporte predileto, cor etc.
Variveis ordinais: quando existe o desejo de dispor os elementos observados segundo uma
ordem de preferncia ou desempenho, atribuem-se valores relativos para indicar essa ordem.
Exemplo: primeiro, segundo, terceiro grau de escolaridade etc.

As variveis discretas e contnuas so ditas variveis quantitativas porque envolvem dados numricos.
J as variveis nominais e ordinais precisam ser transformadas em valores numricos para serem objeto
da anlise estatstica, e so ditas variveis qualitativas. Por exemplo: em um departamento da empresa
JJ, que tem 36 funcionrios, fez-se uma pesquisa para verificar alguns dados. Classifique as variveis,
conforme os dados da tabela a seguir.

Tabela 1

Estado civil Grau de instruo N filhos Salrio (X. min) Idade (anos-meses)
Ensino
Solteiro - 4,00 23 03
Fundamental

Casado Ensino 1 4,56 32 10


Fundamental
Casado Ensino Superior 3 19,40 48 11
Solteiro Ensino Mdio - 10,53 25 08
Solteiro Ensino Mdio - 16,22 31 05

14
ESTATSTICA APLICADA

Resoluo

Varivel qualitativa nominal: estado civil.

Varivel qualitativa ordinal: grau de instruo.

Varivel quantitativa discreta: nmero de filhos.

Varivel quantitativa contnua: salrio e idade.

Variveis discretas e contnuas = variveis quantitativas.

Variveis nominais e ordinais = variveis qualitativas.

E ainda:

Dados qualitativos: consistem em atribuir qualidade ou atributo varivel pesquisada.

Dados quantitativos: consistem em nmeros que representam contagens ou medidas.

1.6 Formas iniciais de tratamento dos dados

Em geral, quando nos propomos a buscar ou construir informaes a partir de dados, deparamonos,
inicialmente, com um conjunto de dados brutos que pouco nos dizem. preciso organiz-los
minimamente para que comecem a fazer algum sentido, viabilizando sua anlise.

Exemplo 1: a tabela a seguir apresenta as notas de 40 estudantes da disciplina de estatstica.

Tabela 2

50 96 75 87 65 45 72 10
32 54 25 69 72 30 81 20
24 45 80 90 64 95 23 90
80 35 96 47 65 70 73 63
60 20 45 89 20 90 80 70

Essa tabela chamada de tabela primitiva ou dados brutos, pois os dados coletados esto dispostos
conforme a ordem da coleta e no na ordem de numerao.

Observando os dados anteriores, tabela primitiva, fica difcil visualizar em torno de que valor tendem
a se concentrar as notas dos estudantes, qual a maior ou qual menor nota, e ainda quantos alunos se
acham abaixo de uma dada nota.

15
Unidade I

Uma primeira forma de organizao dos dados brutos o chamado rol. Obtemos o rol quando
organizamos os dados brutos em ordem crescente ou decrescente de grandeza.

Ainda com respeito tabela de nota dos 40 estudantes da disciplina de estatstica, vejamos como fica:

Tabela 3

10 20 20 20 23 24 25 30
32 35 45 45 45 47 50 54
60 63 64 65 65 69 70 70
72 72 73 75 80 80 80 81
87 89 90 90 90 95 96 96

Agora, podemos saber, com relativa facilidade, qual a menor nota (10) e qual a maior nota (96). Para
determinar a amplitude do rol, basta realizar a diferena entre o maior e o menor nmero do rol, ou seja,
para o exemplo, a amplitude de variao foi de 96 10 = 86.

Exemplo 2: seja A = {10, 7, 3, 9, 1, 5, 10, 4, 2, 8} o conjunto das notas dos alunos, determine o rol
e a amplitude do rol:

{10, 7, 3, 9, 1, 5, 10, 4, 2, 8} dado bruto

{1, 2, 3, 4, 5, 7, 8, 9, 10, 10} rol

Amplitude = {maior valor do rol menor valor do rol}

A = 10 1 = 9

Limites de classe: so os nmeros extremos de cada classe; sendo assim, temos um limite inferior
e um superior, que denominamos de amplitude de variao.

A = Lsup. - Linf.

1.7 Notaes por ndices

A notao por ndices bastante utilizada na estatstica, sendo importante esclarecer seu significado.
O smbolo xi (l-se x ndice i) ir representar qualquer um dos n valores assumidos pela varivel x, x1,
x2, x3, x4, ..., xn. n denominado ndice e poder assumir qualquer dos nmeros entre 1, 2, 3, 4,..., n.

1.7.1 Notao sigma ()

A maioria dos processos estatsticos vai exigir o clculo da soma de um conjunto de nmeros. A letra
maiscula grega sigma () utilizada para representar o somatrio.

16
ESTATSTICA APLICADA

Assim, se determinada varivel y tiver os valores 3, 5, 7, 9 e 11, o y ser:

y = 3 + 5 + 7 + 9 + 11

y = 35

Por outro lado, se o consumo semanal de arroz por x, durante um ms, foi 2 kg, 4 kg, 3 kg, 5 kg, o
total consumido por x no ms teria sido:

x = 2 + 4 + 3 + 5

x = 14, x teria consumido 14 kg de arroz durante o ms referido.

A notao sigma possui algumas propriedades que precisamos desenvolver para facilitar os contedos
que estudaremos nesta disciplina.
n
A) x1 = xi = x , isso signica que devemos somar as n observaes de x, comeando com
i=1
a primeira.

Por exemplo, num conjunto de dados x = {2, 4, 6, 8, 10, 12}, em que n = 6, temos:
n 6
xi = xi = 2 + 4 + 6 + 8 + 10 + 12
i=1 i=1

xi = 42
Por outro lado, possvel utilizar essa notao quando se pretende analisar a soma de apenas uma
parte dos dados disponibilizados, podendo-se, portanto, abreviar a soma de um conjunto de dados.
Dessa forma, podemos ter:
3
x1 + x2 + x 3 = xi
1 11
x8 + x 9 + x10 + x11 = xi
i=8

B) Se cada valor da varivel x multiplicado ou dividido por uma constante, temos que isso ser
igual ao valor da constante multiplicado ou dividido pela somatria de x.

c.x = c. x

17
Unidade I

Assim,

4
4 xi = 4 x1 + 4 x2 + 4 x3 + 4 x4
i=1
4
= 4( x1 + x2 + x 3 + x 4 ) = 4 xi
i=1

Por exemplo: se xi = {2, 4, 6, 8, 10, 12}, n = 6, e cada valor de x multiplicado pela constante
c = 2, temos:

cx = c x
6 6
cxi =c xi =2(2) + 2(4) + 2(6) + 2(8) + 2(10) + 2(12) =
i=1 i=1
= 2(2) + 2(44 ) + 2(6) + 2(8) + 2(10) + 2(12)
6 6
2xi = 2 xi = 2(42) = 84
i=1 i=1

C) O somatrio de uma constante c ser igual ao produto da constante pelo nmero de vezes (n) que
ela se repete. Assim, temos:
n
ci = nc
i=i

Por exemplo, numa determinada observao, o conjunto de dados de xi = {7, 7, 7, 7, 7, 7}, n = 6,


temos que xi uma constante c que se repete. Ento, temos:

xi = ci
6 6
xi = ci = nc = 7 + 7 + 7 + 7 + 7 + 7 = 6(7) = 42
i=1 i=1

D) O somatrio de uma soma ou de uma diferena de duas variveis ser igual soma ou diferena
dos somatrios individuais das duas variveis. Assim, temos:

n n n
( xi + yi ) = xi + yi
i=1 i=1 i=1
n n n
( xi yi ) = xi yi
i=1 i=1 i=1

18
ESTATSTICA APLICADA

Por exemplo:

i X Y (X-Y)
1 8 5 3
2 3 2 1
(x y) = 9
3 4 0 4
4 5 4 1
x y = 20 11 = 9
- - - -
20 11 9

Figura 3

E) O somatrio de um conjunto de dados x ao quadrado nos obriga a elevar cada elemento de xi ao


quadrado para efetuar a soma. Assim, temos:
n
xi2 = x12 + x22 + x23 + ... + xn2
i=1

Por exemplo, numa dada observao, o conjunto de dados de xi = {2, 4, 6, 8, 10}, n = 5; temos, ento:
5
xi2 = 22 + 42 + 62 + 82 + 102 =
i=1
= 4 + 16 + 36 + 64 + 100 = 220

F) O somatrio ao quadrado de um conjunto de dados ser obtido tomando-se a soma dos valores
de xi e elevando-se ao quadrado. Assim, temos:

n
( xi )2 = ( x1 + x2 + x 3 + ... + xn )2
i=1

Por exemplo, se temos um mesmo conjunto xi = {2, 4, 6, 8, 10}, n = 5, tal qual no exemplo do item
E, teremos um resultado distinto. Vejamos, neste caso:

5
( xi )2 = (2 + 4 + 6 + 8 + 10)2 = (30)2 = 900
i=1
2
n n
No confunda xi2 com xi , pois, conforme se observa no exemplo anterior, seus resultados
i
sero diferentes. i

1.8 Sries estatsticas

Uma srie estatstica define-se como qualquer tabela na qual haja distribuio de um conjunto de
dados estatsticos em funo da poca, do local ou da espcie. Ou, ainda, no sentido mais amplo, srie

19
Unidade I

uma sucesso de nmeros referidos a qualquer varivel. Caso os nmeros expressem dados estatsticos,
a srie ser chamada de srie estatstica.

As tabelas so utilizadas para apresentar sries estatsticas. Os trs caracteres presentes na tabela
que as apresenta so:

a poca (fator temporal ou cronolgico) a que se refere o fenmeno estudado;


o local (fator espacial ou geogrfico) onde o fenmeno acontece;
o fenmeno (espcie de fato ou fator especfico) que descrito de forma categrica.

As sries so divididas em dois grupos:

1. Sries homgradas: onde h variao discreta ou descontnua na varivel descrita. Podem ser
do tipo temporal, geogrfica ou especfica.

Srie temporal: os dados so observados de acordo com a poca de ocorrncia (fator cronolgico).
Isso significa que o tempo varivel e o local e a espcie (fenmeno) so elementos fixos. Essa
srie tambm chamada de histrica ou evolutiva. Exemplo:

Tabela PIB Brasileiro de 2010 a 2015

Tamanho do Posio na economia


Ano PIB (nominal) crescimento (real) mundial
2015 R$ 5,904 trilhes -3,847% 9
2014 R$ 5,521 trilhes 0,5% 7
2013 R$ 5,316 trilhes 3,015% 7
2012 R$ 4,806 trilhes 1,915% 7
2011 R$ 4,375 trilhes 4% 6
2010 R$ 3,887 trilhes 7,529% 7

Srie geogrfica: apresenta como elemento varivel o fator geogrfico. A localidade o elemento
varivel e a poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial, territorial
ou de localizao. Exemplo:

Tabela Variao do PIB dos pases em 2015 (em % sobre o ano anterior)

Pases Variao do PIB (%)


China 6,9
EUA 2,4
Reino Unido 2,2
Frana 1,2
Alemanha 1,7
Brasil - 3,8

20
ESTATSTICA APLICADA

Srie especfica: o carter varivel apenas o fato ou espcie, o tempo e o local so fixos.
Tambm chamada de srie categrica. Exemplo:

Tabela PIB por setor econmico 4 trimestre de 2015

Setor Valor corrente (R$) Variao trimestral Variao anual


Brasil 1,481 Trilho -1,7% -2,5%
Agropecuria 64,264 Bilhes -2,0% +2,1%
Indstria 295,223 Bilhes -6,7% -4,7%
Servios 907,708 Bilhes -2,9% -1,6%
Famlias 937,195 Bilhes -4,5% -1,8%
Governo 289,137 Bilhes -0,4% -1,1%
Investimento 268,430 Bilhes -15,0% -11,2%

2. Sries hetergradas: so aquelas nas quais o fenmeno/fato apresentam gradaes ou


subdivises. Embora seja fixo, o fenmeno varia em intensidade.

A distribuio de frequncias uma srie hetergrada e ser vista com detalhes mais adiante.

2 APRESENTAO DE DADOS GRFICOS E TABELAS

A representao grfica das sries estatsticas tem por finalidade sintetizar os resultados obtidos e,
assim, chegar a concluses sobre a evoluo do fenmeno ou sobre como se relacionam os valores da
srie. O grfico mais apropriado ficar a critrio do pesquisador, respeitando os elementos de clareza,
simplicidade e veracidade (NOGUEIRA, 2009).

Diretrizes para a construo de um grfico:

o ttulo do grfico deve ser o mais claro e completo possvel, sendo necessrio acrescentar subttulos;

a orientao geral dos grficos deve ser da esquerda para a direita;

as quantidades devem ser representadas por grandezas lineares;

sempre que possvel, a escala vertical h de ser escolhida de modo a aparecer a linha 0 (zero);

s devem ser includas no desenho as coordenadas indispensveis para guiar a vista na leitura, um
tracejado muito cerrado dificulta o exame do grfico;

a escala horizontal deve ser lida da esquerda para a direita e a vertical de baixo para cima;

os ttulos e as marcaes do grfico dispor-se-o de maneira que sejam facilmente legveis,


partindo da margem horizontal inferior ou da margem esquerda.

21
Unidade I

Leitura e interpretao de um grfico:

declarar qual o fenmeno ou fenmenos representados, a regio considerada, o perodo de tempo,


a fonte dos dados etc.;

examinar o tipo de grfico escolhido, verificar se o mais adequado, criticar a sua execuo, no
conjunto e nos detalhes;

analisar cada fenmeno separadamente, fazendo notar os pontos mais em evidncia, o mximo e
o mnimo, as mudanas mais bruscas;

investigar se h uma tendncia geral crescente ou decrescente ou, ento, se o fato exposto
estacionrio;

procurar descobrir a existncia de possveis ciclos peridicos, qual o perodo aproximado etc.

Eis os tipos mais comuns de grficos:

Grfico em linha
500
400
300
Srie 1
200
Srie 2
100
0
1 2 3 4 5 6 7

Figura 4

Grfico em colunas

Populao
100
80
60
Populao
40
20
0
1940 1950 1960 1970

Figura 5

22
ESTATSTICA APLICADA

Grfico em barras

semelhante ao grfico em colunas, porm os retngulos so dispostos horizontalmente.

Populao do Brasil

1970

1960
Populao do
1950 Brasil

1940

0 20 40 60 50 100

Figura 6

Grfico em setores

Anos Faturamento de uma empresa (em milhes)


2008 3
2009 4
2010 5
Total 12

Figura 7

a representao grfica de uma srie estatstica, em crculo, por meio de setores. utilizado
principalmente quando se pretende comparar cada valor da srie com o total.

Total __________360
Parte___________ x

Para 2008: 12 - 360


3 - x
x = 90

Para 2009: 12 - 360


4 - x
x = 120

Para 2010: 12 - 360


5 - x
x = 150

23
Unidade I

2008

2009

2010

Figura 8

Grfico polar

a representao de uma srie por meio de um polgono. Movimento mensal de compras de uma
agncia em 1972.

Tabela 4

Meses Valores (R$ 1.000,00)


Janeiro 12
Fevereiro 13
Maro 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18

Jan
Dez 20 Fev
15
Nov Mar
10
5 Srie 1
Out 0 Abr

Set Mai

Ago Jun
Jul
Figura 9

24
ESTATSTICA APLICADA

Grfico carta geogrfica

a representao grfica de um mapa geogrfico indicando um acontecimento, por exemplo,


a previso de tempo para determinado dia em determinado Estado ou pas. A figura a seguir um
cartograma que informa a produo de petrleo segundo suas regies geogrficas.

Cartograma 1.2 Produo de petrleo,


segundo regies geogrficas (milhes b/d) 2003

Europa e Ex-Unio Sovitica

7,9

14,2

22,6 7,9
Amrica do
Norte

8,4 sia-Pacfico
Oriente
Mdio
frica

6,7
Amricas
Central e do Sul

Figura 10

Nota: inclui leo de xisto, leo de areias betuminosas o LGN, exceto para o Brasil.

Para o Brasil, inclui LGN e no inclui leo de xisto e leo de areias betuminosas.

Pictograma

a representao grfica mais utilizada na atualidade por jornais e revistas, pois um grfico de
forma atraente e de fcil interpretao. Mostra o fenmeno estudado inserido com um grfico de linha,
coluna, barra ou de setor, conforme o exemplo a seguir, em que um outdoor aponta a verba gasta com
publicidade junto com um grfico de linha para mostrar seu desempenho anual.

25
Unidade I

Figura 11

Publicidade em alta

Institucional De utilidade
167 pblica 532,1
Oramento prev 158,1
aumento de 20%
em gastos da 425,1
administrao direta
120,2
Valor da 294,7
publicidade
Em R$ Milhes
80,1 152,6
2007 2008 2009 2010 2007 2008 2009 2010

Figura 12

Saiba mais

Aplicao de grficos de controle de Soma Acumulada (CUSUM) para


monitoramento de um processo de usinagem. Disponvel em: <http://
dspace.universia.net/bitstream/2024/542/1/ArtigoXVISIMPEP2009.PDF>.
Acesso em: 20 jul. 2012.

26
ESTATSTICA APLICADA

2.1 Elementos bsicos das tabelas

Uma forma de sintetizar os valores que uma ou mais variveis podem assumir por meio de uma
tabela.

Uma tabela constituda dos seguintes elementos:

Quadro 1

Ttulo o conjunto de informaes que precede a tabela e contm a indicao dos fatores: o
qu? Quando? Onde?
Cabealho a parte superior da tabela que especifica o contedo das colunas.
Corpo da tabela o espao que contm as informaes sobre o fenmeno observado.
Fonte a indicao da entidade responsvel pelo levantamento dos dados.

Ttulo Produo de petrleo em barris/dia


Total
Estado e Regio Cabealho
Barris/dia
Rio de Janeiro 1.597.387
Esprito Santo 193.962
Coluna
indicadora Amazonas 52.964
Bahia 49.472
Rio Grande do Norte 60.861
Sergipe 42.072
So Paulo 16.983
Alagoas 6.300
Cear 7.530
Paran (xisto) 3.393
Rodap

Figura 13

3 MEDIDAS DE TENDNCIA CENTRAL: MDIA, MODA E MEDIANA PARA


DADOS SIMPLES

No desenvolvimento de um estudo estatstico, muitas vezes invivel examinar todos os elementos


da populao de interesse para tirar concluses; pensando nisso, h medidas que possibilitam
condensar as informaes para esclarecer a fase analtica da estatstica descritiva. A inferncia
estatstica nos d elementos para generalizar, de maneira segura, as concluses obtidas da amostra
para a populao.

Quando se trata de amostra, a preocupao central que ela seja representativa.

27
Unidade I

Assim que decidimos extrair informaes por meio de um levantamento amostral, temos
imediatamente dois problemas:

definir cautelosamente a populao de interesse;


selecionar a caracterstica que iremos pesquisar.

Portanto, temos situaes profissionais em que nos bastam poucos dados ou estatsticas de dados
simples. Por outro lado, tm-se tambm situaes em que um nmero maior de elementos deve ser
investigado e tratado como distribuies de frequncia.

Quando estamos diante de um conjunto de dados, seja ele pequeno ou grande, em geral buscamos
medidas que possam ser usadas para indicar um valor que tende a representar melhor aquele determinado
conjunto de nmeros. E as medidas mais usadas nesse sentido so as chamadas medidas de tendncia
eventual ou central, que so a mdia, a mediana e a moda.

Sabe-se que esses valores sero medidos de forma distinta conforme um grande conjunto de dados
ou um pequeno conjunto de dados. Tambm o clculo desses valores ser afetado caso as variveis
sejam discretas ou contnuas.

Em estatstica, a mdia o valor mdio de uma distribuio ou de um conjunto de dados,


determinado segundo uma regra estabelecida a priori e que se utiliza para representar todos os
valores da distribuio. Existem diversas formas de calcular a mdia de um conjunto de nmeros,
por exemplo, algumas delas so: mdia aritmtica, mdia aritmtica ponderada, mdia geomtrica e
mdia harmnica.

Observao

Neste mdulo, trataremos do clculo dessas estatsticas para os


chamados dados simples ou conjuntos de dados com menos de 30
elementos.

3.1 A mdia aritmtica simples (x)

A mdia aritmtica um dos valores mais representativos de um conjunto de dados. Obtm-se o


valor da mdia aritmtica dividindo-se o somatrio dos valores do conjunto de dados pelo nmero de
valores total desse conjunto.

Na mdia aritmtica, temos como smbolo: x (l-se x trao ou x barra).

Assim, temos que, para a amostra, se calcula o valor mdio utilizando-se os seguintes parmetros:

28
ESTATSTICA APLICADA

n x Mdia aritmtica da amostra (estimativa)


xi , onde n Nmero de dados da amostra
i=1
x=
n xi Cada varivel da amostra

Vamos, agora, tomar um exemplo de mdia aritmtica. Supondo um conjunto de dados


x i = {2, 4, 6, 8, 10,12}, onde n = 6, temos:

n
xi 2 + 4 + 6 + 8 + 10 + 12
i=1
x= = =7
n 6

Exemplo 1:

Uma amostra das notas das provas de matemtica dos estudantes da 7 srie de uma grande escola
de So Paulo xi, em que:

xi = {87, 42, 64, 58, 90, 90, 85, 63, 47, 74, 100, 94} e n = 12, temos:

n
xi 87 + 42 + 64 + 58 + 90 + 90 + 85 + 63 + 47 + 74 + 100 + 94
i=1
x= = = 74, 5
n 12

A nota mdia na prova de matemtica dos estudantes da 7 srie dessa escola de So Paulo, por
amostragem, 74,5.

Observao

So as propriedades que a mdia aritmtica simples possui que a fazem


a medida de tendncia central mais usada e mais importante de todas.

So propriedades da mdia aritmtica:

em um conjunto de dados, sempre possvel o clculo da mdia, independentemente de quais


elementos compem esse conjunto de dados;
em um determinado conjunto de dados, o valor da mdia ser nico e corresponder a uma constante;
todos os valores de determinado conjunto de dados iro afetar a mdia, se um valor se modifica,
a mdia aritmtica tambm se modificar; somando-se ou subtraindo-se uma determinada
constante c a cada elemento de um determinado conjunto de dados xi = x1, x2, x3, ..., xn, a mdia

29
Unidade I

aritmtica ficar aumentada ou diminuda dessa constante c; se, por outro lado, multiplicarmos
cada elemento desse conjunto de dados por uma constante c, a nova mdia ser tambm
multiplicada por essa constante c; se dividirmos cada elemento do conjunto de dados por essa
mesma constante c, a mdia ser dividida por c.

Assim, se temos um conjunto xi = x1, x2, x2, ..., xn, a mdia ser:
n
x1 , logo:
i=1
x1 =
n
n n
(c + x i ) xi nc
i=1 i=1
x2 = x2 = + x2 = x1 + c
n n n
a soma algbrica dos desvios dos nmeros de um conjunto de dados em torno da mdia zero,
isso pode ser representado da seguinte forma:

xi x = 0
Por exemplo, se temos um conjunto de dados xi = (2, 4, 6, 8, 10), onde n = 5, temos que:
5
xi 2 + 4 + 6 + 8 + 10
i=1
x= = =6
5 5
Se aplicarmos a frmula acima, temos:

xi x = xi 6 = (2 6) + (4 6) + (6 6) + (8 6) + (10 6)
xi x = 4 2 + 0 + 2 + 4
xi x = 0

Observao

A mdia aritmtica a mais utilizada em nosso dia a dia. obtida


dividindo-se a soma das observaes pelo nmero delas.

3.2 A mdia aritmtica ponderada xp

Num conjunto de dados em que cada elemento ou cada observao possui a mesma importncia,
o clculo da mdia aritmtica simples mostrar bem a populao ou a amostra estudada. No
entanto, se queremos atribuir pesos distintos ou importncias distintas aos elementos de um
30
ESTATSTICA APLICADA

conjunto de dados, a estatstica a ser adotada a mdia aritmtica ponderada, em que a cada
valor xi dever ser atribudo um determinado peso pi. A expresso estatstica para o clculo da
mdia ponderada :
n
xipi
i=1
xp = n
pi
i=1

Supondo que um estudante tenha de efetuar uma srie de quatro exames para obter sua mdia
final e passar de ano, cada exame possui um peso diferente na composio dessa mdia, conforme a
tabela a seguir:

Exame Nota Peso xipi


i=1
1 68 0,30 xp = n
, logo
2 89 0,20 pi
i=1
3 45 0,40 (0, 30)68 + (0,20)89 + (0, 40)45 + 0,10(100)
xp =
4 100 0,10 0, 30 + 0,20 + 0, 40 + 0,10
1,00 xp = 20, 4 + 17,8 + 18 + 10 = 66,2

Figura 14

A nota mdia ser, ento, 66,2, resultado diferente do que seria obtido se utilizssemos a mdia
aritmtica simples.

Num conjunto de dados, em que cada elemento ou cada observao possui importncia diferente,
utilizamos a mdia aritmtica ponderada.

Exemplificando as mdias aritmtica e ponderada:

Mdia aritmtica exemplo: um aluno tirou as notas 5, 8 e 6 em trs provas. A sua mdia aritmtica
ser (5 + 8 + 6)/3 = 6,33

Mdia ponderada exemplo: um aluno fez um teste (peso 1) e duas provas (peso 2),
tirando 8 no teste, 5 na primeira prova e 6 na segunda prova. A sua mdia (ponderada)
ser [(1 x 8) + (2 x 5) + (2 x 6) ]/5 = 6. Se o teste e a prova tivessem o mesmo peso (e
no importa qual o valor do peso, importa apenas a relao entre os pesos), a mdia seria,
aproximadamente, 6,33.

Distribuio por frequncia a tabela em que se organizam grandes quantidades de dados,


determinando o nmero de vezes que cada dado ocorre frequncia (fi) e a porcentagem com que
aparece frequncia relativa (fr).

31
Unidade I

Observao

fi = n nmero total de observaes;

xi = valor da varivel ou pontos mdios de classes;

k = nmero de classes ou de valores individuais diferente da varivel.

Exemplo: em uma turma, a nota atribuda a 28 alunos, referente a um teste de estatstica, foi
disposta em ordem crescente: 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 10.

Observando que algumas notas se repetem, podemos utilizar o nmero de observaes ou frequncia
de cada um deles como o peso ou fator de ponderao.

Assim:

(4x4)+(7x5)+(5x6)+(5x7)+(4x8)+(2x9)+(1x10)
x = ---------------------------------------------------------------------------------------------------- = 6,29
4+7+5+5+4+2+1

Utilizando uma tabela para representar a distribuio de frequncia, temos:

Tabela 5

xi fi xi fi
4 4 4 x 4 = 16
5 7 5 x 7 = 35
6 5 6 x 5 = 30 x f 176
7 5 7 x 5 = 35 x = -----------i----i--- = -------------- = 6,29
n 28
8 4 8 x 4 = 32
9 2 9 x 2 = 18
10 1 10 x 1 = 10
28 176

3.3 A mediana (Md)

Outra medida importante de um conjunto de dados a mediana. A mediana divide determinado


conjunto de dados que dever estar ordenado em dois grupos iguais, em que metade ter valores
menores, e metade ter valores maiores que a mediana.

Antes de calcular a mediana, preciso organizar os valores num rol em ordem crescente, para ento
contar at a metade dos valores e encontrar a mediana. Em geral, aps organizarmos os dados em um
rol, podemos calcular a posio da mediana com a frmula a seguir:
32
ESTATSTICA APLICADA

(n+1)
Posio mediana = --------------
2

Em que n o nmero de dados observados. Por exemplo, para um conjunto de dados


xi = {6, 9, 3, 5, 2, 9, 5, 5, 8, 7, 1, 7, 2}, em que n = 13, temos primeiro que organizar esses
dados em um rol e depois encontrar a posio da mediana para ento saber qual ser a
mediana. Seno, vejamos:

rolxi - {1, 2, 2, 3, 5, 5, 5, 6, 7, 7, 8, 9, 9}

(n+1) 13+1
Posio mediana = -------------- = -------------- = 7 (7 posio)
2 2

Md = 5

A mediana outra medida de posio definida como o nmero do meio, quando as medidas so
organizadas em ordem ascendente ou descendente. Em outras palavras, a mediana de um conjunto de
termos ordenados o valor situado de tal forma no conjunto que o separa em dois subconjuntos de
mesmo nmero de elementos.

Observao

Se o nmero de elementos for mpar, ento a mediana ser exatamente


o valor do meio. Se o nmero de elementos for par, ento a mediana ser
exatamente a mdia dos dois valores do meio.

Para determinar a mediana:

organize o conjunto de dados em um rol;


para um conjunto de dados cujo n = mpar, a mediana ser o valor do meio;
para um conjunto de dados cujo n = par, a mediana ser a mdia dos dois valores do meio.

Para um conjunto de dados xi = {6, 4, 8, 3, 2, 9, 7, 1}, em que n = 8, temos, ento:

rolxi = {1, 2, 3, 4, 6, 7, 8, 9}

(n+1) 8+1
Posio mediana = -------------- = -------------- = 4,5
2 2

A mediana ser o valor que est a meio caminho dos dois valores mdios; nesse caso, entre 4 e 6.
Como fazer? Deve-se tirar a mdia entre os dois valores do meio para obter o valor da mediana.

33
Unidade I

Assim, temos:

4+6
Md = -------------- = 5
2

Observao

Quando usamos a mediana?

Empregamos a mediana quando:

desejamos obter o ponto que divide a distribuio em partes iguais;


h valores extremos que afetam de maneira acentuada a mdia;
a varivel em estudo salrio.

Em teoria da probabilidade e em estatstica, a mediana uma medida de tendncia


central, um nmero que representa as observaes de determinada varivel, de tal forma que
esse nmero, a mediana, de um grupo de dados ordenados, separa a metade inferior da amostra,
populao ou probabilidade de distribuio, da metade superior. Mais concretamente, 1/2 da
populao ter valores inferiores ou iguais mediana, e 1/2 da populao ter valores superiores
ou iguais mediana.
n + 1
Em casos de populaes (n) mpares, a mediana ser o elemento de posio central .
2
Para os casos de populaes (n) pares, a mediana ser o resultado da mdia simples dos elementos
n n + 1
de posio central e . Por exemplo, para as seguintes sries, temos:
2 2
Exemplo 1

1, 3, 5, 7, 9, o n da srie mpar, temos:

n + 1

2
5 + 1

2
3 posio

A mediana igual a 5, pois a 3 posio da srie.

34
ESTATSTICA APLICADA

Exemplo 2

1, 2, 4, 7, 9, 10, o n da srie par, temos:

n n + 1
e
2 2
6 6 + 1
e
2 2
3ee44
3

A mdia ser a mdia entre o 3 e o 4 elemento da srie, que ser:

3 = 4

4 = 7
4 + 7
Md =
2
Md = 5,5
Md 5, 5

3.4 A moda

Muitas vezes, em um conjunto de dados, existem valores que se repetem com frequncia maior.
A moda justamente esse valor ou esses valores que mais se repetem em um conjunto de dados.
possvel haver estatsticas que no possuam moda ou que possuam mais de uma moda.

No exemplo que demos anteriormente, para um conjunto de dados xi = {1, 2, 3, 4, 6, 7, 8, 9}, no


existe moda, e diz-se que o conjunto ou distribuio amodal.

A moda uma estatstica muito mais descritiva e sua importncia cresce medida que um valor ou grupo
de valores se repete mais que outros, e nesse sentido a moda indicaria o valor tpico daquele conjunto de
dados com maior ocorrncia. Por exemplo, o conjunto de dados xi = {2, 2, 7, 9, 9, 9, 10, 10, 11, 12, 18} tem
moda igual a 9, porque o nmero 9 aquele com maior frequncia, repetindo-se trs vezes.

Denominamos moda o valor ou valores de um conjunto de dados que aparecem com maior
frequncia em uma srie. Por exemplo: o salrio modal dos professores de uma escola o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa escola.

A moda pode apresentar mais de um valor, diferentemente da mdia ou da mediana. especialmente


til quando os valores ou observaes no so numricos, uma vez que a mdia e a mediana podem no
ser bem definidas.

A moda de {pera, pera, banana, limo, limo, limo, pssego} limo.


35
Unidade I

A srie {1, 3, 4, 5, 5, 6, 6} apresenta duas modas (bimodal): 5 e 6.

A srie {1, 3, 2, 5, 8, 7, 4, 9} no apresenta moda.

Exemplo

Sabendo-se que a produo leiteira diria de uma vaca, durante uma semana, foi de 10, 14, 13, 15,
16, 18 e 12 litros, pede-se que se encontre a mdia, a moda e a mediana para a produo diria de leite
dessa vaca.

Mdia
n
xi 10 + 14 + 13 + 15 + 16 + 18 + 12 98
i=1
x= = = = 14
n 7 7

Logo, x = 14 litros de leite em mdia por dia, o que significa uma produo de 98 litros de leite em
mdia por semana.

Observao

A mdia pode ser um nmero diferente de todos os valores da amostra


que ela representa.

Moda

Como no possui um valor que aparece com maior frequncia que os outros, no h valor de moda
para esse exemplo.

Mediana

Ordenando os dados de forma crescente, temos: 10 - 12 - 13 - 14 - 15 16 18

n + 1
Posio mediana =
2
7 + 1
Posio mediana =
2
Posio mediana = 4

Mediana ser o 4 elemento da srie, que igual a 14 litros de leite por dia.

36
ESTATSTICA APLICADA

Observao

Cada frequncia acumulada a soma das frequncias anteriores


classe.

f1a = f1
f2a = f1a + f2
f3a = f2a + f3
f4a = f3a + f4
...........
fna = f(n-1)a + fn

3.5 Posio relativa da mdia, moda e mediana

Em uma distribuio de frequncias simtricas, as medidas de mdia, mediana e moda coincidem.


J quando a assimetria torna-se diferente, essa diferena tanto maior quanto a assimetria.
Resumidamente, temos:

(a) (b) (c)

x = Md = Mo Mo Md x x Md Mo

Figura 15 - Distribuies: (a) simtrica, (b) assimtrica e (c) assimtrica negativa.

a) x = xmd = Mo curva simtrica


b) Mo< xmd < x curva assimtrica positiva
c) x < xmd < Mo curva assimtrica negativa

4 MEDIDAS DE DISPERSO PARA DADOS SIMPLES

Observamos que a moda, a mediana, e a mdia podem ser usadas para condensar, num nico nmero,
aquilo que mdio ou tpico de um conjunto de dados. No entanto, a informao fornecida pelas
medidas de posio necessita, em geral, ser complementada pelas medidas de disperso. Essas medidas
so usadas para indicar o quanto os dados se apresentam dispersos em torno da regio central. Dessa
forma, caracterizam o grau de variao existente no conjunto de valores. As medidas de disperso mais
utilizadas so:

amplitude total;
37
Unidade I

desvio padro;
varincia;
coeficiente de variao.

Note que, quanto maiores forem as medidas de disperso, mais heterogneos so os dados e, ao
contrrio, quanto menores forem essas medidas, mais homogneo o conjunto.

Vejamos a seguir alguns exemplos que mostram a necessidade de conhecermos as medidas de disperso.

Exemplo 1

Sabe-se que em Honolulu (Hava) e em Houston (Texas) a temperatura mdia diria quase a
mesma, em torno de 23,9 C. Pergunta-se: ser que, por isso, podemos inferir que a temperatura seja
basicamente a mesma em ambas as localidades? Ou no ser possvel que, enquanto uma cidade
melhor para natao, a outra o seja para atividades externas?

A temperatura em Honolulu varia muito pouco ao longo do ano, oscilando, em geral, entre 21,1 C
e 26,7 C. Por outro lado, a temperatura em Houston pode diferir sazonalmente (nas estaes do ano),
isto , apresentar-se baixa em janeiro (cerca de 4,4 C) e alta em julho e agosto (bem perto de 37,8 C).
Logo, podemos perceber uma oscilao significativa. Desnecessrio dizer que as praias em Houston no
esto cheias de gente o ano todo.

Exemplo 2

Suponha que, numa particular cidade, tanto ladres quanto professores secundrios tenham uma
renda mdia mensal de R$ 900,00. Ser que essa informao indica que as duas distribuies de renda
so, necessariamente, semelhantes? Muito ao contrrio, poder-se-ia descobrir que elas diferem, e
muito, num outro aspecto importante, que o fato de as rendas dos professores concentrarem-se ao
redor de R$ 900,00 (serem constantes, homogneas), enquanto as dos ladres espalham-se mais (so
descontnuas, heterogneas), o que reflete, portanto, maiores oportunidades para prises, desemprego,
pobreza e, em alguns casos, fortunas excepcionais.

Os fatos mostram que precisamos, alm de uma medida de tendncia central, de um ndice que
sinalize o grau de disperso dos dados em torno da mdia. Esse ndice uma medida indicativa do que
costumamos chamar de variabilidade ou disperso.

Retornando ao exemplo 1, poderamos concluir que a distribuio de temperatura em Houston


(Texas) tem maior variabilidade do que a distribuio de temperaturas em Honolulu (Hava). Da mesma
forma, podemos dizer que a distribuio de rendas entre professores apresenta menos variabilidade do
que a distribuio de rendas entre ladres.

Assim, quando se deseja entender, analisar e descrever de forma adequada um determinado conjunto
de dados, faz-se necessrio dispor no apenas de informaes relativas s medidas de posio. preciso
38
ESTATSTICA APLICADA

que se disponha de informaes relativas variabilidade (disperso) daqueles nmeros que compem o
referido conjunto de dados. Essas medidas de variabilidade ou disperso indicam se os dados observados
esto prximos ou separados uns dos outros.

Diferente das medidas de posio, as medidas de disperso no so autoexplicativas, sua aplicabilidade


depende da comparao de populaes ou de amostras do mesmo tamanho e da mesma caracterstica
para que se obtenha alguma informao importante a partir daquela determinada variabilidade.

As principais medidas de disperso so: a amplitude total (ou intervalo), o desvio mdio, a varincia
e o desvio padro. A mdia serve de referncia para todas essas medidas, exceto para o intervalo (ou
amplitude total). proporo que essas medidas se elevam, isso representa um aumento da disperso,
o que significa que, se a medida for igual a zero, no existe disperso.

As medidas de variabilidade, que tm a mdia aritmtica como ponto de referncia, so importantes


porque nos permitem avaliar o grau de disperso das observaes em relao a essa mesma mdia,
isto , permitem-nos avaliar o quo distante os dados de um determinado grupo de observaes esto
da mdia calculada, dando-nos uma noo mais precisa da situao de determinada populao ou
amostra, alm de condies de tirar concluses e informaes importantes daqueles dados disponveis.

Exemplo 3

Um estudante de economia resolve fazer uma pesquisa sobre os salrios mdios dos funcionrios
de determinado setor industrial em So Paulo. Nessa pesquisa, esse estudante conseguiu os seguintes
dados em termos de salrios mnimos mensais:

xi = {1.0; 1.5; 2.0; 2.0; 2.0; 2.5; 3.0; 3.0; 80.0; 85.0}

Ao calcular o salrio mdio desse setor, ele chegou ao valor mdio de 18,2 salrios mnimos por ms.
Ora, mas esse dado, sem o clculo de sua disperso em relao mdia aritmtica, pouco nos diz sobre
a realidade dessa populao, e acabamos por ter uma viso distorcida do padro de vida da maior parte
dos funcionrios desse setor analisado pelo estudante. As medidas de variabilidade ou disperso nos
permitem perceber essa distoro.

Temos, como principais medidas de disperso, intervalo, desvio mdio, varincia e desvio padro.

As medidas mais comuns de variabilidade para dados quantitativos so a varincia; a sua raiz
quadrada e o desvio padro. A amplitude total, a distncia interquartlica e o desvio absoluto so mais
alguns exemplos de medidas de disperso.

4.1 Amplitude total

O intervalo ou amplitude total de determinado conjunto de dados obtido pela diferena entre o
maior e o menor valor nesse conjunto de nmeros. Indica, portanto, a distncia entre a maior e a menor
observao de um conjunto de dados. Assim, temos:
39
Unidade I

Amplitudetotal = Valormximo - Valormnimo

Por exemplo, num conjunto de dados xi = {2, 3, 3, 5, 5, 5, 8, 10, 12}, em que n = 9, a amplitude total
ser:

Atotal = Vmximo - Vmnimo = 12 - 2 = 10

Em alguns casos, o intervalo ou amplitude total pode ser expresso simplesmente pela indicao
do menor e do maior nmero do conjunto de dados. No caso do exemplo anterior, a amplitude total
poderia ser expressa simplesmente pela identificao do menor e do maior nmero, indicada como
sendo de (2 a 12) ou (2 12).

A grande vantagem da amplitude total que ela apresenta certa facilidade de ser calculada, mesmo
quando o conjunto de dados observados relativamente grande. No entanto, como a amplitude total
apenas leva em conta os dois extremos do conjunto de nmeros, em alguns casos ela pode ser uma
medida enganosa quanto indicao da disperso de um conjunto de nmeros, tendo, portanto, uma
utilidade limitada.

O intervalo de determinado conjunto de dados obtido pela diferena entre o maior e o menor valor
nesse conjunto de nmeros.

4.2 Desvio mdio absoluto

O desvio mdio absoluto inaugura o estudo das medidas de variabilidade que tm a mdia como
ponto de referncia.

O chamado desvio nada mais que a diferena entre cada valor de determinado conjunto de
dados e a mdia desse mesmo conjunto de nmeros (xi - x). O valor absoluto de um nmero ser
ele prprio, sem o sinal que lhe associado, e indicado por meio de duas linhas verticais que o
enquadram.

Assim, |-67| = 67; |9| = 9.

preciso calcular primeiro a mdia aritmtica dos dados disponveis, que em geral se apresentam
como dados amostrais.

O desvio mdio absoluto ser calculado pela mdia dos desvios dos valores a contar da mdia,
ignorando o sinal (+ ou -) do desvio, ou seja, convertendo os valores dos desvios em valores absolutos,
considerando-os todos desvios positivos. Assim, temos:
n

Dmdio = xi x
i=1
n

40
ESTATSTICA APLICADA

Em que n o nmero de observaes.

Vamos, agora, tomar um exemplo de desvio mdio. Num conjunto de dados amostrais xi = {2, 4, 6, 8, 10, 12},
em que n = 6, determine o desvio mdio. Temos, ento:

Dmdio = xi x
n

Precisamos, primeiro, calcular a mdia, para ento passarmos ao clculo do desvio mdio. Relembrando
a frmula do clculo da mdia aritmtica, temos:

x=
xi x = 2 + 4 + 6 + 8 + 10 + 12 = 7 x = 7
n 6

Agora, podemos calcular os desvios para cada valor do conjunto de dados. Assim, temos:

xi - x
27 -5 Dmdio = xi x =
5 + 3 + 1 + 1 + 3 + 5
47 -3 n 6
67 -1
Dmdio = 5 + 3 + 1 + 1 + 3 + 5 = 3
87 1 6
10 7 3
Dmdio = 3
12 7 5
0

Figura 16

O valor encontrado anteriormente representa a diferena mdia de cada observao e a mdia da


distribuio, mas tambm nesse caso s seria possvel obter mais informaes a partir do desvio mdio
comparando com outras populaes ou amostras de mesmas caractersticas. Por exemplo, se outro
conjunto de dados, com as mesmas caractersticas e tamanho, apresentasse um desvio mdio absoluto
igual a 2,4, ou seja, menor que o desvio mdio absoluto calculado no exemplo anterior, poder-se-ia dizer
que esse segundo conjunto de valores mais homogneo do que o nosso exemplo, j que a diferena
de cada um dos seus elementos em relao mdia aritmtica menor. Teramos, assim, uma disperso
menor.

O desvio que a diferena entre cada valor de determinado conjunto de dados a mdia desse
mesmo conjunto de nmeros.

4.3 Varincia

Como no clculo do desvio mdio, para o clculo da varincia, precisaremos utilizar o desvio de
cada elemento de um conjunto de dados em relao mdia aritmtica (xi - x). No entanto, ao invs de
41
Unidade I

trabalharmos com os valores absolutos (em mdulo), agora os desvios so elevados ao quadrado antes
da soma. Para o caso de dados amostrais, ao invs de dividirmos por n, dividimos por n 1 (que o total
da amostra menos uma unidade).

A varincia ir nos dizer o grau de disperso de determinado grupo de dados com relao mdia
aritmtica desses nmeros. Assim, a varincia populacional poder ser calculada da seguinte forma:

2: Varincia populacional;
xi: Cada observao do conjunto de
2
=
( xi )2
, onde
dados populacional;
n : Mdia da populao;
n: Nmero de observaes.

A varincia amostral poder ser calculada pela seguinte frmula:

s2: Varincia da amostra;


xi: Cada observao do conjunto
amostral;
s 2
=
( xi x )2 , onde
x: Mdia da amostra;
n 1 n: Nmero de observaes da
amostra.

Por exemplo, seja determinado conjunto de dados xi = {1, 3, 5, 7, 9, 11, 13}, em que n = 7. Calcule a
varincia desse conjunto de dados, supondo:

que esse conjunto de dados representa toda uma populao;


que esse conjunto de dados representa uma amostra.

A) Para calcular a varincia desse conjunto de dados, considerando que ele representa toda uma
populao, devemos utilizar a seguinte frmula:

2
=
( xi )2
n
Devemos passar ao clculo da mdia desse conjunto de dados para, ento, proceder ao clculo da
varincia. Sendo assim, temos:

=
xi =
n
1 + 3 + 5 + 7 + 9 + 11 + 13
= = 7 (mdia populacional)
7
=7

42
ESTATSTICA APLICADA

Partindo da mdia, podemos agora calcular os desvios e partir para o clculo da varincia populacional,
j que supomos que o conjunto de dados representava toda a populao. Assim, temos:

xi - (xi - )2
7 71=6 62
2 =
(xi )2
7 73=4 42 N
7 75=2 2 2
6 + 42 + 22 + ( 2)2 + ( 4 )2 + ( 6)2
2
2 =
7 77=0 0 7
7 79=-2 (-2)2 2 36 + 16 + 4 + 4 + 16 + 36
= = 16
7
7 7 11 = - 4 (-4)2
2 = 16
7 7 13 = - 6 (-6)2
0 112
Figura 17
Desse modo, a varincia populacional desse conjunto de dados seria igual a 16.

B) Se, por outro lado, temos o mesmo conjunto de dados e supondo que ele representa apenas dados
amostrais, devemos calcular a varincia amostral de outra forma, partindo do clculo da mdia
para, ento, calcularmos a varincia.

Como vimos no item 2, a expresso para o clculo da mdia aritmtica em uma amostra a mesma
do clculo da mdia para uma populao, mas utilizaremos para as amostras outra notao. Vejamos:

x=
xi x = 7 (mdia amostral).
n
Normalmente, a mdia amostral aproxima-se da mdia populacional quanto maior o tamanho da
amostra, mas no se iguala a ela.

Passemos, ento, ao clculo da varincia amostral. Utilizaremos os mesmos passos do clculo da


varincia populacional. Dessa forma:

s2 =
(xi x)2
n 1
x xi - x (xi - x)2
7 71=6 62
S2
=
( xi x )2
7 73=4 42 n 1
7 75=2 22 62 + 42 + 22 + ( 2)2 + ( 4 )2 + ( 6)2
S2 =
7 77=0 0 7 1
7 79=-2 (-2)2 36 + 16 + 4 + 4 + 16 + 36 112
S2 = =
7 1 6
7 7 11 = - 4 (-4)2
S2 = 18,666...
7 7 13 = - 6 (-6)2
0 112

Figura 18

43
Unidade I

A varincia amostral desse conjunto de dados igual a 18,666.

Como a mdia aritmtica, a varincia possui algumas propriedades importantes que devemos colocar
em destaque e que facilitam o clculo de alguns problemas mais complexos.

A) Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de dados, o valor


da varincia no se altera.

Por exemplo, um conjunto de dados xi = {2, 4, 6, 8}, em que n = 4, e a mdia igual a 5. A varincia
desse conjunto ser dada como segue:
2
=
( xi )2
2 =
(2 5)2 + (4 5)2 + (6 5)2 + (8 5)2
n 4

2
=
( 3) + ( 1) + 12 + 32 9 + 1 + 1 + 9 20
2 2
= = =5
4 4 4

Se somarmos uma constante c = 4 a cada um dos elementos do conjunto de dados, temos um novo
conjunto de dados yi = {6, 8, 10, 12}, em que a mdia ser igual a 9. A varincia ser, ento:
2
22 =
( yi 2 ) =
(6 9) + (8 9) + (10 9) + (12 9)
2 2 2 2

n 4

22 =
( 3) + ( 1) + (1) + (3)
2 2 2 2
=
9 + 1 + 1 + 9 20
= =5
4 4 4

Sendo assim, demonstramos que 2 = 22 =, ou seja, ao somarmos uma constante a cada elemento
de um conjunto de dados, a varincia permanece a mesma.

B) Ao multiplicarmos uma constante c a cada elemento de um conjunto de dados, temos uma nova
varincia ao multiplicarmos a varincia do conjunto de dados original por c2.

Assim, a nova varincia ser representada da seguinte forma:

22 = c2 .12

C) Ao dividirmos cada elemento de um conjunto de dados por uma constante arbitrria c, obtemos
a nova varincia dividindo-se a antiga varincia por c2.

Assim, podemos apresentar a nova varincia da seguinte forma:


12
22 =
c2
D) A varincia de uma constante igual a zero.

44
ESTATSTICA APLICADA

Existe uma frmula alternativa e reduzida para o clculo da varincia populacional, deduzida da
frmula original, que :

2
=
xi2
2
n
Para a varincia amostral, tambm existe uma frmula alternativa bastante utilizada que no exige
o clculo da mdia e que decorre da frmula anterior:

s2x =
xi2 ( xi )2 n
n 1

Lembrete

Relembrando as propriedades de varincia:

ao somarmos uma constante a cada elemento de um conjunto de dados, a varincia permanece


a mesma;
ao multiplicarmos uma constante c a cada elemento de um conjunto de dados, temos uma nova
varincia ao multiplicarmos a varincia do conjunto de dados original por c2;
ao dividirmos cada elemento de um conjunto de dados por uma constante arbitrria c, obtm-se
a nova varincia dividindo-se a antiga varincia por c2;
varincia de uma constante igual a zero.

Saiba mais

Para aprofundamento do tema desta unidade, seguem alguns links que


podem auxili-lo:

Mtodos quantitativos e estatsticos para a tomada de deciso.


Disponvel em: <http://www.santahelena.ueg.br/posgraduacao/mba/2007/
download/metodosquantitativos/METODOS_QUANTITATIVOS_PARTE_I.pdf>.
Acesso em: 25 jul. 2012.

Estatstica exploratria. Disponvel em: <http://www.cin.ufpe.br/~psb/


EAD/Estatistica%20Exploratoria%20-%20Volume%201%20v11.pdf>.
Acesso em: 25 jul. 2012.

45
Unidade I

4.4 Desvio padro

Obtm-se o desvio padro extraindo-se a raiz quadrada da varincia. Assim como a varincia e
o desvio mdio, o desvio padro tambm representa uma medida de variabilidade absoluta, e indica
o desvio de cada um dos nmeros xi de um dado conjunto de observaes em relao mdia .
tambm chamado por alguns autores de desvio da raiz mdia quadrtica.

Matematicamente, o desvio padro poder ser representado da seguinte forma:

Desvio padro populacional Desvio padro amostral

=
(xi )2 s=
(xi x)2
n n 1

Por exemplo, um conjunto de dados amostrais xi = {2, 4, 6}, em que n = 3 e a mdia igual a 4.
Vamos, ento, calcular o desvio padro para a amostra:

s=
(xi x)2 = (2 4 )2 + (4 4 )2 + (6 4 )2
=
n 1 3 1
( 2)2 + 0 + 22 8
s= = = 4 =2
2 2

Esse conjunto de dados ir apresentar um desvio padro igual a 2.

As propriedades da varincia tambm so aplicveis ao desvio padro. No entanto, existem duas


propriedades que sero distintas no caso do desvio padro por causa de sua caracterstica de raiz
quadrada mdia positiva da varincia.

Assim, ao multiplicarmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padro ser igual ao antigo multiplicado pela constante. Temos, ento:

2 = c . 1

Por outro lado, se dividirmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padro ser igual ao anterior dividido pela constante c. Assim, temos:
1
2 =
c
As demais propriedades da varincia sero as mesmas para o desvio padro.

46
ESTATSTICA APLICADA

4.5 Coeficiente de variao

Em estatstica descritiva, o coeficiente de variao serve para indicar se o desvio padro


grande ou pequeno em relao mdia aritmtica da srie que est sendo estudada; portanto,
uma comparao entre o desvio padro e a mdia aritmtica de uma pesquisa que vai determinar
em porcentagem o quanto houve de desvio em relao mdia. O coeficiente de variao
calculado por:
s , onde:
Cv =
x
S = desvio padro;

x = mdia aritmtica, que pode ser de uma srie populacional ou amostral.

Por exemplo, no item 4.4, foi determinado o desvio padro de uma srie amostral, portanto, vamos
calcular o coeficiente de variao dessa srie, que ser:

S
Cv =
x
2
Cv =
4
Cv = 0, 5
Cv = 50%

Nesse exemplo, o coeficiente de variao grande, indica que a variabilidade foi a metade em
relao mdia dessa srie.

As propriedades da varincia se aplicam ao desvio padro, exceto:

quando multiplicarmos cada elemento de um conjunto de dados por uma constante c, o novo
desvio padro ser igual ao antigo multiplicado pela constante;
quando dividirmos cada elemento de um conjunto de dados por uma constante c, o novo desvio
padro ser igual ao anterior dividido pela constante c.

Em probabilidade e estatstica, o desvio padro a medida mais usada da disperso estatstica.


No seno como a raiz quadrada da varincia, ou, ainda, a raiz quadrada da mdia aritmtica dos
quadrados dos desvios, tomados a partir da mdia aritmtica. definido dessa forma de modo a dar-nos
uma medida da disperso que seja:

um nmero que no seja negativo;


use as mesmas unidades de medida que os nossos dados.

47
Unidade I

Faz-se uma distino entre o desvio padro (sigma) do total de uma populao ou de uma varivel
aleatria e o desvio padro s de um subconjunto em amostra.

O termo desvio padro foi introduzido na estatstica por Karl Pearson, em seu livro Sobre a disseco
de curvas de frequncia assimtricas, de 1894.

Exemplo

Utilizando-se o exemplo apresentado anteriormente, temos que a produo leiteira diria de uma
vaca, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, pede-se calcular a amplitude, o desvio
padro (S), a varincia (S2) e 5 o coeficiente de variao (CV).

Soluo

Amplitude

R = 18 10 = 8 litros de leite, ou seja, a maior variao do nmero de litros de leite produzido por
dia pela vaca de 8 litros.

Observao

Sabemos que a mdia para esses dados : x = 14 litros de leite por dia.

Desvio padro
n
( x1 x )
2

s= i=1
=
( x1 x )2 + ( x2 x )2 + ... + ( xn x )2 =
n 1 n 1

(10 14 )2 + (14 14 )2 + (13 14 )2 + (15 14 )2 + (16 14 )2 + (18 14 )2 + (12 14 )2 =


7 1

( 4 )2 + (0)2 + ( 1)2 + (1)2 + (2)2 + (4 )2 + ( 2)2 + = 16 + 0 + 1 + 1 + 4 + 16 + 4


=
42
=
6 6 6

7 2,65 litros de leite por semana

Varincia

S2 = (S)2 = (2,65)2 7 (litros de leite)2

Coeficiente de variao

48
ESTATSTICA APLICADA

S 2, 65
cv = = = 0,1893 ou seja, existe uma variabilidade de 18,93% dos dados em relao mdia.
x 14

Saiba mais

Dica de leitura:

Anlise do risco na avaliao de projetos de investimentos: uma


aplicao do mtodo de Monte Carlos. Disponvel em: <http://www.
regeusp.com.br/arquivos/c6-Art7.pdf>. Acesso em: 18 jul. 2012.

Resumo

Nesta unidade, vimos que a estatstica utiliza mtodos matemticos


para solucionar problemas reais de tomada de deciso quando h incerteza.

Em situaes nas quais poderamos contar unicamente com a sorte,


temos um instrumento que nos possibilita aumentar as chances de tomar
a melhor deciso.

Utiliza ferramentas matemticas definidas e, mesmo lidando com


grande nmero de dados, essas ferramentas resumem a anlise em tabelas
ou grficos. Na prtica, a estatstica pode ser empregada como base
conceitual e fundamental em vrias outras cincias, inclusive em anlises
gerenciais.

Foram apresentados tambm os clculos de medidas de tendncia


central (mdia, mediana, moda), as quais so utilizadas para representar
a srie pesquisada. Vimos que, por meio delas, podemos observar o
comportamento da varivel que as originou, isto , nos d uma ideia da
tendncia de todo um conjunto de dados. E, ainda, foram apresentadas de
forma resumida as ideias de simetria e assimetria em funo das medidas
de tendncia central.

Foram abordadas questes a respeito da distribuio de frequncia


e suas representaes grficas, estudo das medidas de disperso e
variabilidade; e, por fim, foi apresentado um estudo de introduo ao clculo
da probabilidade que nos ajuda a entender o significado de fenmenos
aleatrios para o entendimento do que provvel e presumvel e ainda os
vrios tipos de fenmenos em distribuio de probabilidade.

49
Unidade I

Exerccios

Questo 1 (ENEM/2011 adaptada). Uma equipe de especialistas do centro meteorolgico de uma


cidade mediu a temperatura do ambiente, sempre no mesmo horrio, durante 15 dias intercalados,
a partir do primeiro dia de um ms. Esse tipo de procedimento frequente, uma vez que os dados
coletados servem de referncia para estudos e verificao de tendncias climticas ao longo dos meses
e anos. As medies ocorridas nesse perodo esto indicadas a seguir:

Dia do ms Temperatura
(em C)
1 15,5
3 14
5 13,5
7 18
9 19,5
11 20
13 13,5
15 13,5
17 18
19 20
21 18,5
23 13,5
25 21,5
27 20
29 16

Em relao temperatura, os valores da mdia, mediana e moda so, respectivamente, iguais a:

A) 17oC, 17oC e 13,5oC.

B) 17oC, 18oC e 13,5oC.

C) 17oC, 13,5oC e 18oC.

D) 17oC, 18oC e 21,5oC.

E) 17oC, 13,5oC e 21,5oC

Resposta correta: Alternativa B.

50
ESTATSTICA APLICADA

Anlise das alternativas

Com os dados fornecidos, tem-se a seguinte tabela de frequncias:

xi 13,5 14 15,5 16 18 18,5 19,5 20 21,5


fi 4 1 1 1 2 1 1 3 1

1) Para calcular a mdia tem-se:

13, 5.4 + 14.1 + 15, 5.1 + 16.1 + 18.2 + 18, 5.2 + 19, 5.1 + 20.3 + 21, 5.1 255
X= = = 17
4 + 1+ 1+ 1+ 2 + 1+ 1+ 3 + 1 15
A mdia 17oC.

2) A mediana (valor do oitavo termo) 18oC.

3) A moda 13,5oC.

Sendo assim,

A) Alternativa incorreta.

Justificativa: de acordo com os clculos.

B) Alternativa correta.

Justificativa: de acordo com os clculos.

C) Alternativa incorreta.

Justificativa: de acordo com os clculos.

D) Alternativa incorreta.

Justificativa: de acordo com os clculos.

E) Alternativa incorreta.

Justificativa: de acordo com os clculos.

Questo 2 (ENEM/2011). A participao dos estudantes na Olimpada Brasileira de Matemtica das


Escolas Pblicas (OBMEP) aumenta a cada ano. O quadro indica o percentual de medalhistas de ouro,
por regio, nas edies da OBMEP de 2005 a 2009.

51
Unidade I

Regio 2005 2006 2007 2008 2009


Norte 2% 2% 1% 2% 1%
Nordeste 18% 19% 21% 15% 19%
Centro-Oeste 5% 6% 7% 8% 9%
Sudeste 55% 61% 58% 66% 60%
Sul 21% 12% 13% 9% 11%

Disponvel em: http://www.obmep.org.br. Acesso em: abr. 2010 (adaptado).

Em relao s edies de 2005 a 2009 da OBMEP, qual o percentual mdio de medalhistas de ouro
da regio Nordeste?

A) 14,6%.

B) 18,2%.

C) 18,4%.

D) 19,0%.

E) 21,0%.

Resoluo desta questo na plataforma.

52