Você está na página 1de 28

ESTATÍSTICA

Clique na imagem para visualizar o vídeo.

Há muitos e muitos anos a estatística é usada como ferramenta de apoio à análise e à


tomada de decisão. Há registros de levantamentos feitos na China mais de dois mil
anos antes de Cristo! Nos dias de hoje, quando o volume de dados e de informações
cresce exponencialmente e as técnicas computacionais permitem análises cada vez
mais sofisticadas, a estatística vem, a cada dia, ganhando mais e mais destaque.
Grande parte do avanço da ciência decorre de pesquisas amplamente calcadas em
técnicas modernas de análises de dados. Em todas as áreas, o conhecimento da
estatística tem se mostrado fundamental, mesmo naquelas em que os profissionais
costumam se proclamar pouco afeitos às ciências “exatas”.
Por sorte, a evolução tecnológica tem nos trazido computadores mais poderosos e
softwares mais sofisticados, muitos deles disponíveis de graça para os usuários. Muito
embora tal facilidade esteja amplamente disponível, para se usufruir dela e a cada dia
mais acompanhar o seu desenvolvimento conceitual e prático avançado, para que haja
evolução e destaque nessa área de atuação, é necessário conhecer os seus conceitos
básicos a fim de começar a realizar análises minimamente embasadas.

De acordo com esse contexto, a disciplina de Estatística foi concebida para


explorarmos juntos os seus conceitos e técnicas fundamentais, que vão lhe
proporcionar o ingresso nesse campo de conhecimento. Na disciplina, abordaremos
desde os conceitos iniciais para análises simples de dados — como as medidas
estatísticas e a construção de gráficos e tabelas — até a análise da relação entre duas
variáveis, sempre com a preocupação de mostrar como o conhecimento pode ser
aplicado na prática.

Aproveite este conteúdo e não deixe de interagir com sua turma e tutor.

Bons estudos!
Objetivos

Ao final desta disciplina, você deverá ser capaz de:

• Realizar a coleta, a descrição e a análise dos dados


referentes a um conjunto amostral
• Utilizar as premissas e axiomas de probabilidade para
análise de situações de cunho prático
• Compreender as aplicações das distribuições de
probabilidades no escopo da inferência estatística
• Construir intervalos de confiança e análises de associação
entre variáveis para embasamento do processo decisório

Conteúdo Programático

Esta disciplina está organizada de acordo com as seguintes


unidades:

• Unidade 1 – Introdução ao Estudo Estatístico


• Unidade 2 – Probabilidade
• Unidade 3 – Distribuições de probabilidades
• Unidade 4 – Intervalos de Confiança e Relação entre Variáveis

Autoria

Professor Alcindo Miranda


É mestre em Educação Matemática pela Universidade Santa Úrsula – USU.
Professor do Centro Federal de Educação Tecnológica Celso Suckow da
Fonseca – Cefet-RJ e da Universidade Veiga de Almeida – UVA.

Professora Ana Maria Vianna


Possui ensino superior e técnico em Estatística pela Escola Nacional de
Ciências Estatísticas - ENCE/IBGE, mestrado em Engenharia de Produção pelo
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia –
COPPE/UFRJ e especialização em Avaliação pela Universidade de Brasília –
UnB. Leciona Estatística no ensino superior desde 1987, dentre outras
disciplinas. Atua como professora de matemática na rede pública do estado do
Rio de Janeiro e no município de Mesquita, onde também é coordenadora de
matemática dos anos finais.

Professora Roberta Mendiondo


Graduada em Matemática pela Universidade Federal do Rio Grande do Sul –
UFRGS (2000), mestre em Engenharia Ambiental pelo Instituto Federal
Fluminense – IFF (2012). Docente em nível de graduação desde 2006. Professora
da Universidade Veiga de Almeida – UVA desde 2009, atuando em ensino
pesquisa e extensão. Pesquisadora em ensino, líder de grupo de pesquisa
registrado no CNPq. Experiência de 21 anos em docência.

Professor Walter Sande


É doutor em Administração de empresas pela Escola Brasileira de
Administração Pública e de Empresas – Ebape/FGV, mestre em Administração
de empresas pelo Instituto de Pós-Graduação e Pesquisa em Administração
COPPEAD/UFRJ, graduado em Matemática pela Universidade do Estado do Rio
de Janeiro – UERJ e em Engenharia Mecânica pelo Instituto Militar de
Engenharia – IME.

Revisão e atualização
Professora Ana Mônica de Paula
É graduada em Ciências Econômicas (1998) e mestre em Economia (2005),
ambos pela Universidade Federal da Bahia. Experiência profissional em
elaboração, avaliação e análise de projetos, e pesquisa de mercado, atuando
principalmente nos seguintes temas: descentralização, desenvolvimento local,
políticas públicas e economia local. Atua há 16 anos em docência superior.
Professora do Centro Universitário Jorge Amado – Unijorge desde 2014, atuando
nas modalidades presencial e a distância, da graduação e pós-graduação.
Introdução ao estudo estatístico
A Estatística muitas vezes é entendida apenas como tabelas, índices e gráficos
associados a economia, esportes, desemprego, natalidade, dentre outros; no máximo
como responsável por previsões de resultados eleitorais. Porém, o trabalho da
Estatística contempla o planejamento da pesquisa, a coleta de dados, a organização
dos dados para gerar informação, a interpretação e a análise desses dados e a
apresentação de resultados de forma que possam subsidiar processos de tomada de
decisão mais razoáveis.

A Estatística se ocupa do tratamento de dados de maneira que possa extrair


informações desses dados.

Podemos dividir a estatística em duas partes: a estatística descritiva e a estatística


inferencial. Nesta unidade trataremos da estatística descritiva.

Saiba Mais

A estatística descritiva, trata da maneira como podemos apresentar


(descrever) um conjunto de dados organizados em tabelas e gráficos, e
sua síntese por meio de medidas estatísticas. Essas medidas são
classificadas como medidas de posição, que incluem a média, a moda e a
mediana, e medidas de dispersão, que incluem a variância, o desvio-
padrão e o coeficiente de variação.

Saiba Mais

A estatística inferencial fundamenta-se na teoria das probabilidades para


estabelecer conclusões sobre um grupo inteiro, denominado população,
podendo utilizar-se somente da observação de uma parte desse todo,
denominado amostra.

Objetivo
Ao final desta unidade, você deverá ser capaz de:

• Realizar a coleta, a descrição e a análise dos dados referentes a


um conjunto amostral.

Conteúdo Programático
Esta unidade está organizada de acordo com os seguintes temas:

• Tema 1 - A estatística no Brasil e no mundo


• Tema 2 - Elaboração e análise de gráficos e tabelas
• Tema 3 - Medidas de posição e de dispersão

Clique na imagem para visualizar o vídeo.

Estudo de caso – Empreendendo: Sanduíche na Praia


Dois jovens pretendem realizar uma viagem e, para conseguir o dinheiro necessário,
resolvem iniciar vendas de sanduíches. Não tendo sucesso, recorrem ao tio da garota
para que ele avalie a eficiência da pesquisa de mercado que fizeram. Nesta avaliação,
o tio mostra como a falta de conhecimento estatístico básico pode levar dados corretos
a conclusões equivocadas.
Como você planejaria a pesquisa de mercado para a venda de sanduíches na praia?
Quais informações seriam levantadas nesta pesquisa?
Qual o instrumento você utilizaria para coletar os dados?
Como faria o tratamento desses dados de forma que deles pudessem ser extraídas as
informações que deseja?
Que medidas (posição e/ou dispersão) resumiriam melhor os dados, de acordo com o
que deseja de informação?

A Estatística é a ciência adequada para responder essas questões!


Tema 1

Estatística no Brasil e no mundo

Para que serve a estatística no Brasil e no mundo?

Clique na imagem para visualizar o vídeo.

Nesta aula, o objetivo é que você conheça melhor algumas aplicações da estatística
em diferentes áreas do conhecimento e em diferentes partes do mundo. Nesse
sentido, a seguir apresentamos tanto instituições que utilizam estatísticas quanto
alguns dos métodos utilizados por elas. A presença da estatística será mostrada por
meio de tabelas, gráficos, índices, médias e outras medidas importantes.

No Brasil
Veja alguns exemplos de uso da estatística para analisar dados e prover informações
úteis para a sociedade. Vamos começar com exemplos de dentro do Brasil.
IBGE
A instituição mais importante que trata de estatísticas no país é o Instituto
Brasileiro de Geografia e Estatística – IBGE, que realiza, a cada década, o censo
populacional, quando pesquisa sobre a população do país. Além disso,
anualmente, o IBGE desenvolve a Pesquisa Nacional por Amostras de
Domicílios – PNAD, que coleta dados de uma amostra da população brasileira.
Segundo o IBGE, a PNAD:

Segundo a definição da ONU, "um recenseamento de população pode ser


definido como o conjunto das operações que consistem em recolher,
agrupar e publicar dados demográficos, econômicos e sociais relativos a
um momento determinado ou em certos períodos, a todos os habitantes de
um país ou território".

Conjunto de elementos que têm pelo menos uma característica em


comum, que formam um todo, também chamado de universo – todos os
elementos de um conjunto.

Subconjunto de elementos de uma população – parte de uma população.


Esse subconjunto deve ter dimensão menor que o da população e seus
elementos devem representar de forma adequada a população.

A seleção dos elementos que irão compor a amostra pode ser feita de
várias maneiras e irá depender do conhecimento que se tem da população
e da quantidade de recursos disponíveis.

“... investiga anualmente, de forma permanente, características gerais da


população, de educação, trabalho, rendimento e habitação e outras, com
periodicidade variável, de acordo com as necessidades de informação para o
País, como as características sobre migração, fecundidade, nupcialidade, saúde,
segurança alimentar, entre outros temas. O levantamento dessas estatísticas
constitui, ao longo dos 49 anos de realização da pesquisa, um importante
instrumento para formulação, validação e avaliação de políticas orientadas para
o desenvolvimento socioeconômico e a melhoria das condições de vida no
Brasil.”

IDH
A partir de pesquisas censitárias realizadas pelo IBGE e de acordo com a PNAD
(2017), são definidos o Índice de Desenvolvimento Humano – IDH no Brasil e
correspondentes IDH municipais — IDHM.

(Fonte: PNUD)

(Fonte: PNUD)
O IDH faz parte do Programa das Nações Unidas para o Desenvolvimento, e,
segundo este, o IDH:

“O Índice de Desenvolvimento Humano (IDH) é uma medida resumida do


progresso a longo prazo em três dimensões básicas do desenvolvimento
humano: renda, educação e saúde. O objetivo da criação do IDH foi o de
oferecer um contraponto a outro indicador muito utilizado, o Produto Interno
Bruto (PIB) per capita, que considera apenas a dimensão econômica do
desenvolvimento. Criado por Mahbub ul Haq com a colaboração do economista
indiano Amartya Sen, ganhador do Prêmio Nobel de Economia de 1998, o IDH
pretende ser uma medida geral e sintética que, apesar de ampliar a perspectiva
sobre o desenvolvimento humano, não abrange nem esgota todos os aspectos
de desenvolvimento.”

(Fonte: PNUD)
B3 (Bolsa de valores oficial do Brasil)
O Ibovespa é o resultado de uma carteira teórica de ativos. Seu objetivo é ser o
indicador do desempenho médio das cotações dos ativos de maior
negociabilidade e representatividade do mercado de ações brasileiro,
representando um índice de retorno total das ações negociadas na bolsa de
valores.

Na página da B3 ainda é possível acompanhar as cotações das ações de


empresas listadas na Bolsa por meio de gráficos que representam séries
temporais, observadas a cada 15 minutos.

Séries Temporais: dados observados em diferentes instantes do tempo,


seja diariamente (preço de ações, relatórios meteorológicos), mensalmente
(taxa de desemprego, IPC), trimestralmente (PIB).

Ouro no futebol olímpico


O goleiro Weverton conhecia estatísticas sobre
o último batedor, Petersen: ele havia batido
metade das cobranças para cada canto da rede,
o que não ajudava muito na tomada de decisão.
Ao analisar melhor os dados, verificou que em
momentos mais tensos, como seria o caso da
final olímpica, ele batia para o lado esquerdo.
Com esse conhecimento proporcionado pelas análises estatísticas, o goleiro
escolheu o canto certo e garantiu a oportunidade de consolidar a medalha de
ouro para a seleção olímpica brasileira.

Veja uma reportagem completa sobre o impacto da Estatística nessa conquista,


a partir de entrevista com o goleiro campeão.
Processos eleitorais
O Superior Tribunal Eleitoral mantém uma página com
estatísticas sobre eleitores, candidatos e resultados
das eleições, com informações como escolaridade,
faixa etária, sexo, idade, profissão, partido das
candidaturas e relação candidato–vaga.
Você pode explorar essas informações diretamente do
site do Superior Tribunal Eleitoral

Para saber mais sobre como são planejadas e realizadas as pesquisas


eleitorais, assista ao vídeo Dando IBOPE, no qual um funcionário do
IBOPE expõe os métodos que o instituto utiliza e esclarece algumas
dúvidas comuns dos eleitores. Afinal, por que muitos de nós nunca fomos
entrevistados e, mesmo assim, a maioria das pesquisas eleitorais acaba
apontando corretamente os resultados das eleições?

No mundo
Veja agora exemplos de aplicação da Estatística no mundo em geral.

A paralisia infantil e o Zé Gotinha

O que a erradicação da paralisia infantil e o


Zé Gotinha têm a ver com a estatística?
Assista ao vídeo Lembranças de Sofia para
entender o papel do método estatístico na
erradicação da Poliomielite, doença que atingia
milhares de crianças pelo mundo.

A questão central era como testar a efetividade de


um novo medicamento. Por meio do planejamento realizado ao testar a vacina Salk,
a bióloga Sofia apresentou alguns aspectos importantes que devem ser levados em
consideração.
Terremoto na Itália
Já no primeiro mês do ano de 2017, os
italianos sofreram com uma avalanche
causada por tremores de terra que soterrou
um hotel de luxo na cordilheira dos Montes
Apeninos, na foto abaixo. Ainda em agosto de
2016, ocorreram 298 mortes causadas por
terremoto nas províncias de Marca e Rieti, e
Fonte: ansabrasil.com.br
os tremores não pararam.

A elaboração de estatísticas sobre os tremores se torna fundamental para a tomada


de decisões, por parte das autoridades, que proporcionem mais segurança à
população. Nesse sentido, o Instituto nacional de Geofísica e Vulcanologia monitora
os dados sísmicos e elabora estatísticas que subsidiam possíveis intervenções de
segurança. Nesta página do INGV, é possível observar uma tabela com dados dos
últimos terremotos, como magnitude, província de ocorrência, profundidade e
posição geográfica, a qual pode ser exportada em alguns formatos.

Terremoto na Itália
A Comissão de Estatística da Organização das Nações Unidas – ONU aprovou, em
março de 2016, um conjunto de 230 indicadores globais que serão utilizados para
monitorar e revisar o cumprimento dos Objetivos de Desenvolvimento Sustentável –
ODS no mundo. Essa comissão estabelece padrões estatísticos globais, conceitos e
métodos e a implementação de ações em nível nacional e internacional para o
atingimento dos ODS.

Fonte: sustainabledevelopment.un.org

Os indicadores são globais e não necessariamente adequados a contextos


nacionais, os quais podem precisar do desenvolvimento de mecanismos específicos
para avaliar seus progressos. Dos países, será requerido que gerem um grande
volume de dados para que o atingimento dos ODS possa ser monitorado.

Terremoto na Itália
JSegundo a Harvard Business Review , o
cientista de dados será o profissional mais
cobiçado do século 21, e, dentre outras
habilidades, ele precisa conhecer Estatística
para realizar análises sobre Big Data, de forma
a entregar às empresas informações
relevantes que alavancarão seus lucros e
posição no mercado.

Veja trechos da matéria intitulada Cientista de dados: o profissional mais cobiçado


do século 21, da Harvard Business Review Brasil:

A firma de capital de risco Greylock Partners, que investe na fase embrionária de


projetos e já bancou nomes como Facebook, LinkedIn, Palo Alto Networks e
Workday, está tão preocupada com essa escassez que montou uma equipe
especial de recrutamento só para suprir empresas em sua carteira com cientistas de
dados. “Quando [uma empresa] tem dados’, diz Dan Portillo, chefe da equipe, “é
indispensável ter gente para processar isso tudo e tirar insights dali”.

“A profissão da hora na próxima década será a de estatístico.” Essa frase é


atribuída a Hal Varian, economista-chefe do Google. “Todo mundo acha que estou
brincando, mas quem teria imaginado que a engenharia da computação teria sido a
profissão da hora na década de 1990? ”
Você pode ver que contextos distintos, dos dados do IBGE aos salários do cientista de
dados, tanto em seus significados, quanto em sua geografia são tratados pela
estatística. Muitos outros contextos além dos que você estudou nesta aula fazem uso
do método estatístico.

O cotidiano de cada pessoa é permeado por estatísticas que fornecem subsídios para
várias questões importantes na vida, como a relação de candidatos para uma vaga de
concurso, o histórico ou a média de temperatura de uma cidade para a qual se deseja
viajar, o número de vagas de emprego para alunos do curso que se pretende fazer, a
variação do valor de ações de empresa em que se deseja investir, a eficiência de um
medicamento que fará parte de um tratamento contra o câncer.
Enfim, muitas são as questões cujas repostas podem ser fundamentadas por
estatísticas, por isso é importante que todo profissional adquira competência em
elaboração e análises de dados baseadas em estatísticas.
Tema 2

Elaboração e análise de gráficos e tabelas


Como representar uma situação por meio de tabelas e
gráficos?

Qualquer conjunto de dados, tais como o tempo de uma


ligação telefônica, a magnitude de terremotos, a
velocidade de processamento de uma determinada
máquina, a proporção de participação no mercado das
empresas de um setor, a suscetibilidade de empresas a
uma determinada mudança no mercado, a opinião dos
alunos quanto à qualidade da universidade na qual
estudam, dentre outros, possui informação sobre algum
grupo de indivíduos, que configura a variável de interesse.

Variáveis

Uma característica de interesse e que pode assumir diferentes valores de indivíduo


para indivíduo é denominada “variável”, pois, de outra forma, seria denominada
constante.

As variáveis são aquilo que queremos observar e podem ser classificadas em


“qualitativas” e “quantitativas”. Clique nas caixas de cada tipo de variável para
conhecer mais detalhes.
Saiba Mais

Quantitativas - Uma variável é quantitativa quando exprime contagens, ou


seja, quando os valores tomados são numéricos. Exemplo: idade, altura,
notas de avaliações, número de filhos etc.

Qualitativas- Uma variável é qualitativa quando exprime uma qualidade ou


atributo. Nesse caso, os valores tomados não são numéricos. Exemplo:
sexo, cor da pele, nacionalidade etc.

Discreta- Quando os valores podem ser ordenados de modo que entre


dois valores consecutivos não pode existir nenhum outro. Exemplo:
número de páginas desta unidade; número de eleitores dos municípios
brasileiros; quantidade de projetos sociais de empresas brasileiras.

Contínua- Quando os valores podem assumir qualquer valor num certo


intervalo. Exemplo: peso dos funcionários do setor de marketing de uma
empresa; energia liberada por terremotos no mundo; saldos bancários de
trabalhadores da construção civil.

Nominal- Quando não existe ordenação dentre as categorias. Exemplo:


tipos de empresas que adotam programas de qualidade; cidade de
nascimento de alunos de Engenharia da UVA; tipos de jogos de futebol
quanto à dificuldade.

Ordinal- Quando existe uma ordenação entre as categorias. Exemplo:


tamanho de empresas atuantes no setor primário (pequena, média e
grande).empresa; energia liberada por terremotos no mundo; saldos
bancários de trabalhadores da construção civil.
Para reforçar o conteúdo apresentado, sugerimos leitura das páginas 13 e
14 do livro Estatística, de autoria do professor Walter Sande, disponível na
página inicial da disciplina no Ambiente Virtual de Aprendizagem

Dados brutos

Quando você coleta os dados para atender certo interesse de pesquisa, essas
observações são chamadas de dados brutos. Assim, dados brutos são os dados na
forma em que foram coletados, sem nenhum tratamento. De forma geral, os dados
brutos apresentam pouca ou nenhuma informação, sendo necessário organizá-los
para extrair informações deles de maneira melhor.

Para avaliar a implantação de uma nova filial, uma empresa carioca quer
conhecer o PIB per capta de 20 municípios fluminenses de interesse, e para
isso coletou estes dados da página do Cidades, mantida pelo IBGE. Os
dados obtidos sobre o ano de 2014 foram:

Tabela 1 – Dados brutos do PIB per capita de 2014, dos 20 municípios


fluminenses de interesse, ano de 2014.

Campos Duque
dos de Cabo São Nova Rio das Volta
Goytacazes Caxias Niterói Macaé Frio Gonçalo Iguaçu Ostras Petrópolis Redonda

120.694 32.645 49.494 91.676 84.447 15.016 18.783 112.658 38.139 40.174

Angra
São João dos São João Belford Barra Teresópol
Maricá da Barra Reis Itaguaí Resende do Meriti Roxo Mansa Itaboraí is

68.149 258.723 43.887 67.964 62.390 15.728 13.005 30.055 22.227 28.387
Fonte: IBGE

Da maneira como esses dados de PIB per capita estão colocados, em sua
forma bruta, sem qualquer tratamento, eles auxiliam pouco os gestores da
empresa na tomada de decisão. Para que sejam úteis, será necessário
organizá-los, por exemplo, em ordem crescente de valores de PIB, ou agrupá-
los por região geográfica, talvez calcular o PIB mensal. Ou seja, será
necessário tratar esses dados brutos de forma que sua organização gere
informação relevante e que ajudem a empresa a decidir em qual município
implantará sua filial.

Como é possível organizar os dados de uma forma mais eficiente, de modo


que apresentem uma quantidade maior de informações?

Vamos ver como fazer isso.


Tabelas

Elementos da Tabela
A disposição de uma tabela pode ser generalizada como mostra a Figura 01, a seguir.

Figura 1-Representação tabular de dados

Veja aqui como apresentar tabelas e figuras conforme as regras da


Associação Brasileira de Normas Técnicas – ABNT.

Tabela de distribuição de frequências

Se organizarmos os dados brutos em ordem crescente, teremos um rol, porém muitas


vezes essa organização não é suficiente, pois existem dados repetidos, e a
quantidade de vezes que cada dado aparece é importante. Uma forma de organizar
um conjunto de dados, sem repetir valores iguais, é por meio de uma tabela na qual
são apresentadas as frequências de cada uma das categorias.

Veja que a disposição tabular dos dados agrupados em classes, juntamente com as
frequências correspondentes, se denomina “distribuição de frequências”.

Você pode contar a frequência de cada dado ou definir certos intervalos de dados,
chamados de classes, dos quais se deseja observar a frequência. Para identificar uma
classe, deve-se conhecer os valores dos limites inferior e superior da classe, que
delimitam o intervalo de classe, pois podem ser incluídos ou excluídos da classe.

Quando preciso de tabelas de distribuição de frequências?

Estudo de caso

Considere a Indústria DeBoa, fabricante de móveis para varandas e cadeiras


dobráveis que pretende instalar uma unidade na Região do Lagos do estado do Rio de
Janeiro, ou na Região Serrana do mesmo estado. É do interesse dessa indústria
verificar as condições de bem-estar das populações, pois seus produtos são
associados a momentos de lazer, e não a necessidades básicas.

O gestor da empresa, Carlos Deboa, é engenheiro de produção, entende de todo o


processo de fabricação, mas precisa de dados atuais a respeito das regiões onde
pretende implantar a nova fábrica, para que possa avaliar a possível demanda por
seus produtos. Um tipo de dado importante para essa avaliação é a renda da
população. Para obtê-lo, Carlos buscou dados coletados pela Federação das
Indústrias do Rio de Janeiro – FIRJAN, na construção de seu Índice Firjan de
Desenvolvimento Municipal – IFDM.

Vamos praticar? Percorra o mesmo caminho de pesquisa de Carlos, acessando a


tabela de consulta dinâmica por Estado, na página da Firjan – IFDM e construa suas
próprias tabelas, seguindo as orientações apresentadas a seguir.

Alguns aspectos a considerar no processo de organização dos dados:

• Municípios da Região dos Lagos: Araruama, Arraial do Cabo, Búzios, Cabo


Frio, Iguaba Grande, São Pedro da Aldeia, Saquarema.
• Municípios da Região Serrana: Guapimirim, Itaipava, Magé, Petrópolis,
Teresópolis, São José do Vale do Rio Preto.
• Adotar os seguintes critérios para a classificação dos IFDM:
IFDM menor que 0,4 ► baixo estágio de desenvolvimento;
IFDM igual a 0,4 e menor que 0,6 ► regular estágio de desenvolvimento;
IFDM igual a 0,6 menor que 0,8 ► moderado estágio de desenvolvimento;
IFDM igual ou maior que 0,8 ► alto estágio de desenvolvimento.
• É necessário escolher a região que possua a maior quantidade de municípios
com IFDM – no indicador emprego e renda – de moderado a alto para
continuar a análise de viabilidade de implantação da nova fábrica.
Estratégias para a organização das tabelas com os dados:

1. Coletar os IFDM por município, tanto o IFDM geral como o do quesito emprego
e renda (tabela de dados brutos).
2. Organizar uma tabela de distribuição por classes de desenvolvimento, por
região, observando os limites inferiores e superiores de cada classe.
Quando terminar, verifique em “Conferir” e compare as suas tabelas com os resultados
da pesquisa.
Conferir

1.
Região Município IFDM Emprego & Renda

Petrópolis 0,7904 0,7303

Teresópolis 0,7876 0,7333

Magé 0,6943 0,6097

Guapimirim 0,6895 0,5416

Serrana São José do Vale do Rio Preto 0,6889 0,5533

Armação dos Búzios 0,7855 0,7265

Cabo Frio 0,7806 0,7856

Saquarema 0,7405 0,7763

Iguaba Grande 0,7225 0,4901

Araruama 0,6972 0,6271

São Pedro da Aldeia 0,6943 0,5607

dos Lagos Arraial do Cabo 0,6620 0,4495

2.
Nível de desenvolvimento (IFDM – emprego & renda)

Baixo Regular Moderado Alto


Região 0,0 | --0,4 0,4 | --0,6 0,6 | --0,8 0,8 | --1,0

dos Lagos 0 3 4 0

Serrana 0 2 3 0

Com base na tabela de distribuição de frequências, Carlos deve continuar avaliando a


viabilidade de implantação da nova fábrica na Região do Lagos, já que atende melhor
a seu primeiro critério, que analisa o indicador de emprego e renda do IFDM.

Como decidir o número de classes e o tamanho de cada classe para elaborar


uma tabela de distribuição de frequências?

Não há resposta certa ou errada nessa questão, porém algumas orientações otimizam
o processo de construção da tabela de distribuição de frequências e sua
apresentação, como:

• Utilizar de 5 a 20 classes, dependendo do volume de dados a ser organizado.


• Manter a mesma largura em cada uma das classes (mesma amplitude de
classe).
• Usar como limite inferior da primeira classe o menor valor da amostra (porém
algumas vezes pode ser conveniente utilizar um valor um pouco menor que
esse limite).
Podem ser utilizados alguns critérios matemáticos, ou seja, fórmulas, para determinar
o número de classes (k) e a amplitude de classe.

Saiba Mais

Amplitude da amostra (ou amostral) é igual à diferença entre o dado de


maior valor e o de menor valor da amostra.

Amplitude de classe (ou largura da classe) é igual à diferença entre o


limite superior e o limite inferior da classe.

Tipos de frequências

Algumas vezes pretendemos comparar conjuntos de dados, e, nesse caso, a


frequência em termos percentuais é fundamental, porque permite a comparação entre
amostras com diferentes números de elementos.

Frequência Absoluta Frequência Relativa

É calculada dividindo-se a
frequência absoluta de cada
classe da variável pelo número
Gerada na contagem dos dados, é
total de observações (número de
a quantidade de vezes que um
elementos da amostra ou da
elemento da amostra aparece (sua
população), e, multiplicando-se
frequência – absoluta).
esse resultado por 100, obtém-se
a frequência relativa em termos
percentuais.

Explorar o conceito de frequência relativa

De acordo com a pesquisa realizada pelo DataFolha com ingressantes na USP,


UNICAMP e UNESP, em 2017, sob o título “Maioria em SP é contra mensalidade em
universidades públicas”.

Agora considere que o Datafolha tenha entrevistado 2006 pessoas (amostra), em


2016, cujo objeto de pesquisa era Avaliação das Universidades estaduais e a
possibilidade de cobrança de mensalidade. Várias informações foram levantadas
nesta pesquisa, como sexo, idade, escolaridade, religião, renda familiar mensal, entre
outros.

Para a elaboração da tabela de distribuição de frequências poderia ser apresentada da


seguinte forma:

Faixa Etária Frequência absoluta Frequência relativa Frequência relativa (%)

16 a 24 anos 361 0,18 18

25 a 34 anos 401 0,20 20

35 a 44 anos 381 0,19 19

45 a 59 anos 502 0,25 25

60 anos ou mais 362 0,18 18


Fonte: DataFolha

A pesquisa ainda aponta que a imagem geral das


Universidades é positiva, sendo que 69% dos
entrevistados avaliaram as universidades
estaduais como ótimas ou boas, 20% como
regulares e 6% como ruins ou péssimas; e uma
parcela de 5% não opinou. Além disso,
respondendo ao objetivo da pesquisa “sobre a gratuidade das universidades
estaduais”, 57% declararam que elas deveriam se manter gratuitas e 43%, que elas
deveriam cobrar mensalidade de quem pode pagar).

Se considerarmos a classificação proposta pelo IBGE, as classes sociais estão


distribuídas pelo critério exclusivo de renda mensal, conforme tabela abaixo:

CLASSE FAIXA SALARIAL (em salários FAIXA SALARIAL (em reais -


SOCIAL mínimos) 2016)

A >20 >17.600,01

B 10 --| 20 8.800,01 --| 17.600,00

C 4 --| 10 3.720,01 --| 8.800,00

D 2 --| 4 1.760,01 --| 3.720,00

E 0 --| 2 0,00 --| 1.760,00

Gráficos

As tabelas são quadros que resumem um conjunto de observações, enquanto os


gráficos são formas de apresentação visual dos dados, que implicam interpretação
mais rápida do fenômeno estudado.
A escolha do tipo de gráfico mais adequado para representar um conjunto de dados
deve ser realizada a partir das respostas a questões como:

• Gráfico realmente é a melhor opção?


• Que tipo de gráfico deve ser usado?
• Como o gráfico deve ser apresentado?
Ao responder essas questões para o seu problema real, você estará mais próximo de
uma escolha correta que trará resultados mais eficazes na transmissão da informação
para o público que deseja atingir.

Veja a tabela Tipos de Gráfico e sua Adequação, que vai ajudá-lo na escolha do
melhor tipo de gráfico para cada tipo de situação.
Tema 3
Medidas de posição e dispersão

Quais são as medidas mais adequadas para atender ao


objetivo da análise, média ou mediana? Desvio-padrão
ou coeficiente de variação?

As medidas de síntese, também chamadas de medidas descritivas, são utilizadas para


resumir os dados de uma variável quantitativa, representando o conjunto por meio de
valores numéricos. Como já vimos, essas medidas são de dois tipos: posição (média,
moda e mediana) e dispersão (amplitude, variância, desvio-padrão, coeficiente de
variação).

Se as medidas forem calculadas a partir de “dados populacionais”, são denominadas


“parâmetros”, e se forem calculadas a partir de “dados amostrais”, são denominadas
“estimadores” ou “estatísticas”.

A figura abaixo resume a classificação e o significados das medidas de síntese.


Medidas de posição (tendência central)

As medidas de posição o ajudarão no resumo e na caracterização de um conjunto de


dados. Para tanto, você precisa escolher as medidas adequadas de acordo com o
objetivo da sua análise. Por outro lado, se você já receber um conjunto de dados
sintetizado, por meio de medidas de posição, precisa saber como interpretá-las
corretamente.

Veja a tabela com o resumo das medidas de dispersão. Na tabela, leia com bastante
atenção a última coluna, pois ela aponta algumas propriedades importantes de cada
medida, tanto para sua interpretação, quanto para a escolha da medida mais
adequada, se você for o responsável pela elaboração das estatísticas.

Na maioria das vezes, uma medida como a média, por exemplo, não é suficiente para
que se tenha clareza sobre o comportamento dos dados de uma amostra, sendo ela
uma medida somente de tendência central. Nessas situações, surge a necessidade de
conhecer medidas que indiquem o quanto os elementos do conjunto se dispersam da
média, que é o valor característico da amostra. As medidas que cumprem esse papel
são as medidas de dispersão.

Para explorar alguns pequenos cálculos de medidas de posição, assista ao


vídeo Estatística: medidas de tendência central, prestando bastante atenção
aos argumentos do professor acerca da medida que melhor representa o
conjunto de dados – procure sempre fazer esse tipo de avaliação.

Medidas de dispersão

Para resumir um conjunto de dados, é bastante adequado que se conheça uma


medida de tendência central (média, moda ou mediana) e uma medida de dispersão
(variância ou desvio-padrão). Você poderá observar que a média será quase sempre
necessária, mesmo que não seja a melhor medida para caracterizar a tendência
central dos dados, e que o desvio-padrão é a medida mais utilizada para medir a
dispersão dos dados em torno da média.

Em anexo, apresentamos a tabela-resumo com algumas características das medidas


de dispersão.

1. Para explorar alguns cálculos de medidas de dispersão, assista ao


vídeo Amplitude, variância e desvio-padrão como medidas de
dispersão. Observe as falas do professor quanto à comparação dos
dois conjuntos de dados.
2. Para entender a diferença do cálculo da variância populacional e
da variância amostral (em que a divisão é por n-1), assista aos
vídeos a seguir (procure assistir em ordem):
1. Variância Populacional
2. Variância amostral
3. Revisão e justificativa intuitiva para a divisão por n – 1
Algumas considerações importantes sobre DP e CV

A partir do desvio-padrão (DP) e do coeficiente de variação (CV), é possível avaliar a


homogeneidade do conjunto de dados e, consequentemente, se a média é uma
medida representativa desse conjunto. Quanto maior forem os valores de desvio-
padrão e coeficiente de variação, menos representativa será a média. Se o coeficiente
de variação for superior a 50%, há alta dispersão, o que aponta heterogeneidade dos
dados. Por outro lado, quanto mais próximo de zero, mais homogêneo é o conjunto de
dados e mais representativa será sua média.

Para comparar a variabilidade entre grupos por meio do desvio-padrão ou da


variância, os conjuntos de dados têm que possuir o mesmo número de observações, a
mesma unidade de medida e a mesma média.

O coeficiente de variação, por ser uma medida dada em termos percentuais, é


bastante adequado para comparar conjuntos com volume de dados ou unidades de
medidas distintas.

Uma desvantagem do coeficiente de variação é que ele deixa de ser útil quando a
média se aproxima de zero, porque uma divisão por quase zero pode inflacionar o CV.

Quando se verifica que a média não é uma boa medida para representar o conjunto de
dados, opta-se pela mediana ou moda, não existindo uma regra para realizar essa
escolha. O pesquisador, que entende o contexto de seus dados é quem define a
melhor medida a ser considerada, tanto de posição, quanto de dispersão.

Exemplo orientado – O caso da ECOPNEUS

A Indústria Ecopneus pretende investir no aumento


de produção de uma de suas linhas de pneus. A
Linha Free é destinada a automóveis de passeio, e a
Linha Strong, para veículos comerciais leves. A
Ecopneus atua em todo o Brasil, distribuindo cada
uma de suas linhas de produtos para todos os
estados da Federação. Nesse sentido, precisa
avaliar informações sobre o mercado automotivo
brasileiro, dentre outras, para que possa tomar a
decisão de investir com mais segurança.

Ana é executiva na Ecopneus, e a ela foi atribuída a tarefa de gerar informações que
subsidiem a tomada de decisão da empresa, por meio de um relatório que deverá
apresentar.

Ana procurou por dados dos quais pudesse extrair informações. Ela encontrou, nos
indicadores econômicos consolidados do Banco Central do Brasil, os dados de que
precisava para construir um relatório que indicasse em qual linha de pneus a empresa
deveria investir. Isso equivale a identificar, inicialmente, qual dos tipos de veículos (de
passeio ou comerciais leves) têm tido maior volume de vendas no país e a
regularidade dessa venda, já que a empresa não suportaria impactos sazonais
negativos.

A direção da empresa é composta por pessoas com pouca ou nenhuma formação


estatística, por esse motivo, a apresentação do relatório deve ser simples, mas
consistente.

Elabore um relatório que contenha informações importantes para a tomada de decisão


da Ecopneus. Para isso:

1. Defina a pergunta a ser respondida e os dados necessários para respondê-la.


2. Procure por dados referentes às vendas de veículos pelas concessionárias no
Brasil em fontes confiáveis (sugestão: site do Banco Central do Brasil).
Conforme sugestão na questão, foi realizada a busca por dados referentes às
vendas de veículos de passeio e comerciais leves no site do Banco Central do
Brasil. Fonte de dados escolhida - Indicadores econômicos consolidados do
Banco Central, I.31. (Indicadores econômicos consolidados)
3. Organize os dados relevantes referentes às vendas de veículos de passeio e
veículos comerciais leves que encontrou a fim de otimizar a análise necessária
para responder à questão inicial.
4. Escolha formas gráficas adequadas para essa apresentação e crie os gráficos
correspondentes, tomando por base os dados levantados.
5. Resuma os dados em forma de medidas, focando os seus significados
aplicados ao contexto da Ecopneus.
6. Ao final, escreva um texto que aponte para a solução, mas não determine a
escolha da linha de pneus, pois provavelmente seriam necessárias outras
análises, para além da estatística, nesse processo decisório.
Onde estão os dados? Busque-os! Esse estudo está muito mais próximo do que você
enfrentará no mercado de trabalho do que a resolução de uma lista de exercícios –
que obviamente não faz parte do mercado profissional.

Após responder o que é solicitado nas questões acima, clique aqui e confira suas
respostas.
Encerramento

Para que serve a estatística no Brasil e no mundo?


A estatística descreve e infere sobre contextos diversos, como nas pesquisas do IBGE
referentes a trabalho, emprego, economia, população e outros dados, assim como é
capaz de apresentar informações e fazer previsões sobre clima, tecnologia, indústria,
medicamentos, saúde, demografia e muitas outras áreas pelo mundo todo, sendo
utilizada como método científico por instituições como ONU, NASA, governos dos
países e até mesmo no treinamento de atletas de alta performance.

Como representar uma situação por meio de tabelas e


gráficos?
A primeira questão é entender o contexto do qual os dados foram coletados e os
objetivos que se tem ao apresentá-los, e, a partir dessa análise, escolher o tipo de
tabela e/ou gráfico mais adequado para representá-los de forma que as informações
possam ser claramente interpretadas pelo público para o qual se destinam.

Quais são as medidas mais adequadas para atender ao


objetivo da análise, média ou mediana? Desvio-padrão
ou coeficiente de variação?
É fundamental identificar o objetivo da análise para que se possa escolher entre média
ou mediana, por exemplo, para representar o conjunto de dados de forma mais
eficiente, respondendo claramente ao objetivo inicial. Não raro, a média é interpretada
de forma equivocada, como o valor mais comum em um conjunto de dados, sendo que
esse é o conceito de moda. A representatividade da média pode ser observada por
meio das medidas de dispersão, e o desvio-padrão, por apresentar a mesma unidade
de medida da variável observada, costuma ser o mais utilizado e de fácil
entendimento, assim como o coeficiente de variação. Se a média for uma boa
representante do conjunto de dados, média e desvio-padrão são medidas eficazes
para resumir o comportamento dos dados observados.

Resumo da Unidade

Nesta unidade, você estudou algumas aplicações reais da Estatística em contextos


distintos espalhados pelo mundo, especialmente em nosso país.

A relevância das estatísticas descritivas tanto em situações cotidianas quanto


profissionais fica evidenciada pela necessidade que temos de considerá-las para
tomada de decisão em várias esferas da vida. Afinal quem marca uma festa ao ar
livre sem verificar as “previsões” da meteorologia, ou pelo menos as precipitações
dos últimos dias, ou seja, as estatísticas meteorológicas?

É importante salientar que a Estatística serve aos objetivos do pesquisador, é ele


quem define os objetivos da pesquisa, as perguntas que pretende responder, quais
dados são necessários, como os organizará, analisará e apresentará, escolhendo
os gráficos, tabelas, medidas e aplicativos mais adequados.

O uso de planilhas eletrônicas ou pacotes estatísticos é essencial para o trabalho


atual, o qual requer rapidez no tratamento de grandes volumes de dados. Por outro
lado, a habilidade humana de realizar análises tem sido cada vez mais valorizada,
num mercado permeado pela ciência de dados e sempre ávido por extrair
informação e gerar conhecimento.

Se você não for o realizador do estudo estatístico, ainda assim precisará entender
as informações contidas em gráficos, tabelas e medidas que representam o
contexto observado, e essa competência é fundamental para todo profissional da
atualidade.

Para aprofundar e aprimorar os seus conhecimentos sobre os assuntos


abordados nessa unidade, não deixe de consultar as referências
bibliográficas básicas e complementares disponíveis no plano de ensino
publicado na página inicial da disciplina.

Você também pode gostar