Você está na página 1de 30

Estatística

01 – Introdução à estatística
Uma visão geral da estatística
• Quase todos os dias você está exposto à estatística.
Por exemplo, considere as seguintes afirmações:
• “[Mulheres] que fumaram de um a 14 cigarros por
dia tinham, aproximadamente, o dobro de risco de
morte cardíaca repentina do que as não fumantes.”
(Fonte: American Heart Association.)
• “O desperdício de alimentos [nos Estados Unidos],
em relação ao suprimento disponível, tem
aumentado progressivamente de aproximadamente
30% em 1974 para quase 40% em anos recentes.”
(Fonte: National
• Institute of Diabetes and Digestive and Kidney
Diseases.)
• “O percentual de estudantes de Detroit que
alcançaram nível igual ou acima de proficiência
[em leitura] foi de 7% [em um ano recente].”
(Fonte: U.S. Department of Education.)
Uma visão geral da estatística
• As informações são baseadas em uma coleta de dados.
• Definição:
• Dados consistem em informações provenientes de observações, contagens, medições ou respostas.

• O uso de dados estatísticos remonta aos censos realizados na antiga Babilônia, Egito e, mais tarde, no Império
Romano, quando os dados coletados eram sobre assuntos relacionados ao Estado, tais como nascimentos e
óbitos.
• Na verdade, a palavra estatística é derivada da palavra latina status, que significa “estado”. A prática moderna
da estatística envolve mais que contar nascimentos e óbitos, conforme se vê na próxima definição.
• Definição:
• Estatística é a ciência que trata da coleta, organização, análise e interpretação dos dados para a tomada de
decisões.
Conjuntos de dados

• Há dois tipos de conjuntos de dados usados em estatística. Esses conjuntos são chamados de população e
amostra.
• Definição:
• Uma população é a coleção de todos os resultados, respostas, medições ou contagens que são de interesse.
• Uma amostra é um subconjunto ou parte de uma população.

• Uma amostra deve ser representativa de uma população de modo que seus dados possam ser usados para tirar
conclusões sobre aquela população.
• Os dados amostrais devem ser coletados usando-se um método apropriado, tal como a amostragem aleatória.
Conjuntos de dados
• Exemplo:
• Em uma pesquisa recente, foi perguntado a 614 proprietários de pequenas empresas nos Estados Unidos se
eles achavam que a presença de sua empresa no Facebook tinha valor. Duzentos e cinquenta e oito dos 614
responderam que sim. Identifique a população e a amostra. Descreva o conjunto de dados da amostra.
(Adaptado de: Manta.)
• Solução:
• A população consiste nas respostas de todos os proprietários de pequenas empresas dos Estados Unidos, e a
amostra consiste nas respostas dos 614 pequenos empresários pesquisados. Note na Figura que a amostra é
um subconjunto das respostas de todos os pequenos empresários dos Estados Unidos. O conjunto de dados da
amostra consiste em 258 proprietários que responderam sim e 356 que responderam não.
Conjuntos de dados
• Dois termos importantes usados neste livro são parâmetro e estatística.

• Definição:
• Um parâmetro é a descrição numérica de uma característica populacional.
• Uma estatística é a descrição numérica de uma característica amostral.

• É importante notar que uma estatística amostral pode diferir de uma amostra para outra, enquanto um
parâmetro populacional é constante para uma população.
Conjuntos de dados
• Exemplo:
• Determine se o valor numérico descreve um parâmetro populacional ou uma estatística amostral. Explique seu
raciocínio.
• 1. Uma pesquisa recente com aproximadamente 400.000 empregadores reportou que o salário médio inicial para um
especialista em marketing é de US$ 53.400 por ano. (Fonte: National Association of Colleges and Employers.)
• 2. A nota média de matemática obtida no vestibular pelos calouros de uma universidade é 514.
• 3. Em uma checagem aleatória de 400 lojas varejistas, o FDA (Food and Drug Administration) descobriu que 34%
das lojas não estavam estocando peixes na temperatura apropriada.

• Solução:
• 1. Em razão de a média de US$ 53.400 por ano ser baseada em um subconjunto da população, ela é uma estatística
amostral.
• 2. Em razão de a nota média de matemática de 514 ser baseada em todos os calouros, ela é um parâmetro
populacional.
• 3. Em razão de o percentual (34%) ser baseado em um subconjunto da população, ele é uma estatística amostral.
Ramos da estatística
• O estudo de estatística tem dois ramos principais: estatística descritiva e estatística inferencial.

• Definição:
• Estatística descritiva é o ramo da estatística que envolve a organização, o resumo e a representação dos
dados.
• Estatística inferencial é o ramo da estatística que envolve o uso de uma amostra para chegar a conclusões
sobre uma população. Uma ferramenta básica no estudo da estatística inferencial é a probabilidade.
Ramos da estatística
• Determine qual parte do estudo representa o ramo descritivo da estatística. Que conclusões podem ser
tomadas do estudo usando estatística inferencial?
• 1. Uma grande amostra de homens com 48 anos de idade foi estudada durante 18 anos. Observa-se na Figura
que, para os solteiros, aproximadamente 70% estavam vivos aos 65 anos, e para os casados, 90%. (Fonte: The
Journal of Family Issues.)

• 2. Em uma amostra de analistas de Wall Street, a percentagem dos que previram incorretamente os lucros de
empresas de alta tecnologia em um ano recente foi de 44%. (Fonte: Bloomberg News.)
Ramos da estatística

• Solução:
• 1. A estatística descritiva envolve afirmações tais como “Para os solteiros da grande amostra de homens,
aproximadamente 70% estavam vivos aos 65 anos” e “Para os casados, 90% ainda estavam vivos aos 65
anos”. A Figura também representa o ramo descritivo da estatística. Uma inferência possível tirada do estudo
é que estar casado está associado a uma vida mais longa para os homens.

• 2. A parte do estudo que representa o ramo descritivo da estatística envolve a afirmação “A percentagem [da
amostra de analistas de Wall Street] que previram incorretamente os lucros de empresas de alta tecnologia em
um ano recente foi de 44%”. Uma inferência possível com base no estudo é que o mercado de ações é difícil
de ser previsto, até mesmo para os profissionais.
Tipos de dados
• Os conjuntos de dados consistem em dois tipos: qualitativo e quantitativo.

• Definição:
• Dados qualitativos consistem em atributos, rótulos ou entradas não numéricas.
• Dados quantitativos consistem em medidas numéricas ou contagens.
Tipos de dados
• Exemplo:
• Os preços de venda sugeridos para diversos veículos Honda são
apresentados na Tabela. Quais dados são qualitativos e quais são
quantitativos? Explique seu raciocínio. (Fonte: American Honda
Motor Company, Inc.).
• Solução:
• A informação mostrada na Tabela pode ser separada em dois
conjuntos de dados. Um conjunto contém os nomes dos modelos
dos veículos e o outro os preços de venda sugeridos.
• Os nomes são entradas não numéricas, portanto são dados
qualitativos. Os preços de venda são entradas de medidas
numéricas, portanto são dados quantitativos.
Níveis de mensuração
• O nível de mensuração determina quais operações estatísticas são apropriadas. Os quatro níveis de medida,
em ordem do mais baixo para o mais alto, são: nominal, ordinal, intervalar e de razão.

• Definição:
• Dados no nível nominal de mensuração são apenas qualitativos. Dados nesse nível são categorizados
usando-se nomes, rótulos ou qualidades. Não é possível realizar cálculos matemáticos nesse nível.
• Dados no nível ordinal de mensuração são qualitativos ou quantitativos. Dados nesse nível podem ser
postos em ordem ou classificados, mas as diferenças entre as entradas de dados não têm sentido
matemático.
Níveis de mensuração
• Exemplo:
• Nas tabelas temos dois conjuntos de dados. Que conjunto de dados consiste em dados no nível nominal? Que
conjunto de dados consiste em dados no nível ordinal? Explique seu raciocínio. (Fonte: The Numbers.)

• O primeiro conjunto de dados lista a posição de cinco filmes. Os dados consistem nas posições 1, 2, 3, 4 e 5.
Em razão de as posições poderem ser listadas em ordem, esses dados estão no nível ordinal. Note que a
diferença entre a posição de 1 a 5 não tem significado matemático.
• O segundo grupo consiste nos nomes dos gêneros de filmes. Não se pode realizar cálculo matemático com os
nomes nem ordená-los. Logo, esses dados estão no nível nominal
Níveis de mensuração
• Os dois níveis mais altos de mensuração consistem somente em dados quantitativos.

• Definição:
• Dados no nível de mensuração intervalar podem ser ordenados e é possível calcular diferenças que tenham
sentido matemático entre as entradas de dados. No nível intervalar, um registro zero simplesmente
representa uma posição em uma escala; a entrada não é um zero natural.
• Dados no nível de mensuração de razão são similares aos dados no nível intervalar, com a propriedade
adicional de que, nesse nível, um registro zero é um zero natural. Uma razão de dois valores pode ser
formada de modo que um dado possa ser expresso significativamente como um múltiplo de outro.

• Um zero natural é um zero que significa “nenhum”. Por exemplo, a quantia de dinheiro que você tem em uma
conta de poupança pode ser de zero real.
Níveis de mensuração
• Dois conjuntos de dados são apresentados nas tabelas. Qual conjunto consiste em dados no nível intervalar?
Qual conjunto consiste em dados no nível de razão? Explique seu raciocínio. (Fonte: Major League
Baseball.)
Níveis de mensuração
• Solução
• Ambos os conjuntos contêm dados quantitativos.
• Considere as datas das vitórias dos Yankees na Série Mundial. Faz sentido encontrar diferenças entre datas
específicas. Por exemplo, o tempo entre a primeira e a última vitória dos Yankees é 2009 – 1923 = 86 anos.
• Mas não faz sentido dizer que um ano é múltiplo do outro. Então, esses dados estão no nível intervalar.
• Contudo, usando o total de home runs, podemos encontrar diferenças e escrever razões.
• Com base nos dados, podemos ver que o Baltimore atingiu 39 home runs a mais do que o Tampa Bay, e que o
New York Yankees atingiu cerca de 1,5 vez a quantidade registrada pelo Detroit.
• Então, esses dados estão no nível de razão.
Planejamento de um estudo estatístico

• Passos para a elaboração de um estudo estatístico:


• 1. Identifique a(s) variável(is) de interesse (o foco) e a população do estudo.
• 2. Desenvolva um plano detalhado para a coleta de dados. Se usar uma amostra, certifique-se de que a
amostra é representativa da população.
• 3. Colete os dados.
• 4. Descreva os dados usando técnicas de estatística descritiva.
• 5. Interprete os dados e tome as decisões sobre a população usando estatística inferencial.
• 6. Identifique quaisquer erros possíveis.
Planejamento de um estudo estatístico
• Um estudo estatístico pode, geralmente, ser categorizado como um estudo observacional ou experimental.
• Em um estudo observacional, um pesquisador observa e mede as características de interesse de parte de uma
população, mas não muda as condições existentes. Por exemplo, foi realizado um estudo observacional no
qual os pesquisadores observaram e registraram o comportamento oral de crianças acima de 3 anos de idade
com objetos não alimentícios. (Fonte: Pediatrics Magazine.)
• Ao realizar um experimento, um tratamento é aplicado em uma parte da população, chamada de grupo de
tratamento, e as respostas são observadas. Outra parte da população pode ser usada como um grupo
controle, no qual nenhum tratamento é aplicado.
• Em muitos casos, os indivíduos no grupo controle recebem um placebo, que é um tratamento falso,
inofensivo, feito para parecer o tratamento real. As respostas do grupo de tratamento e do grupo controle
podem ser comparadas e estudadas. Por exemplo, foi realizado um experimento no qual diabéticos tomaram
extrato de canela diariamente enquanto o grupo controle não tomou nada. Depois de 40 dias, os diabéticos que
tomaram o extrato de canela reduziram seu risco de problemas cardíacos, enquanto o grupo controle não
sofreu mudanças. (Fonte: Diabetes Care.)
Planejamento experimental
• Para produzir resultados significativos e não tendenciosos, os experimentos devem ser cuidadosamente
planejados e executados.
• Três elementos-chave de um experimento bem planejado são controle, aleatorização e replicação.
• Em razão de os resultados poderem ser arruinados por uma variedade de fatores, a capacidade de controlá-los
é importante. Um desses fatores é uma variável de confusão.

• Definição:
• Uma variável de confusão ocorre quando um pesquisador não pode distinguir um ou mais fatores que
causaram os efeitos provocados sobre a variável em estudo, gerando confusão.
Planejamento experimental
• Outro fator que pode afetar os resultados experimentais é o efeito placebo.
• O efeito placebo ocorre quando um indivíduo reage favoravelmente a um tratamento quando, na verdade,
ele(a) recebeu um placebo. Para ajudar a controlar ou minimizar o efeito placebo, uma técnica chamada
cegamento pode ser usada.

• Definição:
• O experimento cego (ou cegamento) é uma técnica na qual o indivíduo não sabe se está recebendo um
tratamento ou um placebo.
• Em um experimento duplo-cego, nem o pesquisador nem os indivíduos sabem quem está recebendo um
tratamento ou um placebo. O pesquisador é informado depois que todos os dados forem coletados. Esse
tipo de planejamento experimental é preferido pelos pesquisadores.
Planejamento experimental
• Outro elemento de um experimento bem planejado é a aleatorização.

• Definição:
• Aleatorização é o processo de se designar indivíduos aleatoriamente para
diferentes grupos de tratamento.

• Em um planejamento completamente aleatorizado, os indivíduos são


designados para diferentes grupos de tratamento por meio de seleção
aleatória.
• Em alguns experimentos, pode ser necessário usar blocos, que são grupos de
indivíduos com características similares. Um planejamento experimental
comumente usado é o planejamento em blocos aleatorizados
Planejamento experimental
• Outro tipo de planejamento experimental é o planejamento de pares combinados (matching), no qual os
indivíduos são colocados em pares de acordo com a similaridade.
• Um indivíduo em cada par é selecionado aleatoriamente para receber um tratamento enquanto o outro
indivíduo recebe um tratamento diferente.
• Por exemplo, dois indivíduos podem ser colocados em pares por causa da idade, de uma localização
geográfica ou de uma característica física em particular.
• O tamanho da amostra, que é o número de indivíduos em um estudo, é outra parte importante do
planejamento experimental.
• Para melhorar a validade dos resultados experimentais, a replicação é necessária.

• Definição:
• Replicação é a repetição de um experimento sob condições iguais ou semelhantes.
Técnicas de amostragem

• Um censo é uma contagem ou medição de toda a população. A realização de um censo fornece informações
completas, mas é frequentemente caro e difícil de realizar.
• Uma amostragem é uma contagem ou medição de parte de uma população e é mais comumente usada nos
estudos estatísticos.
• Para coletar dados não viesados, um pesquisador deve assegurar que a amostra é representativa da população.
• Técnicas de amostragem apropriadas devem ser utilizadas para garantir que as inferências sobre a população
sejam válidas.
• Mesmo com os melhores métodos de amostragem, um erro de amostragem pode acontecer. Um erro de
amostragem é a diferença entre os resultados da amostra e os da população.
Técnicas de amostragem

• Uma amostragem aleatória é aquela na qual todos os elementos de uma população têm chances iguais de
serem selecionados.
• Uma amostragem aleatória simples é aquela na qual cada amostra possível de mesmo tamanho tem a
mesma chance de ser selecionada.
• Quando você escolhe os elementos de uma amostra, você deve decidir se é aceitável ter o mesmo elemento da
população mais de uma vez.
• Se for aceitável, então o processo amostral é com reposição. Se não for aceitável, o processo é sem reposição.
Técnicas de amostragem
• Amostragem estratificada:
• Quando é importante que uma amostra tenha elementos de cada segmento da população, devemos usar uma
amostra estratificada.
• Dependendo do foco do estudo, elementos de uma população são divididos em dois ou mais subconjuntos,
chamados de estratos, que compartilham uma característica similar como idade, sexo, grupo étnico ou até
mesmo preferência política.
• Uma amostra é então selecionada aleatoriamente de cada um dos estratos.
• O uso de uma amostra estratificada assegura que cada segmento da população está representado
Técnicas de amostragem
• Amostragem por conglomerado:
• Quando a população recai em subgrupos que ocorrem naturalmente, cada um tendo características similares,
uma amostragem por conglomerado pode ser a mais apropriada.
• Para selecionar uma amostragem em tal procedimento, divida a população em grupos, chamados
conglomerados, e selecione todos os elementos em um ou mais (mas não em todos) conglomerados sorteados.
• Tipos de conglomerados poderiam ser seções diferentes do mesmo curso ou diferentes filiais de um banco.
Técnicas de amostragem
• Amostragem sistemática:
• Uma amostragem sistemática é aquela na qual é atribuído um número a cada elemento da população
ordenada.
• Essa ordenação é dividida segundo o número de elementos definidos para a amostra, gerando grupos.
• Um número é selecionado aleatoriamente no primeiro grupo, e, então, os demais elementos da amostra são
selecionados em intervalos regulares a partir do número inicial. (Isto é, cada 3º, 5º ou 100º membro é
selecionado.)

• Um tipo de amostragem que frequentemente leva a estudos tendenciosos (portanto, não é recomendada) é a
amostragem por conveniência. Uma amostra por conveniência consiste somente em membros da população
que são fáceis de contatar.
Técnicas de amostragem
• Exemplo:
• Você está realizando um estudo para determinar a opinião dos estudantes em sua escola sobre a pesquisa de células-
tronco. Identifique a técnica de amostragem que você usaria ao selecionar as amostras listadas.
• 1. Você divide a população de estudantes com relação às graduações e, aleatoriamente, seleciona e questiona alguns
estudantes em cada curso de graduação.
• 2. Você designa um número para cada estudante e gera números aleatórios. Então, você questiona cada estudante
cujo número é selecionado aleatoriamente.
• 3. Você seleciona estudantes que são da sua turma de biologia.
• Solução:
• 1. Como os estudantes são divididos em estratos (graduações) e uma amostra é selecionada de cada graduação, esta é
uma amostra estratificada.
• 2. Cada amostra de mesmo tamanho tem chances iguais de ser selecionada e cada estudante tem chances iguais de
ser selecionado, então esta é uma amostra aleatória simples.
• 3. Uma vez que a amostra é tomada de estudantes que estão prontamente disponíveis, esta é uma amostra por
conveniência. A amostra pode ser tendenciosa porque estudantes de biologia podem estar mais familiarizados com
pesquisa de células-tronco que os demais, e possuir opiniões mais firmes.

Você também pode gostar