Você está na página 1de 86

Modelos de Probabilidade e In-

ferência
Aula 01 - Motivação Inicial/Introdução/Apresentação

Prof. Hemílio Fernandes Campos Coêlho


hemilio.coelho@academico.ufpb.br
@hemiliofcc
www.de.ufpb.br
Sumário

Pergunta Motivacional

Recomendações

Passos importantes

Motivações

Dicas

Softwares que serão utilizados/recomendados

Sobre estatísticas no dia-a-dia


Pergunta motivacional

Fonte: Marvel/Disney Studios - Capitão América 2: O Soldado Invernal (2014)


Algumas recomendações sobre quem seguir

No Instagram:

1. @ppgmds.ufpb ⇒ Página do Programa de Pós-Graduação em Modelos de Decisão e


Saúde da UFPB

2. @estatisticaufpb ⇒ Página do Departamento de Estatística da UFPB

3. @estatistica_oficial ⇒ Diversos conteúdos didáticos e divertidos sobre Estatística

4. @aprenderestatisticafacil que também pode ser acessada neste link

5. @led.ufba =⇒ Página do Departamento de Estatística da UFBA


Dois passos importantes desta disciplina
Motivações
Motivações
Motivações
Motivações
Motivações
Dicas
Dicas
Dicas
Dicas
Dicas
Motivações
R / RStudio

▶ Linguagem de programação estatística e gráfica que vem se especializando na manipula-


ção, análise e visualização de dados, sendo atualmente considerada uma das melhores
ferramentas para essa finalidade.
▶ É um software de código aberto (opensource) e pode ser obtida gratuitamente através
do seguinte endereço eletrônico: https://www.r-project.org/.
▶ Para executar os comandos do R de forma integrada, recomenda-se instalar o software
chamado RStudio. O RStudio trata-se de uma IDE (ambiente de desenvolvimento in-
tegrado) de código aberto em R e permite uma melhor utilização dos recursos do R. O
software também está disponível gratuitamente. Para realizar o donwload, acesse o se-
guinte endereço eletrônico: https://posit.co/download/rstudio-desktop/.
JAMOVI

▶ O JAMOVI é um software simples baseado na linguagem computacional do R, com uma


interface gráfica, sendo útil para a exploração de dados e realizar análises descritivas e
análises inferenciais, apresentando uma oferta de métodos estatísticos bastante ampla.
▶ Ou seja, será um software bastante utilizado nas aulas para motivar o aprendizado a
partir das aplicações a serem desenvolvidas na disciplina.
▶ Para usuários do famoso software SPSS, se torna um software de fácil utilização, pois o
ambiente é similar ao do SPSS, e o melhor: O JAMOVI é gratuito, e permite ao usuário
citar suas licenças nas produções sem gerar conflitos de interesse relacionados ao uso
de softwares.
▶ Para realizar o donwload do JAMOVI (versão Desktop), acesse o seguinte endereço
eletrônico e baixe a versão com a indicação “Recommended For Most Users”: https:
//www.jamovi.org/
Estatísticas no dia-a-dia...

Em alguma universidade, em algum canto do mundo, neste exato momento, alguma pesquisa
divulgará estatísticas que irão surpreender você. Vejamos algumas:
▶ Relação candidato/vaga em um concurso público
▶ Esportes: % de posse de boa, nº de passes errados, nº de rebotes,
▶ nº de chutes a gol, nº de roubadas de bola,...
▶ Probabilidade de ganhar na loteria
▶ Número de óbitos em uma guerra
▶ Notícias sobre números relacionados a epidemias/doenças
▶ Índices: inflação, desenvolvimento humano, alfabetização, pobreza, etc.
▶ Satisfação de clientes com um produto ou serviço
▶ Índice de audiência de programas de TV
Algumas estatísticas curiosas que também surpreendem...

▶ Aproximadamente 15% do planeta terra está coberto por gelo;

▶ A maioria dos bebês nasce em agosto e setembro;

▶ 95% das criaturas na terra são menores que um ovo de galinha;

▶ 46% da violência na TV ocorre em desenhos animados;

▶ Apenas em torno de 5% das pessoas sonham “em cores”;

▶ 57% das mulheres preferem fazer compras do que fazer sexo;

▶ Em média, uma pessoa muda de residência 11 vezes ao londo da vida, e, em


média, a cada 6 anos.
Algumas estatísticas curiosas que também surpreendem...

▶ Aproximadamente 6% dos pedidos de casamento são feitos por telefone;

▶ Aproximadamente 50% das vezes em que você não encontra o controle remoto,
ele está entre as almofadas do sofá;

▶ O “usuário médio” do Facebook tem 130 amigos;

▶ O uso mais comum do Facebook é “perseguir o ex-namorado ou a ex-namorada”;

▶ Não usar sutiã faz bem para a saúde das mulheres;

▶ Casamentos felizes engordam;

▶ Ver filmes de terror emagrece;


Algumas estatísticas curiosas que também surpreendem...

▶ Uma pesquisa realizada pela universidade de Washington, cidade de Seatle, EUA,


afirma: Maridos que lavam a louça da casa fazem menos sexo. 7 mil pessoas dos
Estados Unidos e da Espanha participaram dessa pesquisa. Primeiramente, o
casal dividia as tarefas da casa, e depois contavam quantas vezes faziam sexo no
mês. Depois, o homem parava de ajudar em casa e aí o casal continuava a contar
o número de vezes em que faziam sexo no mês. A pesquisa conclui que quando
o marido “sumia da pia”, a atividade sexual do casal aumentava 60%;
Essa pesquisa é no mínimo, ainda mais curiosa. Exploremos um pouco melhor o
que afirmaram os responsáveis:
Algumas estatísticas curiosas que também surpreendem...
A pesquisa concluiu que ainda restam nas pessoas a chamada “Exibição de Gênero”:
Algumas estatísticas confrontam outras de uma forma ainda mais
surpreendente
Uma pesquisa feita na universidade de Umea, na Suécia, divulgada em outubro do ano
passado, diz o seguinte: homem que lava louça é mais feliz.
Conclusões das pesquisas se misturam...

Pensemos então nos dois resultados vistos anteriormente:


Conclusões das pesquisas se misturando...

Pensemos então nos dois resultados vistos anteriormente:


Conclusões das pesquisas se misturando...

Pensemos então nos dois resultados vistos anteriormente:


Outras pesquisas bem “gostosas”
Agência da ONU sugere dieta a base de insetos contra fome do mundo...

Fonte: http://glo.bo/12IYj9V
Outras pesquisas bem “gostosas”

Tomar cerveja todos os dias faz bem à saúde do coração.

Fonte: Instituto italiano Research Laboratories, da Fondazione di Ricerca e Cura Giovanni Paolo
II, Itália. Link: http://abr.ai/s3zyf0.
Outras pesquisas assustam...
Bebedores de cerveja tem maior risco de câncer

Pesquisadores da McGill, no Canadá, aplicaram um questionário com aproximadamente 3600


homens de 35 a 70 anos e descobriram que os que tinham o costume de beber têm maiores
chances de desenvolver câncer do esôfago, estômago, cólon, pulmão, pâncreas, fígado e prós-
tata. Entretanto, quando os pesquisadores observaram o tipo de álcool ingerido pelos homens,
perceberam que só a cerveja e bebidas destiladas elevavam os riscos de câncer. Na maior
parte, o risco aumentou de acordo com a regularidade com que os homens bebem.
Outras pesquisas alertam a atenção com a terceira idade...

Crianças preferem buscar na web a tirar dúvidas com avós.

Pesquisa realizada com 1,5 mil avós indica que mesmo para coisas práticas, como pregar um
botão, os netos recorrem à internet em vez de consultar seus parentes mais velhos.
Pesquisas para combater ameaças à saúde pública
Monitoramento do Covid-19

COVID VISUALIZER
Pesquisas para combater ameaças à saúde pública
Monitoramento do Covid-19

Observatório de Síndromes Respiratórias - Departamento de Estatística UFPB


O papel da Estatística
E em Saúde? É possível trabalhar com estatística? SIM!!!

Estudo de prevalência e fatores associados a problemas de voz na população de


adultos do município de João Pessoa
Dissertação de Mestrado do aluno Rafael Nóbrega Bandeira (Fonoaudiólogo e aluno
do Programa de Pós-Graduação em Modelos de Decisão e Saúde - Departamento
de Estatística - UFPB). Dentro os objetivos tem-se cálculo de tamanho de amostra,
análise de sintomas vocais, identificação de fatores que podem estar relacionados aos
problemas de voz dos entrevistados.
E em Saúde? É possível trabalhar com estatística? SIM!!!
http://dx.doi.org/10.1590/S1516-80342012000400005
E em Saúde? É possível trabalhar com estatística? SIM!!!
E em Saúde? É possível trabalhar com estatística? SIM!!!

http://dx.doi.org/10.1590/S1516-80342008000300012
E em Saúde? É possível trabalhar com estatística? SIM!!!
O papel da Estatística
Considerações Gerais

É possível distinguir duas concepções para a palavra ESTATÍSTICA:

▶ Coleção (ou conjunto) de dados numéricos (ou não), organizados de modo a fornecer
informações sobre uma atividade qualquer.
Exemplos:
1. Estatísticas Demográficas (nascimentos, falecimentos, matrimônios, divórcios, etc.);
2. Estatísticas Econômicas (emprego, produção, preços, vendas, atividades ligadas a
setores da economia no país ou no mundo, etc.).
continuação
O profissional de determinada área do conhecimento precisa ser preparado para tra-
balhar em vários setores da atividade acadêmica ou em vários setores do mercado
de trabalho. A preparação relacionada à análise de dados permite o uso de ideias e
métodos que permitem um melhor planejamento das ações profissionais.

De certa forma pode ser dito que os dados “falam por você”. Porém, para que os dados
“falem” de uma forma eficiente, são necessários alguns cuidados, que vão desde a
coleta até a análise mais apurada dos dados.
A Estatística atualmente

▶ A experiência com a Estatística é algo comum no cotidiano;


▶ Atualmente são vistas pesquisas em larga escala, novas descobertas que “devem
agradecimentos” à análise estatística;
▶ Segundo Calyampudi Radhakrishna (C.R.) Rao, um dos maiores estatísticos do
século XX, a estatística pode ser descrita pela equação:
Exemplos de aplicações gerais

▶ Qual o risco de uma pessoa que bebe desenvolver cirrose?


▶ Quais os fatores de risco para distúrbios na voz?
▶ Quais os fatores de risco para problemas cardiovasculares?
▶ Qual é a melhor forma de ensinar matemática para crianças?
▶ Qual é o melhor período de intervenção em uma máquina que fabrica lâmpadas, para
evitar a diminuição do tempo de vida útil de um produto?
▶ Fumar causa impotência sexual?
▶ Coca-Cola causa câncer?
▶ O que é melhor para tratamento de queimaduras: Uma pomada A ou uma pomada B?
▶ Pesquisas eleitorais em geral.
Aplicações na área de saúde

▶ Caracterização de populações ou grupos de indivíduos (estrutura etária, renda, perfil


sócio-econômico, etc.);
▶ Analise da evolução de problemas de saúde;
▶ Levantamento e acompanhamento das condições de saúde segundo tipo de moradia,
ocupação territorial e acesso aos serviços de saneamento básico;
▶ Pesquisa sobre dependência de substâncias psico-ativas;
▶ Acompanhamento de tábuas de mortalidade relacionadas a determinado tipo de doença;
▶ Avaliação das condições gerais de saúde da população segundo presença/ausência de
determinado fator de risco;
▶ Levantamento e acompanhamento da qualidade de serviços de saúde;
▶ etc.
Por que estudar estatística?

▶ A estatística permite quantificar os resultados obtidos num estudo;


▶ As técnicas estatísticas permitem lidar com a variabilidade na tomada de decisões;
▶ A Estatística permite estender as conclusões baseadas em uma amostra para a população-
alvo escolhida para o estudo, com margem de erro pequena e conhecida;
▶ A Estatística permite a quantificação da incerteza na tomada de decisões, e muitos
dos resultados são baseados na teoria da probabilidade.
O que você aprenderá nesta disciplina?

1. Estatística Descritiva
▶ População e Amostra, Variável, Tipos de Variável, Fases do Trabalho Estatístico;
▶ Coleta, Tabulação, Representação Gráfica, Medidas de Posição, Medidas de varia-
ção
2. Introdução à Probabilidade
▶ Espaço Amostral, Eventos, Definição de Probabilidade, Propriedades da Probabili-
dade, Probabilidades da União e Interseção;
▶ Distribuição de Probabilidade, Distribuição Normal.
3. Inferência Estatística
▶ Noções sobre Amostragem, Determinação do tamanho amostral, Estatística, Esti-
mador, Estimativa;
▶ Estimação Pontual, Estimação por Intervalo, Testes de Hipóteses.
O Pensamento Estatístico

Frase interessante:
“No futuro, o pensamento estatístico será tão necessário para a cidadania eficiente
como saber ler e escrever.”

Herbert George Wells

Note que é uma idéia aliada à dois “pilares”:


1. Leitura;

2. Escrita.
continuação

▶ O Pensamento Estatístico pode ser definido como a capacidade de analisar um


conjunto de informações, obtido através de experiência própria, por leitura, ou-
vindo de alguém, etc., e poder tomar uma decisão;
▶ Pensem no incontável mundo de decisões a serem tomadas num determinado
período de tempo e com uma certa cobrança;
▶ Se levarmos em conta que muitas decisões devem ser tomadas lendo informa-
ções numéricas, é muito importante que o cidadão conheça algumas ferramentas
matemáticas para processá-las;
▶ Ter o poder de tomar decisões diante de incertezas e de informações diversas é
uma arte;
continuação

Outra frase interessante de Rao:


“Parece não haver atividade humana cujo valor não possa ser melhorado injetando-se
idéias estatísticas no planejamento e usando-se métodos estatísticos para análise
eficiente de dados e acesso dos resultados para realimentação e controle.”

Em Estatística, focaremos no uso das técnicas com base em pesquisas quantitativas.


Como seria a estrutura do pensamento estatístico?

Shamos (1995) apresentou o pensamento estatístico como sendo uma estrutura de


três níveis:
1. Pensamento cultural: refere-se ao fato de ser possível a compreensão definição
de termos básicos usados comumente nos meios de comunicação diante de as-
suntos relacionados à ciência;
2. Pensamento funcional: refere-se à capacidade de conversar, ler informações
utilizando termos científicos coerentes;
3. Pensamento científico: Refere-se aos conhecimentos científicos de esquemas
conceituais primordiais ou de teorias que fundamentam a ciência aliada à com-
preensão dos processos científicos e investigados mobilizados para a adequada
tomada de decisão.
Como seria a estrutura do pensamento estatístico?

Fontes: MORAIS, T. M. R (2006) MORAIS, Um estudo sobre o pensamento estatístico: “Componentes e habilidades”,
PUC/SP, 2006; e SHAMOS, M. H. (1995) The myth of scientific literacy
O problema

Uma pesquisa quantitativa só terá sentido para o pesquisador quando as seguintes


questões estiverem definidas:
1. Propostas e objetivos claros com formulação das hipóteses iniciais;
2. Definição da população objeto de estudo;
3. Se o estudo será feito através de censo ou por amostragem;
4. Que variáveis farão parte do estudo;
5. Elaboração de um projeto piloto se necessário;
6. Qual a forma de obtenção dos dados (entrevistas: pessoais, telefone, carta; ou
através de questionários);
7. Questionário com realização de pré-teste para validação (custo, tempo, Compre-
ensão do texto, inclusão ou exclusão de variáveis, etc);
Estatística Descritiva
Estatística Descritiva

▶ Área responsável por resumir os dados através de quantidades numéricas ou fi-


guras que representam todo um conjunto de dados;

▶ As quantidades numéricas podem ser chamadas de medidas de posição ou me-


didas de dispersão;

▶ As figuras são chamadas de gráficos, e são utilizados de acordo com o tipo do


problema em questão.

▶ Além de medidas e gráficos, também podemos considerar na estatística descritiva


o uso de tabelas. Veremos que existem regras adequadas para apresentação da
informação em tabelas e gráficos.
continuação

Em um sentido amplo, as funções da Estatística Descritiva são as seguintes:


1. Obtenção dos dados (coleta);
2. Organização e classificação dos dados;
3. Apresentação dos dados (através de tabelas e gráficos);
4. Cálculo de medidas que forneçam um resumo das informações contidas no con-
junto de dados (medidas-resumo).
Inferência Estatística

▶ Área responsável por um processo de generalização dos resultados obtidos a par-


tir da Estatística Descritiva.

▶ É o que fundamenta a pesquisa científica na estatística, após a apresentação


descritiva dos dados.

▶ A apresentação dos dados pela estatística descritiva estará sempre acompanhada


de uma parcela de não-conhecimento do fenômeno de modo geral, o que gera o
que chamamos em estatística de incerteza. Com base nesta incerteza, métodos
estatísticos são propostos para, com alto nível de confiança, explicar de modo
geral o comportamento de uma população a partir dos dados de uma amostra.

▶ Mas... o que é população e amostra?


População

▶ A população é definida como a coleção completa de todos os elementos que pos-


suem em comum uma característica de interesse para estudo. Em geral, a quan-
tidade de elementos na população é representada pela letra N (maiúscula).

▶ Em muitas aplicações, a população é chamada de população de interesse ou


população-alvo.
Amostra

▶ A amostra pode ser definida como um subconjunto não-vazio de elementos da


população. Em geral, a quantidade de elementos na amostra é representada pela
letra n (minúscula).

▶ A necessidade de obtenção da amostra é devida à restrições referentes à ob-


tenção das informações de todos os elementos da população, como custo por
exemplo.

▶ A amostra deve ser selecionada aleatoriamente. Toda a teoria de inferência é ba-


seada na teoria da aleatorização. Ou seja, a teoria da probabilidade é o principal
alicerce da área de estatística.
Amostragem

▶ Área da Estatística que estuda técnicas e procedimentos para retirar e analisar


uma amostra com objetivo de fazer inferência a respeito da população de onde
essa amostra foi retirada.
Esquema ilustrativo

▶ Quantas pessoas existem na figura abaixo?


Esquema ilustrativo

▶ Quantas pessoas existem na figura abaixo?


Esquema ilustrativo

▶ Quantas pessoas existem na figura abaixo?


Fenômenos estatísticos

▶ Um fenômeno em geral pode ser caracterizado como um acontecimento, um


evento que se pretende analisar. Se o comportamento de um fenômeno não é
conhecido, este fenômeno é aleatório.

▶ Qualquer área do conhecimento tenha interesse em observar um fenômeno atra-


vés da coleta de dados, estará fazendo um estudo estatístico.

▶ Em geral, independentemente da área do conhecimento, as informações (numéri-


cas ou não) sempre estão sujeitas a mudanças a cada coleta, ou seja, estão sujei-
tas à variabilidade. Devido a essa variabilidade, chamamos de variável qualquer
característica que está sujeita a variação.
Coleta de Dados

A coleta de dados consiste no processo físico utilizado para obtenção das informações.
Temos dois tipos de coleta de dados:
1. Coleta direta: Os dados são obtidos na fonte originária. Os valores obtidos são
denominados de dados primários. Podemos dizer ainda que são dados obtidos
diretamente pelo pesquisador ou pela organização em que atua (ou seja, dados
incluídos nos sistemas de informação de organizações).

2. Coleta indireta: Os dados são obtidos através de outras fontes de informação.


Os valores obtidos são denominados de dados secundários. Podemos dizer ainda
que são dados que foram publicados por outra organização (ou seja, dados obtidos
a partir de agências governamentais, empresas, sindicatos, empresas especiali-
zadas em realizar pesquisa de mercado).
Crítica e Análise de Dados

▶ Com o objetivo de eliminar os erros capazes de provocar futuros enganos de apre-


sentação e análise, é necessária uma verificação mais aprofundada dos dados
coletados.

▶ Após a verificação, um estudo descritivo das informações é realizado com o in-


tuito de se propor qual metodologia será mais eficiente para tratar o problema em
questão.

▶ É importante lembrar que o número de metodologias diferentes para um mesmo


problema é razoavelmente grande.
Censo e Amostragem

▶ Para determinados objetivos, o conhecimento da população inteira é importante


em diversos aspectos.
▶ Quando se trata de indivíduos, este conhecimento reflete o cenário real para o
planejamento em saúde, educação, economia, por exemplo.
▶ A coleta de todas as informações da população é chamada de censo.
▶ Quando existem restrições à coleta de todas as informações da população (ex:
custo), um procedimento de Amostragem é realizado. Ou seja, coleta-se uma
amostra dessa população através de um procedimento de sorteio devidamente
planejado e corretamente executado.
Esquema Ilustrativo
Parâmetro e Estimador

Parâmetro
É o valor numérico de alguma característica de interesse na população.

Estimador
É uma medida(fórmula) que descreve alguma característica de interesse na amostra.

Estimativa
É um resultado numérico fornecido quando “jogamos” os valores da amostra na fór-
mula do estimador. O ideal é que a estimativa seja o mais perto possível do valor do
parâmetro.
Em resumo: A partir de uma amostra, calculamos uma estatística que tem o objetivo
de fornecer evidência sobre um determinado fenômeno de interesse, de forma mais
precisa possível.
continuação

Exemplo: Eleição para prefeito de João Pessoa.


▶ População: Conjunto de todos os eleitores habilitados a votar em João Pessoa.

▶ Parâmetro: Proporção de votos do candidato A na população.

▶ Suponha neste caso que uma amostra pode ser um grupo de 1000 eleitores sele-
cionados aleatoriamente em toda a cidade.

▶ Qual seria um estimador razoável para o parâmetro em questão?


Resposta: proporção amostral de votos do candidato A. O resultado numérico
desta expressão fornece uma estimativa de votos para o candidato A com base
nos dados da amostra.
continuação

Pergunta: Se você fosse um pesquisador interessado em saber o percentual de pes-


soas da universidade avaliam a qualidade dos serviços oferecidos de saúde, como
você poderia planejar uma pesquisa que atinja o resultado desejado?

Ou seja: Dada a população de interesse da pesquisa, é necessário realizar um pla-


nejamento adequado para coletar os dados necessários para calcular esse percentual
com o maior grau de precisão possível.
Problema para Discussão para a próxima aula

Imagine que você tem interesse em investigar o perfil de pessoas residentes em João
Pessoa, sobre determinado tipo de problema na voz.

▶ Indique quem poderia ser uma população de interesse.


▶ Quais os possíveis parâmetros de interesse que podem ser considerados para
investigação?
▶ Como você faria para obter uma amostra de pessoas considerando a faixa etária?
▶ É fácil ter acesso a uma lista de pessoas que podem ser pesquisadas?
Cálculos em estatística

▶ Nesta disciplina, cálculos serão inevitáveis.


▶ Como você não ser “pego” de surpresa por fórmulas que aparecerão ao longo da
disciplina?
▶ Resposta: PERDENDO O MEDO DE ENCARÁ-LAS, COMPREENDENDO O QUE
ELA REPRESENTA E QUE NÚMERO SERÁ FORNECIDO.
▶ Em estatística, de forma geral, muitas das fórmulas são relacionadas a SOMATÓ-
RIOS. Discutiremos ideias sobre somatórios para que você se acostume com a
notação em muitas das fórmulas.
Introdução

▶ Em estatística, muitas fórmulas dependem de vários tipos de somas. Ou seja,


o entendimento sobre a ideia de somatórios facilitará bastante o “manuseio” de
muitas fórmulas que serão vistas ao longo do curso.

▶ Começaremos com alguns exemplos bem simples.


continuação

Considere os números 1 e 0 por exemplo. Logo, se quisermos somar estes dois núme-
ros, temos que

1+0=1
Considere os números 1, 0, e 3 por exemplo. Logo, se quisermos somar estes dois
números, temos que

1+0+3=4
continuação

Apesar de uma soma ser simples, em Estatística é importante apresentar uma re-
presentação razoável para a soma de muitas quantidades numéricas. Por exemplo,
imagine se você precisa somar as seguintes informações:

2 3 4 5 7 9 11 2 1 3
9 8 2 3 4 5 7 9 11 2
1 3 9 8 2 3 4 5 7 9
11 2 1 3 9 8 2 3 4 5
7 9 11 2 1 3 9 8 2 3
4 5 7 9 11 2 1 3 9 8

Escrever 2 + 3 + . . . + 3 + 9 + 8 daria um árduo trabalho. Dessa forma, os Somatórios


facilitam bastante a representação de uma soma de vários elementos. Em estatística,
sempre temos o interesse de somar n valores para alguma fórmula.
Somatórios

▶ Em estatística, veremos que um grupo de informações pode ser representado por


uma letra maiúscula, por exemplo, X . Veremos mais à frente que X recebe o nome
de variável.

▶ Além disso, para cada valor do grupo apresentado, é associada uma letra minús-
cula (geralmente referente à variável que representa o grupo) acompanhada de
um índice identificador do elemento dentro do grupo.
▶ A pergunta que não quer calar: O que significa isso?
▶ No exemplo visto anteriormente, temos 60 valores do grupo representado pela
variável X . Ou seja, chamamos cada valor de xi , em que i = 1, . . . , 60. Ou seja:
continuação

x1 = 2 x2 = 3 x3 = 4 x4 = 5 x5 = 7 x6 = 9
x7 = 11 x8 = 2 x9 = 1 x10 = 3 x11 = 9 x12 = 8
x13 = 2 x14 = 3 x15 = 4 x16 = 5 x17 = 7 x18 = 9
x19 = 11 x20 = 2 x21 = 1 x22 = 3 x23 = 9 x24 = 8
x25 = 2 x26 = 3 x27 = 4 x28 = 5 x29 = 7 x30 = 9
x31 = 11 x32 = 2 x33 = 1 x34 = 3 x35 = 9 x36 = 8
x37 = 2 x38 = 3 x39 = 4 x40 = 5 x41 = 7 x42 = 9
x43 = 11 x44 = 2 x45 = 1 x46 = 3 x47 = 9 x48 = 8
x49 = 2 x50 = 3 x51 = 4 x52 = 5 x53 = 7 x54 = 9
x55 = 11 x56 = 2 x57 = 1 x58 = 3 x59 = 9 x60 = 8
continuação

Nesse aspecto, temos que a soma desses 60 valores é representada por

60
X
xi = 320
i =1

Em Estatística, veremos que o número total de observações de um grupo de valores


se chama de amostra. Dessa forma, no geral, temos que o somatório de n valores
numéricos de uma amostra será dado por:
n
X
xi , com i = 1, . . . , n
i =1
Exemplos
1.

0 2 5

Temos que: n = 3, x1 = 0, x2 = 2 e x3 = 5. Dessa forma, temos que:


3
X
xi = x1 + x2 + x3 = 0 + 2 + 5 = 7
i =1

2.

1 1 3 5 2

Temos que: n = 5, x1 = 1, x2 = 1, x3 = 3, x4 = 5, x5 = 2. Dessa forma, temos que:


5
X
xi = x1 + x2 + x3 + x4 + x5 = 1 + 1 + 3 + 5 + 2 = 12
i =1
Soma de Quadrados

Outro tipo de soma considerada em Estatística e que tem muita importância para vários
cálculos que serão apresentados ao longo do curso é a Soma de Quadrados. A idéia
é simples:
Considerando o exemplo 1 apresentado anteriormente, temos que:

0 2 5

Temos que: n = 3, x1 = 0, x2 = 2 e x3 = 5. Se elevarmos cada valor ao quadrado,


temos que x12 = 0, x22 = 4 e x32 = 25. Com isso, temos que a Soma de Quadrados
destes valores é representada por:

3
X
xi2 = x12 + x22 + x32 = 0 + 4 + 25 = 29
i =1
continuação

No exemplo 2, vimos que n = 5, x1 = 1, x2 = 1, x3 = 3, x4 = 5 e x5 = 2. Dessa forma,

5
X
xi2 = 40
i =1

A fórmula geral para a soma de quadrados é dada por:


n
X
xi2
i =1
Quadrado da Soma

Outra fórmula bem importante é o quadrado da soma. A ideia é simples. Basta pegar
uma soma simples e elevar esta soma ao quadrado.
Considerando os exemplos anteriores, temos que:
1. x1 = 0, x2 = 2 e x3 = 5. Assim,

3
!2
X
xi = (0 + 2 + 5)2 = 72 = 49
i =1

2. x1 = 1, x2 = 1, x3 = 3, x4 = 5 e x5 = 2. Assim,

5
!2
X
xi = (1 + 1 + 3 + 5 + 2)2 = 122 = 144
i =1
Soma de Produtos

Em Estatística, nem sempre teremos informação numérica de um único grupo de va-


lores. Ao considerar dois grupos de valores numéricos, representados por X e Y por
exemplo, podemos pensar na soma dos produtos entre cada par de valores apresenta-
dos. Ou seja, temos que a Soma de Produtos é representada por:

n
X
xi yi
i =1
Exemplo

X 0 2 5
Y 1 3 8

Temos que x1 = 0, x2 = 2 e x3 = 5. Além disso, temos que y1 = 1, y2 = 3 e y3 = 8. Dessa


forma, temos que pensar sempre na seguinte estrutura:

X Y XY
x1 = 0 y1 = 1 x1 y1 = 0 · 1 = 0
x2 = 2 y2 = 3 x2 y2 = 2 · 3 = 6
x3 = 5 y3 = 8 x3 y3 = 5 · 8 = 40

Dessa forma, temos que


3
X
xi yi = x1 y1 + x2 y2 + x3 y3 = 0 + 6 + 40 = 46
i =1
continuação

Em resumo: Para ter uma estrutura organizada de cálculo para muitas fórmulas utiliza-
das em Estatística, é preciso montar a seguinte tabela:

X Y X2 Y2 XY
x1 y1 x12 y12 x1 y1
x2 y2 x22 y22 x2 y2
x3 y3 x32 y32 x3 y3
.. .. .. .. ..
. . . . .
xn yn xn2 yn2 xn yn
n
X n
X n
X n
X n
X
xi yi xi2 yi2 xi yi
i =1 i =1 i =1 i =1 i =1

Você também pode gostar