Você está na página 1de 10

AULA 1 - Introdução à Estatística

 Conceitos centrais
 Divisão da estatística
 Aplicação da estatística

A estatística é uma disciplina matemática que se concentra na colecta, análise e


interpretação de dados para ajudar a tomar decisões e fazer inferências sobre o mundo
ao nosso redor. Ela é utilizada em muitas áreas da ciência, incluindo a psicologia, para
ajudar os pesquisadores a entender e tirar conclusões a partir de dados colectados. A
estatística é uma ferramenta importante para a psicologia porque ajuda a fazer sentido
dos dados colectados em estudos empíricos. Os psicólogos usam a estatística para
testar hipóteses, avaliar a eficácia dos tratamentos, comparar grupos de participantes,
e muito mais.

A estatística pode ser dividida em duas áreas principais: estatística descritiva e


inferencial.

A estatística descritiva é o ramo da estatística que se concentra na organização,


resumo e apresentação dos dados. Já a estatística inferencial é o ramo da estatística
que se concentra na generalização a partir de uma amostra para uma população.
Antes de começar qualquer análise estatística, é importante definir as variáveis em
estudo. As variáveis são características que podem variar de um indivíduo para outro,
como idade, sexo, nível de ansiedade, etc.
Existem dois tipos de variáveis: variáveis dependentes e independentes. Uma
variável independente é aquela que pode ser manipulada ou controlada em um
estudo ou experimento pelo pesquisador. Ela é frequentemente representada no eixo
horizontal de um gráfico ou tabela e é usada para prever ou explicar as mudanças na
variável dependente.
Um exemplo de variável independente pode ser a quantidade de fertilizante usada em
uma plantação. Se quisermos estudar o efeito do fertilizante no crescimento das
plantas, podemos variar a quantidade de fertilizante aplicada e medir o crescimento
das plantas como a variável dependente.
Outros exemplos de variáveis independentes podem incluir a idade, gênero, nível de
escolaridade, localização geográfica, tratamento médico e outros factores que possam
ser controlados ou manipulados em um estudo ou experimento.
enquanto a variável dependente é aquela que é medida e que pode ser influenciada
pela variável independente em um experimento ou estudo.
Alguns exemplos de variáveis dependentes incluem:
Pressão arterial - pode ser afectada por factores como o consumo de sal, o exercício
físico e a genética.
Rendimento escolar - pode ser afectado por factores como a qualidade do ensino, o
envolvimento dos pais e a motivação dos alunos.
Satisfação no trabalho - pode ser afectada por factores como o ambiente de trabalho, o
salário e a carga horária.
Nível de estresse - pode ser afectado por factores como a quantidade de trabalho, a
qualidade do sono e a vida pessoal.

Aplicação da estatística em ciências sociais


A estatística desempenha um papel importante nas ciências sociais, pois ajuda a
entender as tendências e padrões em conjuntos de dados relacionados a questões
sociais. Algumas das aplicações da estatística em ciências sociais incluem:
Análise de pesquisas de opinião pública: A estatística é usada para analisar pesquisas
de opinião pública, incluindo a determinação de margens de erro e a análise dos
resultados de pesquisas.

Análise de dados demográficos: A estatística é usada para analisar dados


demográficos, como idade, sexo, renda, gênero, nível de escolaridade e outros
factores que influenciam as tendências sociais.

Estudos de correlação: A estatística é usada para analisar a relação entre duas ou mais
variáveis, como a relação entre renda e saúde ou entre escolaridade e emprego.

Análise de tendências: A estatística é usada para analisar tendências ao longo do


tempo em áreas como crime, educação, saúde e pobreza.
Estudos experimentais: A estatística é usada para analisar dados de estudos
experimentais, incluindo ensaios clínicos e pesquisas de campo.

Um dos primeiros passos na análise estatística é a medida de tendência central, que


é uma forma de resumir os dados em um único número que representa o centro da
distribuição. As três medidas de tendência central mais comuns são a média, a
mediana, a moda, a variância e o desvio padrão.
A média é a soma de todos os valores dividida pelo número de valores, a mediana é
o valor central na distribuição ordenada, e a moda é o valor que aparece com mais
frequência na distribuição.
Exemplo: Determine a média, mediana e moda dos seguintes dados.
12 12 13 12 14 11 12 13 13 14 15 11

Outra medida estatística importante é a dispersão, que é uma forma de medir a


variação dos dados em torno da medida de tendência central. As medidas de dispersão
mais comuns são a amplitude, a variância e o desvio padrão. A amplitude é a
diferença entre o maior e o menor valor na distribuição, a variância é uma medida da
variação em relação à média, e o desvio padrão é a raiz quadrada da variância.
Quando os dados são distribuídos normalmente, muitas técnicas estatísticas podem ser
utilizadas. Por exemplo, o teste t de Student é frequentemente utilizado para comparar
duas amostras, enquanto a análise de variância (ANOVA) é utilizada para comparar
três ou mais amostras. Além disso, a correlação é uma técnica estatística que é usada
para avaliar a relação entre duas variáveis.
É importante lembrar que a estatística é apenas uma ferramenta e que os resultados só
são tão bons quanto os dados coletados. Portanto, é essencial coletar dados de alta
qualidade e garantir que os resultados estatísticos sejam interpretados corretamente.
A estatística pode ser dividida em duas áreas principais: estatística descritiva e
estatística inferencial.
A estatística descritiva é o ramo da estatística que se concentra na organização,
resumo e apresentação dos dados. Ela é usada para descrever as características dos
dados, como a média, mediana, moda, variância, desvio padrão, entre outras medidas
estatísticas. A estatística descritiva é importante porque ela nos ajuda a entender a
natureza dos dados que estamos trabalhando, facilitando a comunicação e o
entendimento dos resultados para outras pessoas.
Média, mediana, moda, variância e desvio padrão são medidas estatísticas comumente
utilizadas na análise de dados.
A média é a medida de tendência central mais comum e é calculada somando todos os
valores e dividindo pela quantidade de valores. Ela é útil quando os dados estão
aproximadamente distribuídos de forma simétrica e não apresentam muitos valores
extremos. A fórmula para calcular a média é:
média = (soma dos valores) / (quantidade de valores)
A mediana é outra medida de tendência central que é encontrada no ponto médio da
distribuição de dados ordenados. Ela é uma medida mais robusta que a média, pois
não é tão influenciada por valores extremos na distribuição. A fórmula para encontrar
a mediana depende da quantidade de valores e se a quantidade é par ou ímpar.
A moda é o valor mais comum na distribuição de dados. É a medida de tendência
central mais adequada para dados que possuem valores discretos ou categorias. Em
uma distribuição com vários valores de mesma frequência, há mais de uma moda.
A variância mede a variação dos dados em relação à média. Ela é calculada pela
média dos quadrados das diferenças entre cada valor e a média. Quanto maior a
variância, mais dispersos são os dados. A fórmula para calcular a variância é:
variância = (soma dos quadrados das diferenças entre cada valor e a média) /
(quantidade de valores - 1)
O desvio padrão é a raiz quadrada da variância. Ele fornece uma medida da dispersão
dos dados em relação à média e é expresso na mesma unidade que os dados originais.
Um desvio padrão maior indica maior dispersão dos dados em relação à média,
enquanto um desvio padrão menor indica menos dispersão. A fórmula para calcular o
desvio padrão é:
desvio padrão = raiz quadrada da variância

Amplitude: a diferença entre o maior e o menor valor em um conjunto de dados.


Quartis: dividem os dados em quartos, com cada quartil representando 25% dos
dados.
Coeficiente de correlação: mede a força e a direção da relação entre duas variáveis.
Regressão: uma análise estatística que pode ser usada para prever uma variável com
base em outra.
Distribuição: uma função que descreve a probabilidade de cada valor em um conjunto
de dados.
Coeficiente de variação: mede a variação relativa em relação à média.
Qui-quadrado: um teste estatístico usado para avaliar a diferença entre os dados
observados e os dados esperados.
Teste t: um teste estatístico usado para avaliar se as médias de duas amostras são
estatisticamente diferentes.
Análise de variância (ANOVA): um teste estatístico usado para avaliar se há
diferenças estatisticamente significativas entre as médias de três ou mais grupos.
Essas são apenas algumas das muitas medidas estatísticas que os analistas podem usar
para descrever e analisar dados. A escolha da medida ou técnica correta depende dos
objetivos da análise e da natureza dos dados.

Além das medidas estatísticas descritivas, da amplitude, quartis, coeficiente de


correlação, regressão, distribuição, coeficiente de variação, qui-quadrado, teste t e
ANOVA, existem muitas outras medidas e técnicas estatísticas que podem ser usadas
para descrever, analisar e interpretar dados. Algumas dessas medidas incluem:
Análise de componentes principais (PCA): uma técnica de redução de
dimensionalidade usada para encontrar os principais fatores que explicam a variação
em um conjunto de dados.
Análise discriminante: uma técnica usada para classificar os objetos em diferentes
grupos com base em suas características.
Regressão logística: uma técnica usada para modelar a probabilidade de um evento
ocorrer em função de variáveis independentes.
Correlação de Spearman: uma medida de correlação não paramétrica que avalia a
relação entre duas variáveis ordinais.
Coeficiente de determinação (R²): uma medida que indica a proporção da variância
em uma variável dependente explicada pelas variáveis independentes.
Análise de cluster: uma técnica usada para agrupar objetos com base em suas
características semelhantes.
Teste de hipóteses: uma técnica estatística usada para avaliar se uma afirmação sobre
um conjunto de dados é estatisticamente significativa.
Regressão linear simples: uma técnica usada para modelar a relação entre duas
variáveis contínuas.
Estatística bayesiana: um ramo da estatística que usa a teoria das probabilidades para
modelar incertezas e inferir resultados.
Essas são apenas algumas das muitas medidas e técnicas estatísticas que os analistas
podem usar para descrever e analisar dados. A escolha da medida ou técnica correta
depende dos objetivos da análise, da natureza dos dados e das suposições que podem
ser feitas sobre os dados.

A estatística inferencial é o ramo da estatística que se concentra na generalização a


partir de uma amostra para uma população. Ela é usada para fazer inferências sobre
uma população a partir de dados coletados de uma amostra. As técnicas estatísticas
inferenciais são usadas para testar hipóteses e para determinar se os resultados obtidos
são significativos ou se podem ter ocorrido por acaso.
Ambas as áreas da estatística são importantes para a pesquisa em psicologia, e muitas
vezes são utilizadas em conjunto para chegar a conclusões significativas e válidas
sobre o comportamento humano. A estatística é uma ferramenta essencial na
psicologia, pois permite aos pesquisadores quantificar e analisar dados de uma forma
sistemática e objetiva, e ajudar a fazer sentido dos resultados obtidos nos estudos.

Essas são apenas algumas das muitas aplicações da estatística em ciências sociais. A
estatística é uma ferramenta valiosa para os pesquisadores sociais, pois ajuda a
entender os fenômenos sociais complexos e a tomar decisões informadas com base em
dados confiáveis.

1.1.
Exercícios sobre amplitude, desvio médio, variância, desvio padrão, quartis,
coeficiente de variação.
Em uma turma de 20 alunos, as notas da prova foram: 4, 5, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8,
9, 9, 9, 9, 9, 10, 10. Encontre a amplitude.
A amplitude é a diferença entre a maior e a menor observação. Nesse caso, a maior
nota é 10 e a menor nota é 4. Portanto, a amplitude é 10 - 4 = 6.

Calcule o desvio médio da seguinte amostra de dados: 3, 4, 5, 6, 7.


Para calcular o desvio médio, primeiro precisamos calcular a média dos dados. A
média é (3+4+5+6+7)/5 = 5.
Agora, subtraímos a média de cada observação, calculamos o valor absoluto dessas
diferenças e, por fim, fazemos a média desses valores.

Desvio médio = (|3-5| + |4-5| + |5-5| + |6-5| + |7-5|)/5 = 2/5 = 0,4.

Portanto, o desvio médio é 0,4.

Calcule a variância e o desvio padrão para os seguintes dados: 2, 4, 5, 7, 8.


Para calcular a variância, primeiro precisamos calcular a média dos dados, que é
(2+4+5+7+8)/5 = 5,2.

Agora, subtraímos a média de cada observação, elevamos cada uma dessas diferenças
ao quadrado e somamos esses valores. Em seguida, dividimos essa soma pelo número
de observações.

Variância = ((2-5,2)^2 + (4-5,2)^2 + (5-5,2)^2 + (7-5,2)^2 + (8-5,2)^2)/5 = 5,36.

Para calcular o desvio padrão, basta tirar a raiz quadrada da variância.

Desvio padrão = √5,36 ≈ 2,31.

Portanto, a variância é 5,36 e o desvio padrão é aproximadamente 2,31.

Calcule o primeiro e o terceiro quartis para a seguinte amostra: 1, 3, 4, 6, 7, 8, 10.


O primeiro quartil (Q1) é o valor que separa os 25% menores dados dos 75% maiores.
Para calcular o primeiro quartil, ordenamos os dados e encontramos a mediana dos
dados menores que a mediana geral.

Dados ordenados: 1, 3, 4, 6, 7, 8, 10.

A mediana é 6. Os dados menores que 6 são 1, 3, 4. Portanto, a mediana desses dados


é 3.

Logo, Q1 = 3.
O terceiro quartil (Q3) é o valor que separa os 75% maiores dados dos 25% menores.
Para calcular o terceiro quartil, ordenamos os dados e encontramos a mediana dos
dados maiores que a med

1. Considere o seguinte conjunto de dados:


{3, 4, 5, 6, 7, 8, 9}

a) Qual é a amplitude desse conjunto de dados?

b) Qual é o desvio médio desse conjunto de dados?

c) Qual é a variância desse conjunto de dados?

d) Qual é o desvio padrão desse conjunto de dados?

e) Calcule o primeiro quartil (Q1) desse conjunto de dados.

f) Calcule o coeficiente de variação desse conjunto de dados.

Respostas:

a) A amplitude é a diferença entre o maior e o menor valor. Nesse caso, o menor valor
é 3 e o maior é 9, então a amplitude é 9 - 3 = 6.

b) O desvio médio é a média dos desvios absolutos em relação à média. Primeiro,


calculamos a média dos dados:

média = (3 + 4 + 5 + 6 + 7 + 8 + 9) / 7 = 6

Agora, calculamos os desvios absolutos em relação à média:


|3 - 6| = 3
|4 - 6| = 2
|5 - 6| = 1
|6 - 6| = 0
|7 - 6| = 1
|8 - 6| = 2
|9 - 6| = 3

A média desses desvios é:

(3 + 2 + 1 + 0 + 1 + 2 + 3) / 7 = 2

Portanto, o desvio médio é 2.

c) A variância é uma medida de dispersão que mostra o quão distantes os valores


estão da média. A fórmula da variância é:

variância = Σ(xi - média)² / n

Onde Σ é o somatório, xi é cada valor do conjunto de dados, média é a média dos


valores e n é o número de valores. Para o conjunto de dados dado, temos:

variância = [(3 - 6)² + (4 - 6)² + (5 - 6)² + (6 - 6)² + (7 - 6)² + (8 - 6)² + (9 - 6)²] / 7

variância = (9 + 4 + 1 + 0 + 1 + 4 + 9) / 7

variância = 4

d) O desvio padrão é a raiz quadrada da variância:

desvio padrão = √variância = √4 = 2


e) Para encontrar o primeiro quartil (Q1), é necessário ordenar os dados em ordem
crescente e encontrar a mediana dos valores menores que a mediana geral. Nesse
caso, temos:

{3, 4, 5, 6, 7, 8, 9}

A mediana geral é 6. Os valores menores que 6 são:

{3, 4, 5}

A mediana desses valores é 4. Portanto, o primeiro quartil é 4.

f) O coeficiente de variação é a razão entre o desvio padrão e a média, expresso

Você também pode gostar