Você está na página 1de 29

MATEMÁTICA, 3° Ano do Ensino Médio

Noções de Estatística: pesquisa e representações gráficas

Estatística
Definição
Estatística é a parte da Matemática em que se investigam processos
de obtenção, organização e análise de dados sobre uma população ou
uma coleção de seres quaisquer e métodos de tirar conclusões e fazer
predições com base nestes dados.

Dado Bruto
Todo conjunto de dados desorganizados.

População
Conjunto de tudo o que interessa ao estudo de um problema
de pesquisa, segundo alguma característica pré-selecionada.
MATEMÁTICA, 3° Ano do Ensino Médio
Noções de Estatística: pesquisa e representações gráficas

Amostra
Qualquer subconjunto não vazio de uma população, ou seja, qualquer
parte não vazia de uma população.

Variável
Tem por característica apresentar uma variabilidade quando são
realizadas sucessivas mensurações.

Variável qualitativa
Quando seu valores são expressos por atributos: sexo, cor da
pele,etc.
MATEMÁTICA, 3° Ano do Ensino Médio
Noções de Estatística: pesquisa e representações gráficas

Variável quantitativa
Quando os dados são de caráter nitidamente quantitativo, e o conjunto
dos resultados possui uma estrutura numérica, trata-se portanto da
estatística de variável e se dividem em :

• VARIÁVEL DISCRETA OU DESCONTÍNUA: Seus valores são expressos


geralmente através de números inteiros não negativos. Resulta
normalmente de contagens. Ex: Nº de alunos presentes às aulas de
introdução à estatística econômica no 1º semestre de 2017: mar = 18 ,
abr = 30 , mai = 35 , jun = 36.

• VARIÁVEL CONTÍNUA: Resulta normalmente de uma mensuração, e


a escala numérica de seus possíveis valores corresponde ao
conjunto R dos números Reais, ou seja, podem assumir, teoricamente,
qualquer valor entre dois limites. Ex.: Quando você vai medir a
temperatura de seu corpo com um termômetro de mercúrio o que ocorre é
o seguinte: O filete de mercúrio, ao dilatar-se, passará por todas as
temperaturas intermediárias até chegar na temperatura atual do seu
corpo.
Rol
É toda sequência de dados onde cada um, a partir do segundo, é
maior ou igual ao antecessor.

Out liers
Valores fora da realidade de um conjunto.
“Ponto fora da curva”

Amplitude
Amplitude de um rol é a diferença entre o maior e o menor valor dessa
sequência de dados. Ela determina o grau de oscilação dos elementos
do conjunto pesquisado.
Frequências
• Frequência absoluta é a quantidade de vezes que cada valor é
citado em um conjunto pesquisado.

• Frequência relativa é o resultado obtido da divisão entre


a frequência absoluta e a quantidade de elementos da população.
Geralmente é apresentada na forma de porcentagem, a partir da
multiplicação por 100.

Classes
Quando as grandezas estudadas possuem enorme variedade,
normalmente grandezas contínuas, agrupam-se os valores em
intervalos menores denominados de Classes.
Exemplo: Um grupo de alunos foi consultado sobre o time paulista de sua
preferência, e os votos foram registrados assim:

Time FA FR (%)
 Santos: 6
 Palmeiras: 10 Santos 6 15
 Corinthians: 8 Palmeiras 10 25
 São Paulo: 16
Corinthians 8 20
São Paulo 16 40
Total 40 100
MATEMÁTICA, 3° Ano do Ensino Médio
Noções de Estatística: pesquisa e representações gráficas

Gráficos

• Gráfico de colunas

Número de Acidentes da Empresa


FOGO & CIA
25
Quantidade de acidentes

20
20
15
15
10
10
7
5 3

0
Jan/08 Jan/09 Jan/10 Jan/11 Jan/12
Mês/Ano
MATEMÁTICA, 3° Ano do Ensino Médio
Noções de Estatística: pesquisa e representações gráficas

• Gráfico de barras
Número de Acidentes da Empresa FOGO
& CIA
Jan/12 20

Jan/11 3
Mês/Ano

Jan/10 7

Jan/09 10

Jan/08 15

0 5 10 15 20 25
Quantidade de Acidentes
MATEMÁTICA, 3° Ano do Ensino Médio
Noções de Estatística: pesquisa e representações gráficas

• Gráfico pizza

Número de Acidentes da Empresa FOGO &


CIA (%)

01/01/2008
27.3
36.4 01/01/2009
01/01/2010
01/01/2011
01/01/2012

18.2

5.5 12.7
MATEMÁTICA, 3° Ano do Ensino Médio
Noções de Estatística: pesquisa e representações gráficas

• Gráfico de linha
Número de Acidentes da Empresa FOGO &
CIA
25

20
Quantidade de acidentes

15

10

0
Jan/08 Jan/09 Jan/10 Jan/11 Jan/12

Mês/Ano
Histograma
O histograma, também conhecido como distribuição de frequências, é
a representação gráfica em colunas ou em barras (retângulos) de um
conjunto de dados previamente tabulado e dividido em classes
uniformes ou não uniformes. A base de cada retângulo representa uma
classe. A altura de cada retângulo representa a quantidade ou a
frequência absoluta com que o valor da classe ocorre no conjunto de
dados para classes uniformes ou a densidade de frequência para
classes não uniformes
Ex: Histograma de um grupo de 18 pacientes. Coleta de HDL com 6
classes definidas e intervalos de 5 mg/dL.
Polígono de frequências
A partir de uma tabela de distribuição de frequências ou
histograma é possível construir um polígono de
frequências. O polígono de frequência é um gráfico em
linha, sendo construído a partir dos pontos médios dos
intervalos de classes (eixo das abscissas) e as frequências
absolutas (eixo das ordenadas). Unindo os pontos obtidos
por meio de segmentos de reta formamos o polígono.
Ex:
Ogiva de Galton
O conceito é análogo ao do Polígono de Frequência, com a única
diferença que aqui se utilizam as Frequências Acumuladas.
Medidas de Tendência Central

• Média Aritmética

A média aritmética, ou simplesmente média, é uma medida de


tendência central que se comporta com o ponto de equilíbrio dos
valores obtidos a partir de um conjunto de dados. Dentre todas as
medidas de tendência, talvez seja a mais popular, pois desde o início
de nossa vida escolar somos, obrigatoriamente, apresentados a ela e
nos habituamos com seu cálculo, que por ser simples é bastante
utilizada no nosso cotidiano.
Para calcular a média aritmética de dois ou mais dados numéricos,
dividimos a soma desses números pela quantidade dos números
dados.

Vejamos com isso se aplica na nossa situação-problema:

Número de batimento 75 76 77 78 79 80 85 88 90 92
cardíacos por minuto
Frequência 3 9 5 7 2 3 6 2 7 4
Considerando inicialmente as frequências cardíacas que apareceram, isto
é, desconsideramos as frequências de cada uma delas.

Assim, os valores para os quais calcularemos a média aritmética serão:

75, 76, 77, 78, 79, 80, 85, 88, 90 e 92 .


Matemática, 1º Ano do Ensino Médio
Medidas de tendências centrais: mediana e moda

Assim, podemos ver que a média aritmética, ou simplesmente a média,


será dada por:

75  76  77  78  79  80  85  88  90  92 820
Média    82 .
10 10

De modo geral, podemos dizer que na média a frequência cardíaca dos


alunos da turma foi de 82 batimentos por minuto. Isso significa dizer que
se todos os batimentos fossem iguais, esse seria o valor encontrado.
Matemática, 1º Ano do Ensino Médio
Mdidas de tendências centrais: mediana e moda
• Média Aritmética Ponderada

Para calcular a média aritmética ponderada dos dados numéricos de


uma tabela de distribuição de frequências, dividimos a soma desses
números, multiplicados pelas suas respectivas frequências, pela
quantidade total dos dados, isto é, pela soma de todas as
frequências.

Voltemos à nossa situação-problema:

Agora, consideramos as frequências cardíacas que apareceram na tabela


de distribuição de frequências, bem como suas respectivas frequências.

Ou seja, calculamos a média aritmética ponderada utilizando os valores


dos batimentos cardíacos que aparecem na tabela, bem como suas
respectivas frequências.
Matemática, 1º Ano do Ensino Médio
Medidas de tendências centrais: mediana e moda

Número de batimento 75 76 77 78 79 80 85 88 90 92
cardíacos por minuto
Frequência 3 9 5 7 2 3 6 2 7 4

Assim, temos que sua média aritmética ponderada será dada por:

75  3  76  9  77  5  78  7  79  2  80  3  85  6  88  2  90  7  92  4 3922
Média    81,7 .
395 7  23 6 2 7  4 48

Observe que este valor representa melhor os valores encontrados, pois dá


a devida contribuição de todos os valores de batimentos cardíacos
presentes na tabela.
• Moda

Por definição, a moda de uma coleção de dados amostrais ou


populacionais é simplesmente o valor que aparece o maior número de
vezes, isto é, aquele que apresenta a maior frequência observada na
tabela de distribuição de frequências.

Em amostras grandes ou com valores muito repetidos, há casos em


que a moda não é única, situações em que dois ou mais valores
amostrais tenham ocorrido com a mesma frequência e esta
quantidade de ocorrências seja máxima.

Assim, dependendo de cada caso, podemos ter distribuições


monomodais, ou simplesmente modais, bimodais, trimodais ou ainda
multimodais.
Pode acontecer ainda o caso em que todos os valores amostrais
tenham apresentado o mesmo número de ocorrências, significando
que neste caso não há moda, pois nenhum valor se destacou,
configurando assim uma distribuição amodal.
Matemática, 1º Ano do Ensino Médio
Medidas de tendências centrais: mediana e moda

Agora, considerando uma outra distribuição de frequências, poderíamos


obter resultados diferentes:

Número de batimento 75 76 77 78 79 80 85 88 90 92
cardíacos por minuto
Frequência 2 4 8 7 2 8 6 2 8 4

Neste caso, temos uma distribuição trimodal com os valores de 77, 80 e


90 batimentos cardíacos por minuto.

Por outro, lado a distribuição abaixo é amodal, visto que todos os valores
apresentam a mesma frequência:

Número de batimento 75 76 77 78 79 80 85 88 90 92
cardíacos por minuto
Frequência 5 5 5 5 5 5 5 5 5 5
X

• Mediana

Valor situado de tal forma no conjunto de dados que o separa em dois


subconjuntos de mesmo número de elementos.

◦ Dada uma série de valores como:


{ 5, 2, 6, 13, 9, 15, 10 }

◦ 1º - ordenar a série { 2, 5, 6, 9, 10, 13, 15 }

◦ O valor que divide a série acima em duas partes iguais é igual a 9,


logo a Md = 9
• Método prático para o cálculo da Mediana

1º) Se a série dada tiver número ímpar de termos:

 O valor mediano será o termo de ordem dado pela fórmula:


(n+1)/2

 Exemplo: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 }

 1º - ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }

 n = 9 logo (n + 1)/2 é dado por (9+1) / 2 = 5, ou seja, o 5º elemento


da série ordenada será a mediana

 A mediana será o 5º elemento = 2


2º) Se a série dada tiver número par de termos:
– O valor mediano será o termo de ordem dado pela fórmula:
[( n/2 ) +( n/2+ 1 )] / 2

– Obs: n/2 e (n/2 + 1) serão termos de ordem e devem ser


substituídos pelo valor correspondente.

Exemplo: Calcule a mediana da série


{1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }

– 1º - ordenar a série { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }

– n = 10 logo a fórmula ficará: [( 10/2 ) + (10/2 + 1)] / 2 =


[( 5 + 6)] / 2 será na realidade (5º termo+ 6º termo) / 2

– 5º termo = 2 e 6º termo = 3

– A mediana será = (2+3) / 2 ou seja, Md = 2,5 . A mediana no


exemplo será a média aritmética do 5º e 6º termos da série.

Vanessa Fortes Aula 4 25


Medidas de dispersão

Observamos alguns grupos:

Grupo A: 20 anos; 20 anos; 20 anos; 20 anos; 20 anos; 20 anos


Grupo B: 22 anos; 23 anos; 18 anos; 19 anos; 20 anos; 18 anos
Grupo C: 6 anos; 62 anos; 39 anos; 4 anos; 8 anos;1 ano

MAA = 20 anos
MAB = 20 anos
MAC = 20 anos
 Variância:

◦ Desvio
di = xi – MA

◦ Variância
Grupo A (20, 20, 20, 20, 20, 20)
MA = 20
Desvios: 20 – 20 = 0; todos iguais a 0
V=0

Grupo B (22, 23, 18, 19, 20, 18)


MA = 20
Desvios: 22 – 20 = 2; 23 – 20 = 3; 18 – 20 = – 2; 19 – 20 = – 1 ;20 – 20 = 0; 18 – 20 = – 20

Grupo C (6, 62, 39, 4, 8, 1)


MA = 20
Desvios = 6 – 20 = – 14; 62 – 20 = 42; 39 – 20 = 19; 4 – 20 = – 16 ;8 – 20 = – 12; 1 – 20 = – 19
 Desvio padrão:

Obs:
- Quando todos os valores das variáveis são iguais, o desvio padrão é
0.
- Quanto mais próximo de 0 é o desvio padrão, mais homogênea é a
distribuição de valores da variável.
- O desvio padrão é expresso na mesma unidade da variável;.

Você também pode gostar