Você está na página 1de 28

Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic.

Pablo Adrin Otero

Pgina | 1

Estauistica Besciiptiva
Autor:PabloOtero
Elobjetivoprincipaldelsiguientemduloeselestudioydescripcindeunapoblacinomuestraapartirde
variables cuantitativas y cualitativas. Veremos qu tipos de grficos se pueden construir y qu valores se
puedencalcularparalograrunadescripcincompletadeunapoblacinomuestra.
Paracumplirestoobjetivo,supondremosquehicimosuntrabajodeinvestigacinconungrupodealumnos
queestabaintegradoportodoslosalumnosde15a16aosdeunaescuela.Estegrupoqueconstituyla
poblacin, est subdividido en los diferentes cursos (a los que denominaremos: A1, A2, etc.). A cada
alumno se le hicieron algunas mediciones, preguntas u determinaciones, y en el caso de ser mayor de 16
aos los datos no fueron tenidos en cuenta. El total de alumnos, que en este caso seran las unidades
experimentales,fuede324(N=324).
Lasdeterminacionesquesehicieronsobrecadaalumnofueron:
Sexo.
Cuadrodeftbol,porelquehinchaosimpatiza.
Cantidaddehermanos.
Altura(medidaencm).
Peso(medidoenKg).
Opinin sobre la utilidad de la educacin que recibe (se definieron tres categoras: nada, poco y
mucho).
Una vez realizada las determinaciones en todos los alumnos, lo primero que se hizo fue organizar los
datosparasuposterioranlisis.
Unaformadeorganizarestosdatosesconstruirunamatriz(otabladedobleentrada)queposeaenlas
columnas las variables y en las filas los casos particulares (datos de cada unidad experimental). Esto se
puede hacer en algn programa de hojas de clculo (tipo Excel) o directamente en algn programa de
anlisisestadstico(tipoGStat,Statistix,Statistica,etc.)
AcontinuacinsemuestracomoquedaralaplanilladedatosenExcellistaparacomenzaracompletar
losdatos:
Figura1:Enlascolumnaslasvariablesyenlasfilaslasunidadesexperimentales.Enlaprimeracolumnasimplementesenumeraronloscasos,esto
puedeobviarseyaquelosprogramasdeanlisisestadsticolohacenautomticamente.Semuestranslolascuatroprimerasfilas.Esteejemplofue
generadoconExcel2007porloquepuedeservisualmentediferentealohechoenExcel2003.

Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 2

Unavezingresadostodoslosdatostendremoslamatrizcompleta(tendr324x7datos,esdecir2268
datos).

Variablescualitativas
Comenzaremosdescribiendoaestapoblacinenbasealasvariablescualitativasutilizadas.
Lasvariablescualitativasutilizadasenestainvestigacinson:
Sexo:Variablenominaldicotmica.
Cuadrodeftboldelcualeshinchaosimpatizante:Variablenominalpolitmica.
Opininsobrelautilidaddelaeducacinquerecibe:Variableordinal(lascategorasenordenson:
nada,pocoymucho).
Como podemos ver ninguna de estas variables est asociada naturalmente a valores numricos, ni
pueden ser medidas. Algunas de ellas se determinan por simple observacin (ej.: sexo) y otras mediante
preguntas(cuadrodeftbolyopininsobrelaeducacin).
En algunos casos las variables cualitativas pueden ser codificadas con nmeros. Por ejemplo, podemos
dar el cdigo 1 a las mujeres y 2 a los hombres. Esto es vlido y til en algunos casos, pero no deben ser
usados estos cdigos como si fueran variables cuantitativas. Por ejemplo, sera ridculo afirmar que dos
mujeres(2x1)seranigualesaunhombre(1x2).
Lo mismo sucede con las variables ordinales cuando se recodifican. Veamos un ejemplo, si a las
diferentescriticasdepelculaslasidentificoconnmeros(muymala=1,mala=2,regular=3,bueno=4y
muy buena = 5) es una forma vlida manejar la informacin. Lo que no puedo decir es que una pelcula
mala(2)eslamitaddebuenaqueunabuena(4).Lasrelacionesdeproporcinentrelosnmerosutilizados
no son vlidas, simplemente sabemos que 2 es menor que 4, por lo que la primera pelcula recibi peor
crticaquelasegunda.
Paracadaunadeestasvariablespodemoscalcularconqufrecuenciasedancadaunadesuscategoras
(i).Estoserealizaporsimpleconteo(olohaceelprogramaespecficosilosdatosyafueroncargados). La
informacinobtenidaconvieneorganizarlaentablascomolasiguiente:
Tabla1:Tabladefrecuenciasdelascategorasdeunavariablecualitativa.
Sexo F
i
f
i
%
Mujer 175 0.54 54
Varn 149 0.46 46
N 324 1 100

Lafrecuenciaabsoluta(F
i
)decadacategoraessimplementelacantidaddevecesqueocurre;lasumatoria
detodaslasF
i
essiempreigualaNylasfrecuenciasabsolutassonsiemprenmerosenteros.
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 3

= N
Lafrecuenciarelativa(f
i
)secalculasegnlasiguientefrmula:

=
F

N

Lasumatoriadelasfrecuenciasrelativasessiempreiguala1.

= 1
Losvaloresdeporcentaje(%)seobtienensimplementemultiplicandolasfrecuenciasrelativaspor100.
Laventajadeusarfrecuenciasrelativasoporcentajesradicaenquecomosonindependientesdelvalor
deN,sirvenparacomparardospoblacionesdiferentesentres.
Ademsdeorganizarlosdatosenformade tabla,sepueden hacergrficosparadescribir unavariable
deunamuestraopoblacin.Paralasvariablescualitativaslosgrficosquesepuedenhacerson:diagramas
debarrasygrficotipotorta.Ambosgrficossonmuycomunesyengeneralnotraenproblemasparaser
interpretadoscorrectamente.
Diagramas de barras (o grficos de barras): En este tipo de grfico, para cada categora de la variable
cualitativa se dibuja una columna o barra cuya altura es proporcional a la frecuencia (pueden usarse las
frecuencias absolutas, relativas o porcentajes) (Figura 2). Si el grfico est hecho con el propsito de
compararconotrapoblacin,debenusarsefrecuenciasrelativasoporcentajes.

Figura2:Loprincipalenungrficodebarrasesquelaalturadelasbarrasocolumnasdebeserproporcionalalvalordefrecuenciaoporcentaje.
Veamosalgunosejemplosutilizandolosdatosdelaplanilladeadolescentes:
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 4

Figura3:Diagramadebarrasquemuestraladistribucindesexosparalapoblacindeestudio.Enestegrficoseusaronlosvaloresdeporcentaje
paraelejevertical.

Figura4:Diagramadebarrasquemuestralacantidaddehinchasdecadaclubparalapoblacindeestudio.Enestegrficoseusaronlosvaloresde
frecuenciasabsolutasparaelejevertical.
Algunasrecomendacionesalahoradeconstruirestetipodegrficos.

Figura5:Sieldiagramadebarrasessobreunavariableordinal,lascategorasenelgrficodebenseguirelordennatural,enestecaso:nada,pocoy
mucho.

Si la var
categoras
ordinalesde
frecuencias
ordennatur
Elcerod
allectordel
ladiferencia
error.Enl
dobledealt
(dehechola
Figura6:Ung
Si el gr
imperioso
comparacio
porcentaje.
mximo ele
horizontaly
Figura7:Elmis
porcentajes
Curso de
riable cualit
no altera lo
ebeseguirse
paralavari
ral(nada,po
debesersiem
lgrficosugi
aenlasfrecu
sepuedeve
taquelaotra
arelacines
grficomalintenc
fico de bar
que el mx
ones, el m
Esto produ
egido es mu
ysernmeno
smogrficocond
sdelascategora
e Estadstica y D
ativa es nom
os resultados
eelordenl
ableopini
ocoymucho)
mpreelmnim
iriendounad
uencias.Enl
ercmo,sino
a;perosive
s1.27).Estee
cionadoparaeng
ras ser uti
ximo de la
ximo puede
uce que el g
cho ms alt
osnotoriasla
dosescalasvertic
sresultenmenos
utilizado(60%
Diseo de Expe
minal (como
s y son vlid
gicoynatur
nsobrelaut
)ydeberase
modelejed
diferenciaen
afigura6se
osguiamosp
rificamoslos
efectoenga
gaaraloslectore
datosrefle
lizado para
escala en
e establecer
grfico ocupe
to que los va
asdiferencia
calesdiferentes.
sevidentes,adem
%),permitevisua
erimentos 20
o los ejemp
das las difer
ral.Porejem
tilidaddela
erelordena
efrecuencia
ntrelasaltur
muestraun
porlasaltura
snmerosno
ososeprod
es.Noincluiralc
ejenunarealidad
realizar com
ambos cas
rse apenas
e la mayor
alores a gra
as(Figura7).
Enlaversindel
msdesermsd
lizarmejorlasdif
009 - Docente:
los mostrad
rentes altern
mplo,sigrafic
educacin,
ausarenele
soporcenta
rasdelascol
grficomal
asdelascolu
otaremosqu
dujopornoin

ceroenlasescala
ddiferente.
mparaciones
sos coincida
por sobre
rea posible
ficar, resulta
laizquierdaelm
ifcilleerlaescala
ferenciasyleerm
Lic. Pablo Adr
dos anteriorm
nativas. En c
camosenun
elordende
ejedelgrfic
ajes.Denose
umnasquen
hechoenel
umnas,unad
ue33.144no
ncluirelcero
sproducequevi
con los de
a. Si el gr
el valor m
e y sea ms
an grficos a
ximode100%h
a.Enlaversind
mejorlaescala.
rin Otero
mente) el o
cambio en l
ndiagramad
elascategor
o.
erassepue
nosecorresp
cualsecom
delasbarras
oeseldoble
oenlaescala
sualmenteunmi
otra poblac
fico no se
ximo de f
s claro. Cuan
aplastados c
acequelasdifere
eladerecha,elv
Pgina | 5
orden de las
as variables
debarraslas
asposeeun
edeengaar
pondecon
etieste
sesmsdel
de26.090
a.
ismogrupode
cin, resulta
usar para
recuencia o
ndo el valor
contra el eje
enciasentrelos
valormximo
5
s
s
s
n
a
a
o
r
e

Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 6

Laescalaverticaldebertenersuficientesdivisionescomoparapoderextrapolarelaltodelascolumnas
y obtener aproximadamente los valores de frecuencias. Demasiadas divisiones tampoco son
recomendables,yaquedificultanlalecturade losvaloreseneleje.Enalgunosgrficosseagreganacada
columna el valor de la frecuencia. Esto es redundante con la presencia del eje, pero en algunos grficos
sirveparadestacarvalores.
Porltimo,yaquenosetratadeunavariablecontinua,nosedebengraficarlascolumnaspegadasunas
aotras.Porlamismaraznsisetrazanlneasdesdeunacolumnaaotra,slosirvenparavisualizarmejor
lasdiferencias,peroenningncasoconstituyendibujosdeecuacioneslineales.
Otraprcticafrecuenteesutilizarimgenesalusivasaltemadelgrfico.Enestoscasoshayqueteneren
cuenta que, si bien mejoran la presentacin, no deben producir un efecto engaoso y dificultar la
interpretacin del grfico. Por ejemplo en el siguiente grfico (Figura 8) se reemplaza la coloracin de la
columna por una bombita y, a mayor cantidad de bombitas vendidas mayor el tamao. Lo que no es
aconsejabledeestagrficoesquelabombitamsgrande,nosloesmsaltasinotambinmsancha.En
el caso de las columnas la frecuencia slo est representada por la altura; todas las columnas poseen la
mismabase.Enestegrficoeltamaodelasbombitassugiereunadiferenciaentrelasventasalolargode
los aos mayor a la real. Otra crtica es: para qu incluir un eje sin valores? Dado que los valores estn
puestosarribadecadabombita,elejeesprescindible.

Figura8:Mezcladediagramadebarrasypictograma.Enlosdiagramadebarraslafrecuencianadatienequeverconelanchodelascolumnas.En
estecaso,ademsdevariarlaalturadelasbarrastambinvaraelancho.Elejeverticalnotienevaloresniescala.Ntesequelavariabletiempo
estconsideradaenestecasocomovariablenominal:aos.
Sideseamosrepresentarlasfrecuenciasmedianteeltipodegrficoidealesunpictograma.Enestetipo
de grfico a mayor rea mayor frecuencia, y no se utiliza ningn eje. La ausencia de un eje de referencia
hace que sea imprescindible incluir los valores a lado de cada dibujo: En la siguiente figura se muestra un
pictogramaconlasfrecuenciasdehinchasparacadaclub(Figura9).
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 7

117 96 34 32 29 16

Figura9:Enlospictogramaslafrecuenciapuedeestarreferidaalreadeunobjeto.Enestecasolacantidaddehinchasdecadaclubesten
relacinconelreadelapelotadeftbol.Sibiensuelensergrficosmuyvistosos,esindispensablequeseaclarelosvalores,yaqueesmuydifcil
deducirlasfrecuenciasapartirdelosdibujos.
En la siguiente versin del grfico de las bombitas vendidas (Figura 10) todas las columnas poseen el
mismoanchoylaalturadeldibujodelasbombitas(amsaltura,msbombitas)reflejalafrecuencia.Dado
que cada columna posee el valor sobre ella, se podra prescindir del eje vertical (que adems no tiene
valores).

Figura10:Versinmejoradadelgraficodelafigura6.Lafrecuenciaestslorepresentadaporlaaltura,yaquelasbasesdelascolumnasson
iguales.Unejesinvaloresnotienesentidoysedeberaeliminar.
Enelsiguientegrfico(Figura11)quemuestraloscambiosenlaproduccindetrigosegnlosaos,se
cometieron algunos errores. El primero es incluir un eje sin valores; carece de sentido y de utilidad. Otro
erroresqueladistanciaentrelosaosesdiferente,sevaagrandandoamedidaqueseacercaalao1997.
Esto sumado al aumento del tamao del dibujo, agranda las diferencias reales entre las producciones en
diferentesaosyhacemsvisibleelvaloradestacar.
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 8

Figura11:Enestegrficosecometieronerroresenambosejes.Ladistanciaenlosaosdelejehorizontalvaenaumentohastalaltimacategora,
mientrasqueelejeverticalnoposeevaloresniescala.
Grficos tipo torta (Pie chart en ingls): En este tipo de grfico (Figura 12), cada categora de la
variable cualitativa recibe una porcin de la torta proporcional a la frecuencia relativa o porcentaje.
Todoslosprogramasdeanlisisestadsticospermitenhacerestetipodegrfico,perosilodeseamoshacer
en forma manual, simplemente hay que considerar que la circunferencia completa (360) representa el
100%, de forma tal que valores diferentes se obtienen simplemente mediante regla de tres simple. En
ningncasodebesucederquelasumatoriadelosporcentajesseadiferentede100%.

Figura12:Losgrficosdetipotortasonmuyfcilesdehacerydeinterpretar.

Diagramasdebarrasparamsdeunavariablecualitativa:Aveceslarespuestaquebuscamossalede
combinar dos variables cualitativas. Por ejemplo si yo me preguntara: Por qu club hinchan las personas
dedistintosexo?
Para responder esto podra ordenar los datos de frecuencias absolutas en una tabla de doble entrada;
delasiguienteforma:
BocaJuniors RiverPlate RacingClub SanLorenzo Independiente Otros
Mujer 65 50 13 21 17 9 175
Varn 52 46 21 11 12 7 149
117 96 34 32 29 16 N=324

Sicalculamoslosporcentajesdividiendoporeltotal(N=324)ylosmultiplicamosporcien,obtendremos
paralascombinacionesdesexo/club:
54%
46%
Distribucindesexos
mujer varn
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 9

BocaJuniors RiverPlate RacingClub SanLorenzo Independiente Otros


Mujer 20.1 15.4 4.0 6.5 5.2 2.8 54.0
Varn 16.0 14.2 6.5 3.4 3.7 2.2 46.0
36.1 29.6 10.5 9.9 9.0 4.9 100.0

Conestosdatospodemoshacerungrficodebarrascondosseries(unaparacadasexo)(Figura13).

Figura13:Enestegrficodebarras,losvaloresdeporcentajeestndivididosendosseriesdedatos(correspondientesalossexos).Segneste
grficoloquemsabundasonloshinchasvaronesdeBocaJuniors.Notarqueelordendelosclubesdeftbolesarbitrarioysisemodifica,las
conclusionesquesepuedenextraerdelgrficoseranlasmismas.
Conestosmismosdatospodraresponderotraspreguntas,porejemplosimepreguntara:porquclub
defutbolhinchanmslasmujeres?Yloshombres?
Comolacantidaddemujeresyvaronesesdiferente(175vs.149),parapodercompararyresponderla
preguntaconvendraindependizarlosvaloresdeltotaldehinchasdecadasexocalculandolosporcentajes
para cada club por sexo. Para ello dividido el valor de frecuencia absoluta por el total para ese sexo y lo
multiplicopor100.Losresultadosseran:
BocaJuniors RiverPlate RacingClub SanLorenzo Independiente Otros
mujer 37.1 28.6 7.4 12.0 9.7 5.1 100
varn 34.9 30.9 14.1 7.4 8.1 4.7 100
72.0 59.4 21.5 19.4 17.8 9.8

Con estos datos podemos hacer diversos tipos de grficos de barras, a continuacin veremos dos
posibilidades. La primera es hacer un grfico de barras en el cual el eje horizontal tenga dos categoras
principales(sexoenestecaso)yparacadaunodelossexoscincosubcategoras(clubesenestecaso).De
esta forma quedaran cinco columnas o barras para cada sexo. El aspecto del grfico ser el siguiente
(Figura14):

0.0
5.0
10.0
15.0
20.0
25.0
P
o
r
c
e
n
t
a
j
e
Clubdeftbol
Porcentajesdehinchasdeclubesdeftbolpara
ambossexos
Mujer
Varn
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 10

Figura14:Parahacerestegrficolosvaloresdeporcentajefueroncalculadosenrelacinatotaldecadasexoyaqueelobjetivoerasaberparacada
sexoquetipodehinchaeramsfrecuenteyademspodercompararentrehombresymujeres.Segnestegrfico,seamujerovarn,loms
frecuentesesqueseahinchadeBocaJuniors,seguidosporsusprimosRiverPlate.Entrelosvarones,eltercercuadroencantidaddehinchasesSan
Lorenzo,mientrasqueentrelasmujeresesRacingClub.
Otra posibilidad es realizar un diagrama de barras de porcentajes acumulados. En este tipo de grfico
las columnas de las categoras a comparar siempre miden 100%, pero se dividen en porciones segn los
porcentajes de la otra variable cualitativa utilizada. Para los mismos datos usados en el grfico anterior,
estetipodegrficoquedaracondoscolumnas(unaporsexo)divididacadaunadeellasenseisporciones
referidasalosporcentajesdecadaclub.Elaspectodelgrficoserelsiguiente(Figura15).

Figura15:Estegrficoresultaidealparahacercomparacionesyaquelasbarrassiempresoniguales(100%),loquedifiereentreellaseselaltode
lasporcionesreferidasalasegundavariablecualitativa(enestecasolosclubes).

Variablescuantitativas
Continuaremosdescribiendoaestapoblacinenbasealasvariablescuantitativasutilizadas.
Recordemosquelasvariablescuantitativaspuedenser:
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 11

En el caso de que la variable cuantitativa sea discreta el tipo de grfico que se puede hacer es similar al
casodelasvariablescualitativas.Mostraremoselcasodelanlisisdelavariablecantidaddehermanospor
alumno.Losdatossepuedenorganizarycalcularlasfrecuenciasrelativas,absolutasyporcentajesdeigual
maneraquesehizoparalasvariablescualitativas.Latablaquedaradelasiguienteforma:
Cantidaddehermanos F
i
f
i
% F
i(acum)
%
(acum)

0 88 0.27 27.2 88 27.2


1 166 0.51 51.2 254 78.4
2 30 0.09 9.3 284 87.7
3 20 0.06 6.2 304 93.9
4 18 0.06 5.6 322 99.5
5 2 0.01 0.6 324 100
N= 324 1 100

Conestosvalorespodemoshacerdiagramasdebarrasusandolasfrecuenciasabsolutas,lasrelativasolos
porcentajes.Elusodeporcentajespermitacomparacionesposterioresdeestegrficoconotros(Figuras16
y17).

Figura16:Diagramadebarrashechoconlasfrecuenciasabsolutas.
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 12

Figura17:Diagramadebarrashechoconlosporcentajes.
Para las variables discretas se pueden hacer grficos de barras con las frecuencias o porcentajes
acumulados(Figura18).Lasbarrasnodebentocarseentresyaquelavariablenoescontinuaynoexisten
valores intermedios. Este tipo de grficos sirve para ver por debajo de cada valor que porcentaje de las
observacionesestpresente.

Figura18:Diagramadebarrasdeporcentajesacumulados.Estegrficomuestraquecasiel80%delosalumnosposeenhastaunhermano.

Si la variable cuantitativa es continua los tipos de grficos y anlisis que se pueden hacer son muy
diferentesylesdedicaremosespecialatencin.
Sibienlamayoradelosclculoslosharelprogramadeanlisisestadsticoquesevayaausar(ennuestro
casoelGStat)veremosculessonlasfrmulasycriteriosusadosenestosclculos.Siasnolohiciramos,
alusarelprogramayobtenerlosresultadosnosabramosquesignificadotienen.

Utilizaremo
mismosep
Siobservam
archivodeE

Ladiferenci
A diferencia
(inclusonm
Si para un a
que no adm
verdaderaa
queincluye
Alamisma
pero la per
esto,qus
Debidoalo
intervalopo
intervaloo
La cantidad
frmulas ex
necesitamo
Ennuestro
Entodoslo
delinterval
Paraobtene
Para no ten
que el valo
sonnmero
Veamoscm
msdenue
Curso de
osparalossig
uedehacerp
moslosdatos
Excelconlos
Can
iaentreelm
a de otros t
merodecima
alumno se d
miten duda.
altura;esun
laverdader
personasila
sona es la m
sentidotend
anteriorme
oseeunmx
clase,mient
d de clases a
xactas, los s
os:
caso,dadoq
scasostrab
oh.
erelvalorde
ner problema
r de h tenga
osenterosy
moarmarlos
evefilas(ver
e Estadstica y D
guientesejem
paracualqui
sdelavariab
sdatoscorre
ntidaddedat
mximoymn
w
tipos de vari
ales).Valela
determina qu
En cambio
aestimacin
amedida,en
amedimosc
misma. Es im
dracontarla
nteexplicad
ximoyunm
rasqueelva
a utilizar est
iguientes so
queN=324,
ajaremosco
eh:
as en la incl
a ms decim
usaremosh=
sintervalosd
tablaacont
Diseo de Expe
mplosdecl
eradelasot
blealturapo
espondientes
tos(N) 324
nimosecono
w=192cm
iables, las va
apenarecalc
ue: es varn
si esa mism
n(cuantome
nestecasoe
oncintamili
mportante qu
spersonasq
o,conlasva
nimo.Elval
alormximo
en relacin
n buenos cr
usaremose
onclasesoin
usin de los
ales que los
=5.667
delasclases
tinuacin).E
erimentos 20
lculosygrfi
trasvariables
demosextra
s):
4 Mnimo
ocecomorec
m141cm
ariables con
carestadifer
, que tiene
ma persona e
edimosms
elintervalos
imetradasu
ue al trabaja
quemidieron
ariablescuan
lormnimod
debequeda
n con la can
riterios para
lsegundoca
ntervalosde
valores den
s usados par
.Dadoques
Enlaprimera
009 - Docente:
coslavariab
s.
aerciertosva
141cm M
corridomues
m=51cm
tinuas pued
renciaconot
un hermano
es medida y
queuname
era161.51
alturaser1
ar con datos
n162cmsin
ntitativasset
delavariable
rincluidoen
ntidad de ob
saber cunt
asoyk=9.28
igualesanch
ntro de los in
a los datos.
sonnuevecla
acolumnaco
Lic. Pablo Adr
blealturade
aloresimpor
Mximo 192
stral(w).En
m.
en tomar cu
trasvariable
o y que es de
y su altura e
didaexacta
62.5cm).
162.5cm.Lo
de variable
noeselvalor
trabajaconi
edebequed
nlaltimacl
servaciones
tas clases (v

8queseredo
hooamplitu
ntervalos qu
En nuestro
asesdeberem
olocaremos
rin Otero
losalumnos
rtantes(para
2cm
estecaso:
ualquier tipo
esconalguno
e boca, son
es 162 cm, e
obtenemos
svaloresson
s continuas
rexacto?
intervaloso
darincluidoe
ase.
o datos. Si
valor que lla
ondeaak=9
ud;llamarem
ue se formar
caso los dat
moshaceru
laelnmero
Pgina | 13
s,perolo
aelloabrirel
o de valores
osejemplos.
todos datos
esa no es su
unintervalo
ndiferentes,
recordemos
clases.Cada
enelprimer
bien no hay
maremos k)
9.
mosalancho
n conviene
os de altura
natablacon
odeclase(1
3
l
s
.
s
u
o
,
s
a
r
y
)
o
e
a
n
1
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 14

al 9), en la segunda y tercera los lmites inferior y superior (respectivamente de cada clase). Por ejemplo,
para la clase 1, el lmite inferior es el valor mnimo 141 cm y el mximo es 146.667 (que resulta de hacer
141+h).Paralaclase2,elmnimoeselmximodelaclaseanterioryelmximoser152.33(queresulta
de hacer (146.667 + h); y as sucesivamente. Para que los decimales en los valores de los lmites si las
alturas son nmeros enteros? Justamente para no tener dudas a que clase pertenecen los valores; si
hiciramos los intervalos con nmeros enteros, en qu intervalo incluiramos un valor que coincide con
algunodeloslmites?

Lmitedelaclase

Acumuladas
Clase Mnimo Mximo Marcadeclase F
i
% F
i
%
1 141.00 146.67 143.83 5 1.54
5
1.54
2 146.67 152.33 149.50 14 4.32
19
5.86
3 152.33 158.00 155.17 36 11.11
55
16.98
4 158.00 163.67 160.83 67 20.68
122
37.65
5 163.67 169.33 166.50 91 28.09
213
65.74
6 169.33 175.00 172.17 51 15.74
264
81.48
7 175.00 180.67 177.83 45 13.89
309
95.37
8 180.67 186.33 183.50 10 3.09
319
98.46
9 186.33 192.00 189.17 5 1.54
324
100.00

324 100

Cadaintervalostendrunvalorenelcentro,equidistantedelmnimoyelmximo,aesevalorselollama
marca de clase (lo simbolizaremos como X
c
). Cmo puede calcular la marca de clase de un intervalo?,
simplementesumndolealmnimolamitaddelanchodelintervalo(h/2).
Una vez armadas las clases podemos calcular la frecuencia absoluta (F
i
) para cada una de ellas. Si
utilizamosunsoftwareestadsticoestatarealahaceelprograma,perosiloqueremoshacermanualmente
convieneordenarlosdatosdemenoramayorycontarcuantosquedanincluidosencadaunadelasclases
armadas;luegocorroborarque:
F

= N
Calcularlosporcentajesparacadaunadelasclasesserdegranutilidadparaconfeccionargrficosyhacer
comparacionesconotrasmuestrasopoblaciones.
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 15

Lasltimasdoscolumnassonvaloresacumuladosdefrecuenciasyporcentajes.Paracalcularlafrecuencia
acumulada de cualquier clase, simplemente debemos a la frecuencia de esta clase la suma de todos los
valoresdefrecuenciaanteriores;lomismoparalosporcentajes.Porejemplo,lafrecuenciaacumuladadela
cuartaclaseses:
F
4
(ocum) = F
1
+ F
2
+ F
3
+ F
4

LafrecuenciaacumuladadelaltimaclasedebeserigualaN.

Qutiposdegrficossepuedenhacerconestosdatos?
Histogramadefrecuencias:
Unhistogramadefrecuenciasrepresentamedianteelaltodecolumnaslasfrecuenciasparacadaunadelas
clases.Acontinuacinelhistogramadefrecuenciaelaboradoconlosdatosdelatablaanterior(Figura19):

Figura19:Histogramadefrecuenciasparalavariablealtura.Enestecasoenelejehorizontalserotularonlasmarcasdeclase.
A priori parece similar a un diagrama de barras para una variable cualitativa, pero es bastante diferente.
Primerosepuedeverquelascolumnassetocanentresiyesto,msalldeundetalledediseo,esvlido
yaquetodoslosvaloresdelavariablesonposibles.Porotroladoelordendelasclaseseselordennatural
de los nmeros y el nico posible, mientras que en un diagrama de barras puede ser modificado y sigue
siendovlido(exceptoqueseadeunavariableordinal).
Si se desea comparar este grfico con otro hecho a partir de los datos de otra poblacin es necesario
emplearlasfrecuenciasrelativas(f
i
)olosporcentajesyademsemplearelmismovalormximoparaeleje
deporcentaje;enesecasoelgraficoseraas(Figura20):
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 16

Figura20:Histogramahechoconlosporcentajesparalavariablealtura.Enestecasoenelejehorizontalserotularonlasmarcasdeclase(crculo
rojo).Lalneanegraqueunelosvaloresdeporcentajeencadamarcadeclasesedenominapolgonodefrecuenciasyservistomsadelante.

Loshistogramasademsmuestranlaformadeladistribucindeunavariable.Esevidentequelaformade
distribucin de frecuencias est influida por la cantidad de clases (k) utilizadas. Cuando se usan pocas
clases,sibieneltrabajoesmssencillo,elhistogramanomuestraclaramenteladistribucindelavariable.
Si la cantidad de clases es excesiva, adems de dificultarse la tarea de tabular y graficar, el histograma
resultantetampocoesclaro.Poresoesimportanteutilizarlacantidaddeclasescorrecta(Figura21).

Figura21:Enestoscuatrohistogramassevecomolacantidaddeclasesutilizadasinfluyeenlaformadeformadeladistribucindefrecuenciasde
lavariable.EnestecasocorrespondealavariablepesoyparaN=324,lacantidadcorrectadeclasessera9,elgrficoinferiorizquierdo.
Una posibilidad para visualizar mejor la forma de una distribucin es trazar una lnea usando como
coordenadas de los puntos, las marcas de clase y los valores de frecuencias correspondientes (Figura 20).

Esta lnea
distribucin
Unimodales
clasemsfr
la cual hab
probableme
Bimodales:
msfrecuen
Parmetr
Vimos ante
observacion
trabajarcon
Acontinuac
estudiadas.
de datos p
letras grieg
simbolizanc
Cuando tra
estadsticos
insesgados
sesgoyaum
Reflejemos
los adolesc
poblacin d
estadstico
Qutipos
Curso de
se denomin
n.Dosdelas
s: Se identif
recuenteque
blaremos mu
entenormal
Seidentifica
nte(unatalv
rovs. Esta
eriormente
nesentodas
nunamuest
cinveremo
Entreestos
rovenientes
as), mientra
conletraslat
abajamos co
sseanbueno
y por lo tan
mentarlaexa
estosconce
centes, habr
definida. Mie
queserun
deestadsti
e Estadstica y D
na polgono
formasms
fican por qu
elasrestant
ucho ms ad
.
anporquee
vezmsque
Figura
adsticos.
que en al
slasunidade
radelapobl
scmocalcu
valoresest
de toda la
as que si son
tinas).
on muestras
osestimador
nto lo ms c
actituddeles
eptosenune
emos calcul
entras que s
buenestima
cosexisten?
Diseo de Expe
de frecuen
comunesde
e el polgon
es.Entreest
delante. La d
elpolgonod
laotra)que
22:Dosformasd
lgunas ocas
esexperimen
lacin.
ularciertosv
nlamedia,
poblacin a
n calculados
s y no cono
resdelospa
cercanos al
stimador.
ejemplo:Sic
ado un par
i calculamos
adordelpar
?
erimentos 20
ncias y sirve
edistribucion
no de frecue
tasdistribuci
distribucin
defrecuencia
elasrestante
dedistribuciones

siones, una
ntales(censo
valoresque
lavarianza,
estos valor
a partir de
ocemos los
armetros.P
verdadero v
calculamosla
metro ya q
s la altura pr
metro,siem
009 - Docente:
e justament
nesdefrecu
encias muest
ionesestla
de las altur
asmuestrac
es.
sdefrecuenciasb
vez defini
o).Peroenla
describeny
lamoda,etc
res se los lla
una muestr
parmetros
orbuenoes
valor. Un bu
aalturaprom
que utilizam
romedio a pa
mpreycuand
Lic. Pablo Adr
e para rem
enciassonla
tra claramen
distribucin
ras es claram
claramentela

bsicas.
da la pobl
amayorade
daninforma
c.Enelcaso
ama parme
ra, se los de
s poblaciona
timadoresn
en muestreo
medioapart
mos la totali
artir de una
dolamuestra
rin Otero
marcar la for
as(Figura22
nte la prese
nnormaloG
mente unim
apresencia
acin, pode
eloscasoss
acinsobre
oquesecalc
etros (se sim
nomina esta
ales deseam
osreferimos
o permitir
irdelosN=3
dad de los
muestra, te
aseareprese
Pgina | 17
rma de una
):
ncia de una
Gaussianade
modal y muy
dedosclase
emos hacer
lopodemos
lasvariables
ulenapartir
mbolizan con
adsticos (se
mos que los
saquesean
disminuir el
324datosde
datos de la
ndremos un
entativa.
7
a
a
e
y
e
r
s
s
r
n
e
s
n
l
e
a
n
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 18

EstadsticodePosicin:Sonlosestadsticosquedividenalconjuntode datosengrupos. Porejemplo:


percentilesycuartiles.
Estadstico de centralizacin o tendencia central: Son los valores respecto a los cuales los restantes
tiendenaagruparse.Porejemplo:media,medianaymoda.
Estadstico de dispersin: Son los estadsticos que muestran cun dispersos estn los datos alrededor
delamedidacentral.Porejemplo:desviacintpica,coeficientedevariacin,rangoyvarianza.
Estadsticodeforma:Sonlosquemuestransiexisteasimetraoapuntamientoenladistribucindelos
datos.

Estadsticosdeposicin:
Percentiles: Elpercentil deordenkeslaobservacinquedejapordebajoelk%delapoblacin.Laforma
ms comn de calcular los percentiles es mediante el uso de programas de anlisis estadsticos, pero
veremos una forma aproximada de hacerlo usando un grfico especial: un histograma de frecuencia o
porcentajesacumulados.
En la tabla de frecuencias para las distintas clases de alturas (ver ms arriba) calculamos los porcentajes
acumulados. Si graficamos estos valores en funcin de los intervalos o clases, obtendremos el siguiente
grfico(Figura23):

Figura23:Elhistogramadefrecuenciasoporcentajesacumuladospermiteentreotrascosascalcularaproximadamentelospercentilos.
ClaramentesevecomolasfrecuenciassevansumandohastallegaralvalordeNenlaltimaclase.Lalnea
negradelgrficoeselpolgonodefrecuenciasacumuladasysetrazausandocomopuntoslosmximosde
cada intervalo y los valores de porcentajes acumulados (notar que en este caso no se usa la marca de
clase). Si dejamos slo el polgono de frecuencias acumuladas, el grafico se ver de la siguiente forma
(Figura24):
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 19

Figura24:Elpolgonodefrecuenciasoporcentajesacumuladosseobtienealtrazarunalneaentrepuntoscuyascoordenadassonlosvaloresde
frecuenciasacumuladas(o%)yelmximodecadaclase.
SideseamosconocerelP
40
opercentil
40
,esdecirelvalorqueacumulael40%delasobservaciones,slode
vemos extrapolar una lnea desde 40% hasta el polgono y de ah al eje horizontal. El valor obtenido es
aproximadoyaqueutilizunmtodogrfico.
Lospercentilosqueserepartenel100%encuatroporcionessellamancuartiles(Q)ysontres:
Cuortil incrior = 1= P
25

2 = P
50
Cuortil supcrior = S = P
75
Lospercentilesquerepartenel100%endiezporcionessellamandeciles(D)ysonnueve:
D1=P
10
,D2=P
20
..D9=P
90

El recorrido o rango intercuartil (Figura 25) es la diferencia entre el tercer (Q3) y primer cuartil (Q1),
mientras que el recorrido interdecil es la diferencia entre el noveno decil (D9) y el primer decil (D1).
Cualquiera de estos dos valores posee la ventaja que no se ven afectados por la presencia de datos
extremos,peroladesventajaquedesestimanelrestodelosvaloresensuclculo.

Figura25:Conlasdoslneasnegrassemarcanlasposicionesdelprimerytercercuartil.Entreestosvaloresseencuentranel50%delas
observaciones.Ladistanciaentreelloseselrecorridoorangointercuartil.
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 20

Estadsticosdecentralizacinotendenciacentral:
Lasmedidasdetendenciamsusadassonlamedia,lamodaylamediana.Existenotrasqueseaplicanslo
encasosparticularesyquesepuedenconsultarenfuentesbibliogrficas.
Comenzaremosconlamediana(M
ed
), yaqueenrealidadsetratadeunpercentil; elP
50
.Sirecordamosla
definicin de percentil, la mediana es la observacin que divide al conjunto de valores en dos partes
iguales.
Porejemplo,sielconjuntodedatosfuera:
{2.33.24.85.62.34.56.5}
Siordenamoslosdatos,veremosque4.5eselvalorquedividealconjuntodedatosendospartes:
{2.32.33.24.54.85.66.5}
Sinesimpar,lamedianaeslaobservacinquequedaenelmediounavezquelasobservacionesfueron
ordenadas.Esdecir:
H
cd
= x
|[
n
2
+1]

Sinespar,noexisteestaobservacincentral,sinoquehaydos,enestecasolamedianaeslamediaentre
estasdosobservaciones.
Paralosdatosdealturalamedianalapodemoscalculardeformagrficausandoelgraficodefrecuenciaso
porcentajesacumulados(Figura24),talcomosehaceconcualquierpercentil,peroenestecasopartiendo
delvalor50%.Sepuedeverquelamedianaestacercanaalamarcadeclasedelaclase5,esdecircercade
166.5cm.
Sideseamoscalcularlamedianadeformaanalticapodemosusarlasiguientefrmula:
H
cd
= I +b
]
]

Donde:
L:esellmiteinferiordelaclasequecontienealamediana.Estosepuedeaveriguarmedianteinspeccin
delatabladefrecuenciasporclases.
h:anchodelaclase.
f:frecuenciadeesaclase.
j:eselnmerodedatosenestaclaseparallegaraN/2.
Apliqumosloanuestrosdatos.
Alfinaldelaclase4seacumulael37.65%delasobservaciones,mientrasquealfinaldelaclase5se
acumulael65.74%deloscasos,esdecirquelamedianaestdentrodelaclase5,porlotantoL=163.67y
f=91.Elvalordehyaloconocemos(h:5.667).Elvalordejsecalculadelasiguienteforma:sihastalaclase
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 21

cuatrohayacumuladas122observaciones,parallegaralamitaddeN(324/2=166)haranfalta44,porlo
tantoj=44.
Serealizamoselclculo,lamedianaes:166.41cm.
La mediana posee como caractersticas principal el hecho de que no da informacin alguna sobre la
variabilidad de los datos. Dos muestras semejantes excepto en sus valores extremos tendrn las misma
mediana.Esto,queaprioripareceunadesventaja,enalgunoscasosesmuytil.
Parademostrarestofcilmente,calculemoslamedianadeestosdosconjuntosdedatos:
A={2,40,50,50y60}
B={40,40,50,50y160}
Ntesequeladiferenciasloestenelvalor2delconjuntoAy160delB,queesbastantemsbajoyms
alto,respectivamente(seranvaloresextremos),sinembargolamedianaparaamosconjuntoses50.
Otra ventaja de la mediana es que es la alternativa a usar con variables discretas ya que el valor siempre
serunentero.Porejemplo,silavariableesnmerodehijos,elpromediopuedadarunnmerodecimal
(quenotendrasentidotratndosedehijos)mientrasquelamedianaseraunnmeroentero.

Continuemos con la moda (M


od
). La moda es definida como el valor ms frecuente. En caso de variables
discretasuordinalesesmuysencillosaberlamoda.Porejemploenelcasodelacantidaddehermanos,la
moda es 1 hermano, ya que 166 alumnos poseen un solo hermano (Figura 17). En el caso de variables
continuas,lamodaeslamarcadeclasedelaclaseconmayorfrecuencia.
Lamodacomocaractersticaprincipalposeeelhechodequeesmuysencilladecalcularyporsobretodo
queenalgunoscasospuedenosernica.Veamoselsiguientegrfico(Figura26):

Figura26:Incidenciadetuberculosisporclasesdeedad.Claramentesetratadeunadistribucinbimodalylaspersonasmsafectadassonlos
adultosjvenesylaspersonasdemsde65aos.
Seclaramentequeexistendosclasesconmayorfrecuenciaqueelresto;lasclases4y8.

Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 22

Por ltimo, abordaremos al estadstico que todos calculamos alguna vez: la media aritmtica (el
promedio). A partir de ahora lo llamaremos simplemente media, pero sepa el lector que existen otras
medias, por ejemplo la geomtrica, la harmnica, etc., que no trataremos en este curso, ya que son de
usomuylimitado.
X

= mcJio
La media de una muestra se simboliza con una x debajo de una barra (ver frmula) y es el estadstico de
tendenciacentralquemejorestima(conmenossesgo)alamediapoblacional(quesesimbolizaconlaletra
(seleemu)).
Para calcular la media de una poblacin o de una muestra sumamos todos los valores y dividimos el
resultadoporelnmerodedatos(tamaodelamuestraodelapoblacin).
Escritoformalmenteconellenguajeestadsticosera:
X

= (x

)n
n
=1

Dondex
i
escadaunadelasobservacionesdesdei=0hastai=n,n=tamaodelamuestra(encasodeserla
poblacinseraN).
Silosdatosestnagrupadosenclases,lafrmulaparacalcularlamediaes:
X

= (F

. xc

)n
n
=1

DondeF
i
eslafrecuenciadelaclasei,xc
i
eslamarcadeclasedelaclaseiyneseltamaodelamuestra(en
casodeserlapoblacinseraN).
La media aritmtica como medida de tendencia central posee algunos problemas, el principal es que es
muy sensible a los valores extremos. Para demostrar esto fcilmente, calculemos la media aritmtica de
estosdosconjuntosdedatos:
A={2,40,50,50y60}
B={40,40,50,50y60}
Ntese que la diferencia slo est en el valor 2 del conjunto A que es bastante ms bajo (sera un valor
extremo).LamediaaritmticaparaAes:41,mientrasqueparaBes48.
Para nuestro conjunto de datos de ejemplo y en particular para la variable altura, los estadsticos de
tendencia central resultaron ser: Media: 166.2, mediana: 166.41 y moda: 166.50. Si ubicamos estos
estadsticoselhistogramadefrecuenciasveremoslosiguiente(Figura27):
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 23

Figura27:Ubicacindelasmedidasdetendenciacentralenelhistogramadefrecuencias.Comoseveenlasdistribucionesunimodalesysimtricas
lastresmediadasestncercanasunasdeotras.

Estadsticosdedispersin:
La medida ms sencilla de medir la dispersin es el rango o la amplitud. Es lo que calculamos
anteriormentecomorecorridomuestral,esdeciresladiferenciaentreelmximoyelmnimo.
Este estimador tiene como ventaja que muy sencillo de calcular y que el resultado posee las mismas
unidadesquelasmedidas(porejemplo:51cmenelcasodelasalturas).Lomaloesqueestmuyinfluido
por los extremos y desestima todos los otros datos. A diferencia de otras medidas de dispersin que
disminuyenaltomarmsdatos,elrangocuantosmsdatossetomen,mayorseryaquenuncadisminuye
(alosumoquedaigual).
Otra posible medida de dispersin seria sumar las diferencias entre todos los valores y la media Esto en
escrituraestadsticaseradelasiguienteforma:
(x -x

)
Estocalculadoparalosvaloresdexmayoresquelamediadarnegativo,yparalosmenoresdarpositivo.
Sucede que al sumar estas diferencias entre si se cancelan los positivos y negativos y resulta ser siempre
cero.
u = (x - x

Porlotantonosirvecomomedidadedispersin,yaqueparacualquierconjuntodedatosdalomismo.
Una posibilidad es calcular estas diferencias y transformarlas en valores absolutos mediante la funcin
mdulo;deestaformasedesestimaelsigno.Lafrmulasera:
Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 24

m = |x - x

El valor Dm se denomina desviacin media. Posee la ventaja que sus unidades son similares a la de los
valores, pero es difcil de calcular y la mayora de los programas estadsticos no lo calculan por los
problemasquetraelafuncinmdulo.
Otra posibilidad para que no se cancelen los valores de diferencia positivos y negativos es elevar al
cuadradolasdiferencias.Comoyasabemoscualquiernmeroelevadoalcuadradoespositivo.
Lafrmuladelasdiferenciasalcuadrado(tambinllamadosumadecuadradosoSC)sera:
SC = (x -x

)
2

SidividimoslaSCporeltamaodelapoblacin(N),obtenemoslavarianza(o
2
):
o
2
=
(x - x

)
2
N

Siestamostrabajandocontodalapoblacinestadsticaesfactibleutilizarlafrmulaanterior,perosi
estamoscalculandolavarianzaapartirdeunamuestra,elestimadorsedenominaS
2
ylafrmulaesla
siguiente:
S
2
=
(x -x

)
2
n - 1

Eldenominadoresn1ydeestaformaS
2
esunestimadorinsesgadodeo
2

Comosepuedeapreciarlasunidadesdelavarianzasonlasmismasqueladelasmedidasperoalcuadrado,
si se calcula la raz cuadra de S
2
, se obtiene lo que se denomina desviacin estndar (s) (a veces tambin
llamadadesviacintpica):
s =

S
2

La desviacin estndar posee como ventaja respecto a la varianza que posee las mismas unidades que las
mediciones.
Cuando calculamos la varianza utilizando calculadoras redondeamos datos y la frmula anterior para la
varianzaproduceerrores(ymsanalcalculars).Entalescasosconvieneusarlasiguientefrmula:
S
2
=
(x

2
-
(x

)
2
n
]
n - 1

Curso de Estadstica y Diseo de Experimentos 2009 - Docente: Lic. Pablo Adrin Otero

Pgina | 25

Supongamosquedeseamoscalcularlavarianzayladesviacinestndarparaunamuestradediezalturas
delosadolescentes:

Alturas
(cm)
X
i
x
2
(xx )
2

1 151 22801
161.3
2 170 28900
39.7
3 170 28900
39.7
4 152 23104
136.9
5 168 28224
18.5
6 165 27225
1.7
7 174 30276
106.1
8 157 24649
44.9
9 166 27556
5.3
1473 241635.00 554.1
x 163.7 [x

2
2169729

1
S
2
=
(x

2
-
(x

)
2
n
]
n - 1

S
2
=
(2416SS -
2169729
9

8

S
2
=69.25
cm
2
s=8.32cm
2
S
2
=
(x - x

)
2
n - 1

S
2
=
SS4.1
8

65.27cm
2
s=8.07cm

Los valores obtenidos son parecidos pero no iguales (se nota ms en comparando los valores de s). Para
usar la frmula de la fila 2, hay que primero calcular la media y redondear el valor. Luego restarle a cada
observacinelvalordelamedia(yaredondeado).Estoproduceunasecuenciasderedondeos,encadauno
deloscuales,seagregaunpequeoerror.

Comoltimamedidaveremoselcoeficientedevariacin(CV):

Laideadee
lamediarep
Dadoquela
noposeeun
Qu utilid
medidas do
culdelasd
Losdatosd
No tendra
centmetros
muestracla

Estadsticos
Asimetra:
Una distribu
En este tipo
decir que la
queseraig
Ladistribuc
Esmuyusa
muchasoca
estaforma
Figura28:Distr
Curso de
estecoeficie
presentael1
adesviacin
nidadesyal
ad tiene est
os variables
dosvariables
emediayde
sentido co
s y la otra
aramentequ
sdeforma:
ucin de fre
o de distribu
a media es s
ualalamod
cinquesem
daenestad
asiones.Laim
dedistribuci
ribucinnormalo
e Estadstica y D
nteescalcu
100%,Cun
estndaryl
multiplicarlo
ta estadstic
diferentes, c
sposeems
esviacinest
Variable
Altura
Peso
omparar las
representa
eentrelosa
cuencias es
uciones la ca
similar a la m
da.
muestraenla
sticayaqu
mportanciad
in.Laforma
oGaussiana.Com
Diseo de Expe
larcuntode
ntorepresen
lamediapos
opor100res
co? Suponga
como en el
variacin.
tndarparae
Media
166.23cm
57.30kg
desviacione
kilogramos.
adolescentes
simtrica cu
antidad de o
mediana. Ad
afigura28e
slolapres
deestadistr
adeladistrib
momuestraeldib
erimentos 20
elamediare
taras?Seca
seenlasmism
sultaunporc
amos que pa
caso de los
estasdosvar
Desviaci
m 8.8
10.
es estndar
Pero el val
shaymsvar
uando la me
observacione
ems la me
sconocidac
entaremosp
ribucinesq
bucinnorm
bujoesunadistrib
().
009 - Docente:
epresentala
alculasegn

masunidade
centaje.
ara las mism
adolescente
riables(N=3
nestndar
84cm
95kg
de las dos
or de CV es
riacinenel
dia divide al
es antes y d
dia sera tam
comodistribu
peroserno
quemuchos
malsedenom
bucinunimodal
Lic. Pablo Adr
desviacin
:
esystasse
mas unidade
es el peso y
324)son:
CV
5.32%
19.10%
variables, y
s independi
pesoqueen
l grfico en
despus de l
mbin el valo
ucinnorma
ombradayut
procesosyf
minacampan
yperfectamente
rin Otero
estndar.Es
cancelan,po
s experimen
la altura; y
ya que una
ente de las
nlaaltura.
dos porcione
a media son
or ms frecu
al,deGausso
tilizadams
enmenosr
adeGauss.

esimtricaalrede
Pgina | 26
decirquesi
orloqueCV
ntales tengo
deseo saber
representa
unidades y
es similares.
n iguales, es
uente por lo
oGaussiana.
adelanteen
ealessiguen
edordelamedia
6
i
V
o
r
a
y
.
s
o
.
n
n

Algunaspro
lafo
lam
50%
ene
2,
dist
incl
Quocurr
coinciden.
distribucin
tiende a es
mayorfrecu
El coeficien
clculoam
deanlisise
Si
Si
Si

Apuntamie
El apuntam
distribucion
(leptocrtic
Figura30:Lad
Curso de
opiedadesde
ormaesperf
mediaesigua
%delosdato
elintervalo[
+ 2] se e
tribucin. Cu
uidoenelin
eenlasdist
Esto ocurre
n),mientrasq
star ms cerc
uenciaylam
F
nte de asime
anodeeste
estadstico.L

1
=0(simt
1
>0(asimt
1
<0(asimt
ntoocurtos
miento o cu
nes son m
cas)(Figura3
distribucindela
e Estadstica y D
eestadistrib
fectamentes
alalamoda
os.
[,+]
encuentra e
uando en es
ntervalo[
ribucionesa
e porque la
quelamedia
ca de la cola
mediananom
igura29:Lasdos
etra de Fish
valorestedi
Loimportant
trica).
tricapositiva
tricanegativ
sis:
rtosis de un
s bajas que
30).
aizquierdaesta
Diseo de Expe
bucinson:
simtrica.
yalamedia
seencuentr
l 95,44% y e
stadstica se
,+].
simtricas?
a media se
anano.Enla
a alargada,
modificasup
posibilidadesde
her, represe
iosoynotie
telainforma
aoaladerec
aoalaizqui
na distribuci
e la norma
chatadaconresp
erimentos 20
ana.Antesy
ranel68,26%
en el interva
habla de u
Enestetipo
ve afectad
asiguientefig
mientras qu
posicin.
ecurvasunimoda
ntado por
nesentidoin
acinquepro
cha).
ierda).
in hace re
l (se las de
pectoalanormal
alto.
009 - Docente:
despusde
%delosvalo
alo [ 3,
un valor nor
dedistribuc
a por los v
gura(Figura
e la moda p
lesasimtricas(F
1
, determina
ntentarloya
ovee:
eferencia a
enomina pla
(ladelmedio),m
Lic. Pablo Adr
cualquierad
res,mientra
+ 3] se en
rmal se hace
cioneslame
valores extr
29)sevecla
por el contra
Fuente:Wikipedia
a la simetra
quelocalcu
la altura de
aticrticas)
mientrasquelad
rin Otero
deestosvalo
squeeneli
cuentra el 9
e referencia
dia,mediana
remos (las
aramenteco
ario tiende a
a).
a de una dis
ulantodoslo
el pico cent
y otras son
eladerechapose
Pgina | 27
oresestnel
ntervalo[
99,74% de la
a que est
aymodano
colas de la
molamedia
a la zona de

tribucin. El
sprogramas
ral. Algunas
n ms altas
eeunpicoms
7
l

o
a
a
e
l
s
s
s

Elcoeficien
manera qu
intentarloy
provee:
Si
Si
Si

Algunascon
Elc
mis
vim
Par
ning
ym
Deb
un
Si lo
mu
valo
El presente doc
2.5 Argentina (
presente docum

Curso de
ntedecurtos
e con el coe
yaquelocal

2
=0(norm
2
>0(leptoc
2
<0(platic
nsideracione
clculodeun
smo y nico
mosquepued
a calcularlo
gunadeello
mnimo)ydes
beserfcild
buenestads
os estadstic
estra. De no
oresmuydif
cumento est pro
para ms detalle
mento slo con fin
e Estadstica y D
sisdeFisher,
eficiente ant
culantodos
mal).
rticasoen
rticasoacha
esfinalesace
nestadstico
valor. Esto o
dehaberm
se debe uti
osdeantema
scartaelrest
decalculary
sticoyaesca
cos se calcul
o ser as, en
erentes.
tegido bajo una l
es: http://creativec
nes educativos y
Diseo de Expe
,representad
terior, el c
losprogram
pico).
atada).
ercadeloses
nodebeser
ocurre con l
sdeuna.
lizar la may
ano.Porejem
to;mientras
demanipula
alculadomed
lan a partir
n diferentes
icencia Creative
commons.org/lice
no comerciales.
erimentos 20
dopor
2
,de
lculo a man
masdeanlis
stadsticos.
rambiguo,si
a media y la
or cantidad
mplo,elreco
queparacal
armatemtic
diantelafun
de muestra
muestras d
Commons Atrib
enses/by-nc-nd/2
Citar la fuente (v
009 - Docente:
eterminalac
no de este v
sisestadstico
iserealizae
a varianza, p
de datos de
orridomuest
lcularlamed
camente.Po
cinmdulo
s, sera dese
de una mism
bucin-No Comer
2.5/ar/). El autor a
ver cita sugerida)
Lic. Pablo Adr
curtosisdeu
valor es ted
o.Loimport
lclculosed
pero no ocur
e la muestra
tralutilizas
diaolavaria
orejemplola
oquenoesd
eable que va
ma poblacin
rcial-Sin Obras D
autoriza el uso de
).
rin Otero
nadistribuci
ioso y no ti
tantelainfor
debeobtene
rre con la m
a posible y n
lodosvalor
nzaseutiliza
adesviacin
derivable.
are poco de
n el estadst
Derivadas
el
Pgina | 28
in.Deigual
ene sentido
rmacinque
ersiempreel
moda, que ya
no descartar
res(mximo
antodos.
medianoes
e muestra a
tico tomara

8
l
o
e
l
a
r
o
s
a
a

Você também pode gostar