Unidad I .Tema 1 Conceptos Básicos
1.1
Fundamentos Básicos de la Estadística
La Estadística se ocupa de los métodos
científicos para recolectar, organizar, resumir, presentar y analizar los
datos, así como sacar conclusiones válidas y tomar decisiones con base en este
análisis.
La estadística es una herramienta muy
útil para la toma de decisiones, y a su vez resolver problemas, bien sea: tasas
tributarias, programas sociales, control de calidad, minimización de costos,
investigación y mercadeo, oportunidades de inversión entre otros.
La
Estadística se divide en dos ramas: Descriptiva e Inferencial
Estadística Descriptiva:
Recolecta, agrupa y presenta datos.
|
Estadística Inferencial:
Utilización de una muestra para
sacar alguna inferencia o
conclusión sobre
la
Población, se utiliza el lenguaje de la probabilidad
|
Distribución de frecuencias
Medidas de tendencia central
Medidas de dispersión
Probabilidad
Distribución de probabilidad
|
Distribuciones muestrales
Intervalos de confianza
Prueba de hipótesis
Análisis de varianza
Análisis de regresión y correlación
Estadística no paramétrica
Series de tiempo
Números índices
Control de Calidad
|
Actividad: Los alumnos
identificaran cuales temas serán dados en el presente curso. Para ello
deberán revisar el programa de la materia y analizar su contenido.
1.2
Vocabulario Estadístico (Conceptos Básicos)
AMPLITUD O RANGO
La diferencia entre el valor máximo y
mínimo de los valores de una variable. En la amplitud de una variable se
encuentran comprendidos el 100% de los valores muestrales
CARACTERÍSTICAS
Propiedades de las unidades o
elementos que componen las muestras. Se miden mediante variables. Se asume que
los individuos presentan diferentes características.
CAUSALIDAD
Relación entre causa y efecto.
Generalmente identificadas como variables. No hay que confundir causalidad con
correlación. La correlación mide la similitud estructural numérica entre dos
variables. Normalmente la existencia de correlación es condición necesaria para
la causalidad.
CENSO:
Se entiende por censo aquella numeración que se efectúa a todos y cada uno de
los caracteres componentes de una población. Para Levin & Rubin (1996)
"Algunas veces es posible y práctico examinar a cada persona o elemento de
la población que deseamos describir. A esto lo llamamos una numeración completa
o censo. Utilizamos la muestra cuando no es posible contar o medir todos los
elementos de la población. Si es posible listar (o enumerar) y observar cada
elemento de la población, los censos se utilizan rara vez porque a menudo su
compilación es bastante difícil, consume mucho tiempo por lo que resulta
demasiado costoso. Decimos que realizamos un censo cuando se observan todos los
elementos de la población estadística
COEFICIENTE DE CORRELACIÓN:
Estadístico que cuantifica la correlación. Sus
valores están comprendidos entre -1 y 1
COEFICIENTE DE DETERMINACIÓN Es el
cuadrado del coeficiente de correlación. Expresado en tanto por ciento mide el
grado de información compartida entre dos variables continuas
COEFICIENTE DE VARIACIÓN
Es una
medida de dispersión relativa. No tiene unidades y se calcula dividiendo la
cuasi-desviación típica entre la media muestral. Se suele expresar en tanto por
ciento
COEFICIENTES DE REGRESIÓN
En un modelo de regresión lineal son
los valores de a y b que determinan la expresión de la recta de regresión y=a +
b·x
CONTRASTE DE HIPÓTESIS
Es el proceso estadístico que se sigue
para la toma de decisiones a partir de la información de la muestra. Comparando
el valor del estadístico experimental con le valor teórico rechazamos o no la
hipótesis nula
CORRELACIÓN
Expresa la concordancia entre dos variables según el sentido de la relación de
estas en términos de aumento ó disminución
COVARIANZA
Representa la media del producto de las
desviaciones de dos variables en relación a su media.
CUARTILES
Existen tres
cuartiles: Q!, Q2 y Q3. Estos números dividen a los valores muestrales , una
vez ordenados, en cuatro partes homogéneas en cuanto a número de observaciones.
Así Q1 determina el valor que hace que haya un 25% de valores muestrales por
debajo de éste, y un 75% por encima de éste. Q2 es la mediana
DATO:
Valor numérico de una variable. Cualquier
expresión numérica que señala la magnitud de un fenómeno, ya sea en
su intensidad o en la frecuencia con que se produce. Son los valores
cualitativos o cuantitativos mediante los cuales se miden las
características de los objetos, sucesos o fenómenos a estudiar.
DECILES
Corresponden a los percentiles 10%,
20%, 30%, 40%, 50%, 60%, 70%, 80% , 90% y 100%
DESCRIPTIVA
Parte de la estadística que resume la
información de la muestra. La información recogida y resumida en los
estadísticos se usa para la estimación de parámetros poblacionales
DESVIACIÓN ESTANDAR (TÍPICA)
Característica de una muestra o población que
cuantifica su dispersión o variabilidad. Tiene las mismas unidades que la
variable. la desviación típica es invariante con respecto al origen de la
distribución. Su cuadrado es la varianza
DIAGRAMA DE PUNTOS (Grafico de
Dispersión) ES un gráfico
bidimensional o tridimensional que muestra la variación de los valores
muestrales de dos o tres variables.
DIAGRAMAS DE BARRAS:
Representación gráfica tipo columnas
para las variables discretas
DIMENSIÓN
Si estudiamos una
única variable la dimensión es uno, si estudiamos la información de dos
variables en forma conjunta la dimensión es dos,.y asi sucesivamente.
DISPERSIÓN:
Ver estadísticos de dispersión
DISTRIBUCIÓN DE DATOS
En la realización de un experimento,
corresponde a la recogida de los datos experimentales para cada individuo y
cada variable
DISTRIBUCIÓN NORMAL (CAMPANA DE GAUSS)
Es una
distribución teórica de probabilidad que se usa tanto en la estadística
aplicada como en la teórica. Aparece en la práctica con mucha frecuencia como
consecuencia del importante resultado que establece el teorema central del
límite. Tiene una forma en forma de campana, y viene caracterizada por
únicamente dos valores: la media y la varianza.
DISTRIBUCIÓN T STUDENT
Distribución teórica de probabilidad. Se usa
para la comparación de dos medias en poblaciones independientes y normales
ECUACIÓN DE LA REGRESIÓN
Ver recta de regresión
ENCUESTA
Se entiende por encuesta las
observaciones realizadas por muestreo, es decir son observaciones parciales. El
diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa
de que si queremos conocer algo sobre el comportamiento de las personas, lo
mejor, más directo y simple es preguntárselo directamente a ellas. (Cadenas,
1974).Según Antonio Napolitano "La encuesta, es un método mediante el cual
se quiere averiguar. Se efectúa a través de cuestionarios verbales o escritos
que son aplicados a un gran número de personas".
ESCALA DE MEDICION
Es una sucesión de medidas que permite
organizar datos en orden jerárquico. Las escalas de Medición son clasificadas
de acuerdo a una degradación de las características de las variables. Estas
escalas son; Nominales, Ordinales, Intervalares o de Razón. Según pasa de una
escala a otra el atributo o la cualidad aumenta.
ESCALA DE RAZÓN
Estas variables nombran, orden,
presentan intervalos iguales y el cero significa ausencia de la característica.
Por ejemplo; el ingreso; el cero representaría que no recibe ingreso en virtud
de un trabajo, la velocidad; el cero significa ausencia de movimiento. En otras
palabras, la escala de razón comienza desde el cero y aumenta en números
sucesivos iguales a cantidades del atributo que esta siendo medido.
ESCALA INTERVALAR
Estas variables nombran, ordenan y
presentan igualdad de magnitud. En estas variables el cero no significa
ausencia de valor y existe una unidad de igualdad entre los valores. Como por
ejemplo; la temperatura, las puntuaciones de una prueba, la escala de
actitudes, las puntuaciones de IQ, entre otros.
ESCALA NOMINAL
Esta escala comprende variables
categóricas que se identifican por atributos o cualidades. Las variables de
este tipo nombran e identifican distintas categorías sin seguir un orden. El
concepto nominal sugiere su uso que es etiquetar o nombrar. El uso de un número
es para identificar. Un número no tiene mayor valor que otro. Ejemplo los
números de las camisetas de los jugadores de un equipo de béisbol. El número
mayor no significa que tiene el mayor atributo que el número menor, es
aleatorio o de capricho personal a quien otorga el número. Algunas de estas
variables son: el número de seguro social, el sexo, los números de teléfono,
entre otros.
ESCALA ORDINAL
Las variables de este tipo además
de nombrar se considera el asignar un orden a los datos. Esto implica que un
número de mayor cantidad tiene un más alto grado de atributo medido en
comparación con un número menor, pero la diferencia entre rangos pueden no ser
iguales. Por ejemplo; el nivel socioeconómico, orden de llegada de los
corredores, entre otros.
ESTADÍSTICA
La estadística es comúnmente
considerada como una colección de hechos numéricos expresados en términos de
una relación sumisa, y que han sido recopilado a partir de otros datos
numéricos. Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley,
1980) definen la estadística como un valor resumido, calculado, como base en
una muestra de observaciones que generalmente, aunque no por necesidad, se
considera como una estimación de parámetro de determinada población; es decir,
una función de valores de muestra.La estadística es una técnica especial apta
para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya
mediación requiere una masa de observaciones de otros fenómenos más simples
llamados individuales o particulares Murria R. Spiegel, (1991) dice: "La
estadística estudia los métodos científicos para recoger, organizar, resumir y
analizar datos, así como para sacar conclusiones válidas y tomar decisiones
razonables basadas en tal análisis. La estadística es la ciencia que trata de
la recolección, clasificación y presentación de los hechos sujetos a una
apreciación numérica como base a la explicación, descripción y comparación de
los fenómenos. Cualquiera sea el punto de vista, lo fundamental es la
importancia científica que tiene la estadística, debido al gran campo de
aplicación que posee.
ESTADÍSTICOS
Describe una muestra. Son funciones de la muestra.
Su valor variará según la muestra.
ESTADÍSTICOS DE CENTRALIZACIÓN
Son estadísticos que nos resumen la
información de la muestra dándonos información acerca del valor donde parece
concentrarse la distribución de datos. Ejemplo la media aritmética, la mediana,
media geométrica, media armónica entre otros.
ESTADÍSTICOS DE DISPERSIÓN
Son estadísticos que nos resumen la
información de la muestra dándonos información acerca de la magnitud del
alejamiento de la distribución de datos en relación a un valor central o de
concentración de los datos. Ejemplo la desviación típica, el coeficiente
de variación, la desviación intercuartílica entre otras.
ESTADÍSTICOS DE FORMA
Son aquellos que nos hablan de la forma
de la distribución de datos en cuanto a su simetría y su apuntamiento
ESTIMACIÓN
Técnicas estadísticas que a partir de
la información de la estadística descriptiva pretenden conocer cómo es la
población en global. Existen técnicas de estimación puntuales y por intervalos
de confianza
ESTIMADO
Valor experimental que se toma como
candidato al valor poblacional desconocido
ESTIMADOR
Función de la muestra que sirve para
dar valores candidatos a los valores desconocidos poblacionales.
FRECUENCIAS ABSOLUTAS
Las frecuencias absolutas representan
el recuento de los valores de una variable discreta de forma que su suma nos da
el tamaño muestral.
FRECUENCIAS RELATIVAS
Las relativas son las absolutas
divididas por el tamaño muestral .Las frecuencias relativas sumarán 1 ó 100
según se expresen en tanto por uno o en tanto por ciento
FUNCIÓN
Función matemática. Expresión que liga
dos o mas variables de forma determinística
GAUSSIANA
Ver distribución normal
GRADO DE CONFIANZA
Ver nivel de
confianza
HIPÓTESIS Cualquier teoría que
formule posibles líneas de trabajo experimental. Ver hipótesis nula y
alternativa
HIPOTESIS ALTERNATIVA
Aquella que queremos probar.
Representa la hipótesis renovadora
HIPOTESIS NULA Aquella que queremos
rechazar. Representa a la situación actual
HISTOGRAMAS Es
un gráfico en forma de barras de una variable continua que se ha discretizado
en intervalos, de forma que la altura de las barras en cada intervalo indica la
frecuencia relativa en éste.
IMPRECISION
Error que se comete en la predicción
INDEPENDENCIA
Son datos que no están ligados entre si
MAXIMO
Es un valor muestral de forma que por
encima de este no hay valores muestrales
MEDIA
Es una medida de centralización para
una variable continua. Se obtiene sumado todos los valores muestrales y
dividiendo por el tamaño muestral
MEDIANA
Corresponde al percentil 50%. Es decir,
la mediana hace que haya un 50% de valores muestrales inferiores a ella y un
50% de valores muestrales superiores a ella.
MEDICION
En general, se entiende por medición la
asignación de números a elementos u objetos para representar o cuantificar una
propiedad. El problema básico está dado por la asignación un numeral que
represente la magnitud de la característica que queremos medir y que dicho
números pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por
medio de la medición, los atributos de nuestras percepciones se transforman en
entidades conocidas y manejables llamadas "números". Es evidente que
el mundo resultaría caótico si no pudiéramos medir nada. En este caso cabría
preguntarse de que le serviría la físico saber que el hierro tiene una alta
temperatura de fusión.
MÍNIMO
Es un valor muestral de forma que por
debajo de este no hay valores muestrales
MODA
Es el valor que más se repite en una
variable nominal
MODELO
Intento matemático / estadístico para
explicar una variable respuesta por medio de una o más variables explicativas o
factores
MUESTRAS
Subgrupos de observaciones de la población de
estudio. Se llama muestra a una parte de la población a estudiar que
sirve para representarla". Murria R. Spiegel (1991).Una muestra es una
colección de algunos elementos de la población, pero no de todos. Una muestra
debe ser definida en base de la población determinada, y las conclusiones que
se obtengan de dicha muestra solo podrán referirse a la población en
referencia. Al recolectar datos que determinan las características de un
grupo de individuos u objetos, por ejemplo, las alturas y los pesos de los
estudiantes de una Universidad o la cantidad de piezas defectuosas y no
defectuosas producidas en una fábrica un día determinado, muchas veces es
imposible o impráctico observar a todo el grupo, especialmente si ésta es
grande. En lugar de examinar a todo el grupo, llamado población o universo,
se examina a una pequeña parte del grupo, a la que se llama muestra.
MUESTREO
Esto no es más que el procedimiento
empleado para obtener una o más muestras de una población; el muestreo es una
técnica que sirve para obtener una o más muestras de población.
PARÁMETROS
Describe una población. Son valores
desconocidos de características de una distribución teórica. El objetivo de la
estadística es estimarlos bien dando un valor concreto, bien dado un intervalo
confidencial
PERCENTILES
Un percentil 90% corresponde a un valor
que divide a la muestra en dos, de forma que hay un 90% de valores muestrales
inferiores a éste, y un 10% de valores muestrales superiores a éste. Los
percentiles 25%, 50%, 75% son el primer, segundo y tercer cuartil
respectivamente
POBLACIONES
Conjunto de individuos de interés.
Normalmente no se dispone de información de toda la población y se recurre a
muestras. Una población se precisa como un conjunto finito o infinito de
personas u objetos que presentan características comunes. Una población es un
conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones. Una población es un conjunto de elementos que
presentan una característica común
PORCENTAJES
Proporciones expresadas en tanto por
ciento
PROBABILIDAD
Asignación de un número entre cero y
uno a cada resultado experimental.
PROPORCION
Número de individuos que verifican una
condición entre el total del tamaño muestral. Se puede expresar en tanto por
uno o en tanto por cien. Es una razón en la cual los elementos del numerador
están incluidos en el denominador. Razón que indica la modificación de una
cantidad con respecto a otra y en la que el numerador forma parte del
denominador. Se utiliza como estimación de la probabilidad de un evento.
El rango es de 0 a 1 (o de 0 a 100%).
RANGO
Diferencia entre el valor máximo y
mínimo de un muestra o población. Solo es valido en variables continuas. Es una
mala traducción de ingles "range". Amplitud
RANGO INTERCUARTILICO
La diferencia entre el percentil 75% y
el percentil 25%
REGRESION
Técnica estadística que relaciona una
variable dependiente (y) con la información suministrada por otra variable
independiente (x).ambas variables deben ser continuas. Si asumimos relación
lineal, utilizaremos la regresión lineal simple.
REGRESIÓN LINEAL MÚLTIPLE
El modelo de regresión lineal múltiple
sirve para explicar una variable respuesta continua en términos de varios
factores o variables explicativas continuas
SECTORES CIRCULARES
Forma de representación en forma de
tarta de variables discretas nominales
SESGO
La diferencia entre el valor del
parámetro y su valor esperado. También se utiliza en contraposición de
aleatorio, así una muestra sesgada es no aleatoria
SIMETRIA
Es una medida que refleja si los
valores muestrales se extienden o no de igual forma a ambos lados de la media.
TAMAÑO MUESTRAL
Número de individuos u observaciones que
componen la muestra
TECNICAS DE CORRELACION pearson y
spearman
TECNICAS DE REGRESION
Ver recta de regresión y regresión lineal
múltiple
TEOREMA DEL LIMITE CENTRAL
Resultado básico en la estadística que
afirma que la distribución de las medias muestrales será normal para un n
suficientemente grande con independencia de la distribución de datos de partida
UNIDAD
Concepto primario relacionado con los
componentes elementales de la muestras estadísticas. Sinónimo, pero no
esencialmente idéntico, de caso , observación , registro o individuo
UNIVERSO
Conjunto infinito de elementos o
unidades generado por un modelo teórico. Conjunto real de todos los elemento
que comparten unas condiciones de admisión en el conjunto
VALORES NUMÉRICOS
Resultados de las variables para cada
individuo en la muestra de estudio. Su naturaleza puede ser nominal,
dicotómica, ordinal o continua
VARIABLE
Objeto matemático que puede tomar
diferentes valores. Generalmente asociado a propiedades o características de
las unidades de la muestra o población. Lo contrario de variable es
constante. Es una característica de la población y pueden ser:
a)Cualitativa: Las observaciones se expresan de manera no numérica b)
Cuantitativa: Puede expresarse numéricamente. b.1)
Continua: toma cualquier valor en un rango b.2) Discreta: está limitada a
ciertos valores.
VARIABLE ALEATORIA
Variable cuyo resultado varía según la
muestra según una distribución de probabilidad
VARIABLE CONTINUA
Aquella que puede tomar una infinidad
de valores, de forma que dados dos valores cualesquiera, también pueda tomar
cualquier valor entre dichos valores
VARIABLE DEPENDIENTE
Ver variable respuesta
VARIABLE DISCRETA
Variable que toma un número finito o
infinito de valores, de forma que no cubre todos los posibles valores numéricos
entre dos dados, en contraposición de las continuas
VARIABLE
EXPLICATIVA Ver variable
independiente
VARIABLE INDEPENDIENTES O EXPLICATIVAS
Variables que no sirven para construir
un modelo que explique el comportamiento de una o más variables respuesta
VARIABLE RESPUESTA O
DEPENDIENTE Variable objeto del estudio y que sus
resultados se pretenden explicar por medio de las variables llamadas
explicativas o independientes
VARIABLES
Describen características en las observaciones realizadas
VARIANZA Característica de una muestra
o población que cuantifica su dispersión o variabilidad. La varianza tiene
unidades al cuadrado de la variable. Su raíz cuadrada positiva es la desviación
típica. La varianza muestral es un estimador sesgado de la varianza poblacional
RAZÓN
Cociente entre dos números, en el que ninguno o sólo algunos elementos del
numerador están incluidos en el denominador. El rango es de 0 a infinito.
TASA Es un tipo especial de razón o de
proporción que incluye una medida de tiempo en el denominador. Está asociado
con la rapidez de cambio de un fenómeno por unidad de una variable (tiempo,
temperatura, presión). Los componentes de una tasa son el numerador, el
denominador, el tiempo específico en el que el hecho ocurre, y usualmente un
multiplicador, potencia de 10, que convierte una fracción o decimal en un
número entero. El rango es de 0 a infinito.
Actividad: Los alumnos
identificaran y analizaran cuales conceptos del vocabulario estarán
aplicando en el presente curso. Para ello revisaran el programa analítico de la
materia y estarán atentos a las orientaciones del docente.
1.3 Etapas en el Planteamiento de una
Investigación Estadística
Establecer objetivos: que tipo de
información se desea obtener, y establecer los objetivos para
recolectarla.
Propósito: se determina los tipos de
comparación que se necesitan, lo que permite identificar los datos que se deben
recoger.
Recolectar los datos
Organizar y presentar los datos
Analizarlos
Interpretarlos.
Actividad: Los alumnos construirán
un ejercicio basado en su trabajo o cualquier evento de la vida cotidiana para
aplicar las etapas de investigación señaladas y presentaran por escrito sus
ejercicios al resto de los compañeros.
Presentación de Resultados
Tabular:
a) Distribución de frecuencia:
Organizar datos de una variable
Comentarios
Publicar un comentario