Ir al contenido principal

Unidad I Conceptos Básicos

Unidad I .Tema 1 Conceptos Básicos 


1.1 Fundamentos Básicos de la Estadística

La Estadística se ocupa de los métodos científicos para recolectar, organizar, resumir, presentar y analizar los datos, así como sacar conclusiones válidas y tomar decisiones con base en este análisis.

La estadística es una herramienta muy útil para la toma de decisiones, y a su vez resolver problemas, bien sea: tasas tributarias, programas sociales, control de calidad, minimización de costos, investigación y mercadeo, oportunidades de inversión entre otros.


La Estadística se divide en dos ramas: Descriptiva e Inferencial

Estadística Descriptiva:
Recolecta, agrupa y presenta datos.
Estadística Inferencial:
Utilización de una muestra para sacar        alguna inferencia o conclusión sobre la            Población, se utiliza el lenguaje de  la probabilidad
Distribución de frecuencias
Medidas de tendencia central
Medidas de dispersión
Probabilidad
Distribución de probabilidad
Distribuciones muestrales
Intervalos de confianza
Prueba de hipótesis
Análisis de varianza
Análisis de regresión y correlación
Estadística no paramétrica
Series de tiempo
Números índices
Control de Calidad


Actividad: Los alumnos identificaran cuales temas serán dados en el presente curso.  Para ello deberán revisar el programa de la materia y analizar su contenido.


1.2 Vocabulario Estadístico  (Conceptos Básicos)



AMPLITUD  O  RANGO

La diferencia entre el valor máximo y mínimo de los valores de una variable. En la amplitud de una variable se encuentran comprendidos el 100% de los valores muestrales

CARACTERÍSTICAS          Propiedades de las unidades o elementos que componen las muestras. Se miden mediante variables. Se asume que los individuos presentan diferentes características.

CAUSALIDAD        Relación entre causa y efecto. Generalmente identificadas como variables. No hay que confundir causalidad con correlación. La correlación mide la similitud estructural numérica entre dos variables. Normalmente la existencia de correlación es condición necesaria para la causalidad.

CENSO:         Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres componentes de una población. Para Levin & Rubin (1996) "Algunas veces es posible y práctico examinar a cada persona o elemento de la población que deseamos describir. A esto lo llamamos una numeración completa o censo. Utilizamos la muestra cuando no es posible contar o medir todos los elementos de la población. Si es posible listar (o enumerar) y observar cada elemento de la población, los censos se utilizan rara vez porque a menudo su compilación es bastante difícil, consume mucho tiempo por lo que resulta demasiado costoso. Decimos que realizamos un censo cuando se observan todos los elementos de la población estadística


COEFICIENTE DE CORRELACIÓN:       Estadístico que cuantifica la correlación. Sus valores están comprendidos entre -1 y 1

COEFICIENTE DE DETERMINACIÓN Es el cuadrado del coeficiente de correlación. Expresado en tanto por ciento mide el grado de información compartida entre dos variables continuas
COEFICIENTE DE VARIACIÓN             Es una medida de dispersión relativa. No tiene unidades y se calcula dividiendo la cuasi-desviación típica entre la media muestral. Se suele expresar en tanto por ciento

COEFICIENTES DE REGRESIÓN          
En un modelo de regresión lineal son los valores de a y b que determinan la expresión de la recta de regresión y=a + b·x

CONTRASTE DE HIPÓTESIS      
Es el proceso estadístico que se sigue para la toma de decisiones a partir de la información de la muestra. Comparando el valor del estadístico experimental con le valor teórico rechazamos o no la hipótesis nula

CORRELACIÓN      Expresa la concordancia entre dos variables según el sentido de la relación de estas en términos de aumento ó disminución

COVARIANZA       
Representa la media del producto de las desviaciones de dos variables en relación a su media.

CUARTILES             Existen tres cuartiles: Q!, Q2 y Q3. Estos números dividen a los valores muestrales , una vez ordenados, en cuatro partes homogéneas en cuanto a número de observaciones. Así Q1 determina el valor que hace que haya un 25% de valores muestrales por debajo de éste, y un 75% por encima de éste. Q2 es la mediana

DATO:
Valor numérico de  una variable. Cualquier expresión numérica que señala la magnitud de un fenómeno, ya sea en su intensidad o en la frecuencia con que se produce. Son los valores cualitativos o cuantitativos mediante los cuales se miden las    características de los objetos, sucesos o fenómenos a estudiar.


DECILES
Corresponden a los percentiles 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% , 90% y 100%


DESCRIPTIVA
Parte de la estadística que resume la información de la muestra. La información recogida y resumida en los estadísticos se usa para la estimación de parámetros poblacionales

DESVIACIÓN ESTANDAR (TÍPICA)      Característica de una muestra o población que cuantifica su dispersión o variabilidad. Tiene las mismas unidades que la variable. la desviación típica es invariante con respecto al origen de la distribución. Su cuadrado es la varianza

DIAGRAMA DE PUNTOS (Grafico de Dispersión)         ES un gráfico bidimensional o tridimensional que muestra la variación de los valores muestrales de dos o tres variables.

DIAGRAMAS DE BARRAS:
Representación gráfica tipo columnas para las variables discretas

DIMENSIÓN            Si estudiamos una única variable la dimensión es uno, si estudiamos la información de dos variables en forma conjunta la dimensión es dos,.y asi sucesivamente.

DISPERSIÓN:          Ver estadísticos de dispersión
DISTRIBUCIÓN DE DATOS         En la realización de un experimento, corresponde a la recogida de los datos experimentales para cada individuo y cada variable

DISTRIBUCIÓN NORMAL (CAMPANA DE GAUSS)             Es una distribución teórica de probabilidad que se usa tanto en la estadística aplicada como en la teórica. Aparece en la práctica con mucha frecuencia como consecuencia del importante resultado que establece el teorema central del límite. Tiene una forma en forma de campana, y viene caracterizada por únicamente dos valores: la media y la varianza.

DISTRIBUCIÓN T STUDENT       Distribución teórica de probabilidad. Se usa para la comparación de dos medias en poblaciones independientes y normales

ECUACIÓN DE LA REGRESIÓN            Ver recta de regresión

ENCUESTA
Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, más directo y simple es preguntárselo directamente a ellas. (Cadenas, 1974).Según Antonio Napolitano "La encuesta, es un método mediante el cual se quiere averiguar. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a un gran número de personas".

ESCALA DE MEDICION
Es una sucesión de medidas que permite organizar datos en orden jerárquico. Las escalas de Medición son clasificadas de acuerdo a una degradación de las características de las variables. Estas escalas son; Nominales, Ordinales, Intervalares o de Razón. Según pasa de una escala a otra el atributo o la cualidad aumenta.

ESCALA DE RAZÓN
 Estas variables nombran, orden, presentan intervalos iguales y el cero significa ausencia de la característica. Por ejemplo; el ingreso; el cero representaría que no recibe ingreso en virtud de un trabajo, la velocidad; el cero significa ausencia de movimiento. En otras palabras, la escala de razón comienza desde el cero y aumenta en números sucesivos iguales a cantidades del atributo que esta siendo medido.

ESCALA INTERVALAR
Estas variables nombran, ordenan y presentan igualdad de magnitud. En estas variables el cero no significa ausencia de valor y existe una unidad de igualdad entre los valores. Como por ejemplo; la temperatura, las puntuaciones de una prueba, la escala de actitudes, las puntuaciones de IQ, entre otros.

ESCALA NOMINAL
 Esta escala comprende variables categóricas que se identifican por atributos o cualidades. Las variables de este tipo nombran e identifican distintas categorías sin seguir un orden. El concepto nominal sugiere su uso que es etiquetar o nombrar. El uso de un número es para identificar. Un número no tiene mayor valor que otro. Ejemplo los números de las camisetas de los jugadores de un equipo de béisbol. El número mayor no significa que tiene el mayor atributo que el número menor, es aleatorio o de capricho personal a quien otorga el número. Algunas de estas variables son: el número de seguro social, el sexo, los números de teléfono, entre otros.


ESCALA ORDINAL
 Las variables de este tipo además de nombrar se considera el asignar un orden a los datos. Esto implica que un número de mayor cantidad tiene un más alto grado de atributo medido en comparación con un número menor, pero la diferencia entre rangos pueden no ser iguales. Por ejemplo; el nivel socioeconómico, orden de llegada de los corredores, entre otros.

ESTADÍSTICA
La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilado a partir de otros datos numéricos. Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadística como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra.La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis. La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos. Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee.

ESTADÍSTICOS
Describe una muestra. Son funciones de la muestra. Su valor variará según la muestra.


ESTADÍSTICOS DE CENTRALIZACIÓN
Son estadísticos que nos resumen la información de la muestra dándonos información acerca del valor donde parece concentrarse la distribución de datos. Ejemplo la media aritmética, la mediana, media geométrica, media armónica entre otros.

ESTADÍSTICOS DE DISPERSIÓN
Son estadísticos que nos resumen la información de la muestra dándonos información acerca de la magnitud del alejamiento de la distribución de datos en relación a un valor central o de concentración de los datos. Ejemplo la desviación  típica, el coeficiente de variación, la desviación intercuartílica entre otras.

ESTADÍSTICOS DE FORMA
Son aquellos que nos hablan de la forma de la distribución de datos en cuanto a su simetría y su apuntamiento

ESTIMACIÓN
Técnicas estadísticas que a partir de la información de la estadística descriptiva pretenden conocer cómo es la población en global. Existen técnicas de estimación puntuales y por intervalos de confianza

ESTIMADO
Valor experimental que se toma como candidato al valor poblacional desconocido

ESTIMADOR
Función de la muestra que sirve para dar valores candidatos a los valores desconocidos poblacionales. 

FRECUENCIAS  ABSOLUTAS
Las frecuencias absolutas representan el recuento de los valores de una variable discreta de forma que su suma nos da el tamaño muestral.

FRECUENCIAS RELATIVAS
Las relativas son las absolutas divididas por el tamaño muestral .Las frecuencias relativas sumarán 1 ó 100 según se expresen en tanto por uno o en tanto por ciento

FUNCIÓN    
Función matemática. Expresión que liga dos o mas variables de forma determinística

GAUSSIANA           Ver distribución normal

GRADO DE CONFIANZA             Ver nivel de confianza

HIPÓTESIS   Cualquier teoría que formule posibles líneas de trabajo experimental. Ver hipótesis nula y alternativa

HIPOTESIS ALTERNATIVA         Aquella que queremos probar. Representa la hipótesis renovadora

HIPOTESIS NULA Aquella que queremos rechazar. Representa a la situación actual

HISTOGRAMAS      Es un gráfico en forma de barras de una variable continua que se ha discretizado en intervalos, de forma que la altura de las barras en cada intervalo indica la frecuencia relativa en éste.

IMPRECISION
Error que se comete en la predicción

INDEPENDENCIA
Son datos que no están ligados entre si

MAXIMO
Es un valor muestral de forma que por encima de este no hay valores muestrales

MEDIA
Es una medida de centralización para una variable continua. Se obtiene sumado todos los valores muestrales y dividiendo por el tamaño muestral

MEDIANA
Corresponde al percentil 50%. Es decir, la mediana hace que haya un 50% de valores muestrales inferiores a ella y un 50% de valores muestrales superiores a ella.


MEDICION
En general, se entiende por medición la asignación de números a elementos u objetos para representar o cuantificar una propiedad. El problema básico está dado por la asignación un numeral que represente la magnitud de la característica que queremos medir y que dicho números pueden analizarse por manipulaciones de acuerdo a ciertas reglas. Por medio de la medición, los atributos de nuestras percepciones se transforman en entidades conocidas y manejables llamadas "números". Es evidente que el mundo resultaría caótico si no pudiéramos medir nada. En este caso cabría preguntarse de que le serviría la físico saber que el hierro tiene una alta temperatura de fusión.

MÍNIMO
Es un valor muestral de forma que por debajo de este no hay valores muestrales

MODA
Es el valor que más se repite en una variable nominal

MODELO
Intento matemático / estadístico para explicar una variable respuesta por medio de una o más variables explicativas o factores

MUESTRAS
Subgrupos de observaciones de la población de estudio.  Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R. Spiegel (1991).Una muestra es una colección de algunos elementos de la población, pero no de todos. Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia. Al recolectar datos que determinan las características de un grupo de individuos u objetos, por ejemplo, las alturas y los pesos de los estudiantes de una Universidad o la cantidad de piezas defectuosas y no defectuosas producidas en una fábrica un día determinado, muchas veces es imposible o impráctico observar a todo el grupo, especialmente si ésta es grande. En lugar de examinar a todo el grupo, llamado población o universo, se examina a una pequeña parte del grupo, a la que se llama muestra.

MUESTREO
Esto no es más que el procedimiento empleado para obtener una o más muestras de una población; el muestreo es una técnica que sirve para obtener una o más muestras de población.

PARÁMETROS
Describe una población.  Son valores desconocidos de características de una distribución teórica. El objetivo de la estadística es estimarlos bien dando un valor concreto, bien dado un intervalo confidencial

PERCENTILES
Un percentil 90% corresponde a un valor que divide a la muestra en dos, de forma que hay un 90% de valores muestrales inferiores a éste, y un 10% de valores muestrales superiores a éste. Los percentiles 25%, 50%, 75% son el primer, segundo y tercer cuartil respectivamente

POBLACIONES
Conjunto de individuos de interés. Normalmente no se dispone de información de toda la población y se recurre a muestras. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes. Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones. Una población es un conjunto de elementos que presentan una característica común

PORCENTAJES
Proporciones expresadas en tanto por ciento

PROBABILIDAD
Asignación de un número entre cero y uno a cada resultado experimental.

PROPORCION
Número de individuos que verifican una condición entre el total del tamaño muestral. Se puede expresar en tanto por uno o en tanto por cien. Es una razón en la cual los elementos del numerador están incluidos en el denominador. Razón que indica la modificación de una cantidad con respecto a otra y en la que el numerador forma parte del denominador. Se utiliza como estimación de la probabilidad de un evento. El rango es de 0 a 1 (o de 0 a 100%).

RANGO
Diferencia entre el valor máximo y mínimo de un muestra o población. Solo es valido en variables continuas. Es una mala traducción de ingles "range". Amplitud

RANGO INTERCUARTILICO
La diferencia entre el percentil 75% y el percentil 25%

REGRESION
Técnica estadística que relaciona una variable dependiente (y) con la información suministrada por otra variable independiente (x).ambas variables deben ser continuas. Si asumimos relación lineal, utilizaremos la regresión lineal simple.

REGRESIÓN LINEAL MÚLTIPLE
El modelo de regresión lineal múltiple sirve para explicar una variable respuesta continua en términos de varios factores o variables explicativas continuas

SECTORES CIRCULARES           
Forma de representación en forma de tarta de variables discretas nominales

SESGO
La diferencia entre el valor del parámetro y su valor esperado. También se utiliza en contraposición de aleatorio, así una muestra sesgada es no aleatoria

SIMETRIA
Es una medida que refleja si los valores muestrales se extienden o no de igual forma a ambos lados de la media.

TAMAÑO MUESTRAL       Número de individuos u observaciones que componen la muestra

TECNICAS DE CORRELACION pearson y spearman

TECNICAS DE REGRESION        Ver recta de regresión y regresión lineal múltiple

TEOREMA DEL LIMITE CENTRAL        Resultado básico en la estadística que afirma que la distribución de las medias muestrales será normal para un n suficientemente grande con independencia de la distribución de datos de partida

UNIDAD
Concepto primario relacionado con los componentes elementales de la muestras estadísticas. Sinónimo, pero no esencialmente idéntico,  de caso , observación , registro o individuo

UNIVERSO
Conjunto infinito de elementos o unidades generado por un modelo teórico. Conjunto real de todos los elemento que comparten unas condiciones de admisión en el conjunto

VALORES NUMÉRICOS
Resultados de las variables para cada individuo en la muestra de estudio. Su naturaleza puede ser nominal, dicotómica, ordinal o continua

VARIABLE
Objeto matemático que puede tomar diferentes valores. Generalmente asociado a propiedades o características de las unidades de la muestra o población. Lo contrario de variable es constante.  Es una característica de la población y pueden ser: a)Cualitativa: Las observaciones se expresan de manera no numérica b) Cuantitativa: Puede expresarse numéricamente.      b.1) Continua: toma cualquier valor en un rango b.2) Discreta: está limitada a ciertos valores.
VARIABLE ALEATORIA
Variable cuyo resultado varía según la muestra según una distribución de probabilidad

VARIABLE CONTINUA
Aquella que puede tomar una infinidad de valores, de forma que dados dos valores cualesquiera, también pueda tomar cualquier valor entre dichos valores

VARIABLE DEPENDIENTE
Ver variable respuesta

VARIABLE DISCRETA
Variable que toma un número finito o infinito de valores, de forma que no cubre todos los posibles valores numéricos entre dos dados, en contraposición de las continuas

VARIABLE EXPLICATIVA          Ver variable independiente

VARIABLE INDEPENDIENTES O EXPLICATIVAS
Variables que no sirven para construir un modelo que explique el comportamiento de una o más variables respuesta

VARIABLE RESPUESTA O DEPENDIENTE     Variable objeto del estudio y que sus resultados se pretenden explicar por medio de las variables llamadas explicativas o independientes

VARIABLES            Describen características en las observaciones realizadas

VARIANZA Característica de una muestra o población que cuantifica su dispersión o variabilidad. La varianza tiene unidades al cuadrado de la variable. Su raíz cuadrada positiva es la desviación típica. La varianza muestral es un estimador sesgado de la varianza poblacional

RAZÓN         Cociente entre dos números, en el que ninguno o sólo algunos elementos del numerador están incluidos en el denominador. El rango es de 0 a infinito.

TASA Es un tipo especial de razón o de proporción que incluye una medida de tiempo en el denominador. Está asociado con la rapidez de cambio de un fenómeno por unidad de una variable (tiempo, temperatura, presión). Los componentes de una tasa son el numerador, el denominador, el tiempo específico en el que el hecho ocurre, y usualmente un multiplicador, potencia de 10, que convierte una fracción o decimal en un número entero. El rango es de 0 a infinito.

 Actividad: Los alumnos identificaran y analizaran cuales conceptos del vocabulario estarán  aplicando en el presente curso. Para ello revisaran el programa analítico de la materia y estarán atentos a las orientaciones del docente.


1.3 Etapas en el Planteamiento de una Investigación Estadística

Establecer objetivos: que tipo de información  se desea obtener, y establecer los objetivos para recolectarla.

Propósito: se determina los tipos de comparación que se necesitan, lo que permite identificar los datos que se deben recoger.

Recolectar los datos

Organizar y presentar los datos

Analizarlos

Interpretarlos.



Actividad: Los alumnos construirán un ejercicio basado en su trabajo o cualquier evento de la vida cotidiana para aplicar las etapas de investigación señaladas y presentaran por escrito sus ejercicios al resto de los compañeros.


Presentación de Resultados

Tabular:

a) Distribución de frecuencia: Organizar datos de una variable


Comentarios