INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA
La estadística es una ciencia matemática que se refiere a la colección, estudio e interpretación de los datos obtenidos en un estudio.
Es aplicable a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, ciencias de la salud como la Psicología y la Medicina, y usada en la toma de decisiones en áreas de negocios e instituciones gubernamentales.
La Estadística se divide en dos ramas:
· La estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de descriptores numéricos son la media y la desviación estándar. Resúmenes gráficos incluyen varios tipos de figuras y gráficos.
· La inferencia estadística, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población de estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen ANOVA, series de tiempo y minería de datos. Ambas ramas (descriptiva e inferencial) comprenden la estadística aplicada.
Hay también una disciplina llamada estadística matemática, la cual se refiere a las bases teóricas de la materia. La palabra estadísticas también se refiere al resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas criminales, etc. Etimología: La palabra "estadística" procede del latín statisticum collegium ("consejo de Estado") y de su derivado italiano statista ("hombre de Estado" o "político"). El término alemán Statistik, que fue primeramente introducido por Gottfried Achenwall (1749), designaba originalmente el análisis de datos del Estado, es decir, "la ciencia del Estado" (también llamada "aritmética política" de su traducción directa del inglés). No fue hasta el siglo XIX cuando el término estadística adquirió el significado de recolectar y clasificar datos. Este concepto fue introducido por el inglés John Sinclair.
En su origen, por tanto, la estadística estuvo asociada a datos a ser utilizados por el gobierno y cuerpos administrativos (a menudo centralizados). La colección de datos acerca de estados y localidades continúa ampliamente a través de los servicios de estadística nacional e internacional. En particular, los censos suministran información regular acerca de la población.
Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año
3000 AC los babilónicos usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XI AC. Los libros bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 A.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el 594 A.C para cobrar impuestos.
La estadística descriptiva: es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).
Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:
Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.
Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.
Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.
Fuentes de información.
La información obtenida para un estudio o una investigación debe ser sometida a un análisis cuidadoso que permita hacer comentarios interpretativos. Según su procedencia, la información estadística se clasifica en. Información de fuentes primarias e información de fuentes secundarias.
Cuando el problema y las hipótesis se plantean en un momento posterior a la existencia de los datos, se habla de Información Secundaria, por ejemplo, cuando se quiere estudiar la hipertensión en un grupo de pacientes y se acude a las historias clínicas en el archivo del hospital o si se desea estudiar el nivel de ingresos de los colombianos en la última década utilizando los datos que posee el DANE, estamos utilizando información secundaria.
Si el planteamiento del problema y de las hipótesis se acompaña del diseño y utilización de técnicas para obtener los datos que permiten probar esas hipótesis, se habla de Información Primaria; por Ejemplo, si se desea hacer el mismo estudio sobre la hipertensión con un registro directo de la tensión arterial en los pacientes o si se desea estudiar el nivel de ingresos de los colombianos en la última década y se recoge información mediante encuestas o entrevistas a un grupo de personas, se esta trabajando con información primaria.
Una ventaja de utilizar información primaria es que se tiene conocimiento sobre la metodología utilizada en la recolección de los datos lo cual puede ayudar a la interpretación correcta de los mismos, el análisis de los resultados y la elaboración de conclusiones. La información secundaria no siempre facilita este tipo de actividad y existe la posibilidad de sumir los errores de registros que trae la información y los errores de diseño del estudio o de la investigación.
La información secundaria acumula datos obtenidos por varias fuentes primarias, tal es el caso de los informes Anuales del DANE que contienen datos recogidos de varias fuentes primarias de origen oficial y privado. Cuando se usa este tipo de información se debe tratar de conocer las técnicas empleadas en la recolección, esto va directamente relacionado con
Comentarios
Publicar un comentario