Datos estadísticos

    El origen de la ciencia estadística se pierde en la noche de los tiempos. Ya dos milenios a.C., hay constancia de censos realizados en China y, mucho antes del principio de nuestra era, sabemos que los romanos también efectuaban censos a fin de conocer la demografía de las poblaciones sujetas al dominio del Imperio. Desde esas remotas épocas hasta las actuales, innumerables estados han llevado a cabo estudios encaminados a determinar la cuantía de sus poblaciones, de sus cosechas, de sus recursos naturales, etc. Precisamente del vocablo estado deriva el término estadística.

    La estadística

    El término estadística tiene dos acepciones, ya sea como colección de datos o como ciencia. Como ciencia, estudia el comportamiento de los fenómenos de masas, buscando las características generales de un colectivo, con lo que se determinan unos factores estables o regulares de un cierto fenómeno. Estos factores, además de servir para describir ese fenómeno, pueden ser utilizados para efectuar predicciones. La estadística se divide en dos grandes ramas según sea descriptiva o inductiva.

    Descriptiva. En ella, partiendo de una serie de datos, se llega a conclusiones que no rebasan el conjunto de conocimientos que proporcionan éstos. Es decir, las conclusiones no sobrepasan el nivel de los datos.

    Inductiva. Las conclusiones extraídas suponen el establecimiento de propiedades del colectivo que no están incluidas en los datos. La estadística inductiva también se llama inferencia estadística y sirve para estimar las características de una población. La estadística inductiva es siempre posterior a la descriptiva, la cual es, por tanto, imprescindible: unas veces porque no se pasa de su nivel y otras para utilizar la inducción. El empleo de la estadística inductiva es lo que nos permite hacer afirmaciones de futuro, como, por ejemplo, decir que el próximo año el Producto Interno (o Interior) Bruto aumentará en un 3%.

    Términos

    Para realizar cualquiera de estos procesos, se maneja una serie de términos propios de esta rama de las matemáticas. Entre ellos, destacan:

    • Censos. Son investigaciones estadísticas que estudian los caracteres más estructurales y más estables de una población, por lo que se realizan periódicamente pero a largos intervalos de tiempo (cada cinco o diez años). El padrón municipal es un ejemplo de ellos.

    • Estadísticas. Este término se reserva para las investigaciones de fenómenos más dinámicos. Su periodicidad es más corta. Por ejemplo, es el caso del índice de precios de consumo o IPC, que se estudia mensualmente.

    • Encuesta. Es una investigación estadística, generalmente sobre cuestiones sociológicas o políticas. Por ejemplo, se hace una encuesta cuando se investiga el porcentaje de chilenos que están de acuerdo con la gestión de un determinado Gobierno.

    No obstante, debe decirse que, en estadística, a menudo se reserva el nombre de censo a una investigación en la que se estudian todos los elementos involucrados (investigación exhaustiva), mientras que se denomina encuesta a la realizada a partir de datos obtenidos de sólo una parte de los elementos implicados.

    • Población. Otro término frecuente que se emplea en estadística es el de población. Se denomina así al conjunto de personas o de cosas a las que se extiende el estudio estadístico. Cada una de las personas o cosas que forman la población se llaman elementos.

    Variables y atributos

    Los elementos de la población tienen ciertas propiedades que se denominan caracteres. Por ejemplo, en una persona se pueden distinguir diversos caracteres como el peso, la edad, la formación cultural, etc.; en una vivienda, el número de habitaciones, si tiene o no línea telefónica o cualquier otra característica.

    En general, la investigación estadística no contempla todos los caracteres, ya que éstos, generalmente, son muchos y, por otra parte, lo habitual es que esa investigación sólo se mueva en una dirección: sanitaria, demográfica, etc., por lo que sólo interesa un número reducido de caracteres. Teniendo en cuenta cuántos de estos caracteres se tomen en consideración, se podrá hablar de estadísticas unidimensionales o bidimensionales.

    Desde el punto de vista meramente matemático, los caracteres de una población pueden ser:

    • Variables. Una variable es un carácter de tipo cuantitativo y, por tanto, representable mediante un número. Son ejemplos de variables la edad, la estatura, etc. Las variables, a su vez, pueden ser discretas o continuas. Serán discretas si toman determinados valores y no pueden asumir ninguno comprendido entre dos consecutivos. Por ejemplo, el número de obreros de una fábrica puede ser 1 o 2 o 3 o 400, pero no puede ser 2,3. Por su parte, serán continuas en caso de que puedan asumir valores comprendidos entre dos consecutivos. Por ejemplo, éste será el caso si se quiere estudiar la altura de la población: es evidente que entre los valores 1,70 y 1,71 existen tallas intermedias, lo que indica que entre dos individuos con las estaturas mencionadas puede haber infinitos con tallas comprendidas entre ellas.

    Los valores que asume una variable (x1, x2, ..., xn) se representan por xi, donde i toma los valores 1, 2, 3,..., n.

    • Atributos. Un atributo es un carácter cualitativo y, por tanto, no representable por números, sino por medio de palabras. Por ejemplo, la profesión, la nacionalidad, etc.

    Formas para observar una población

    La recopilación de los datos necesarios para el conocimiento de una población pasa necesariamente por la observación de la misma. La observación de una población puede realizarse mediante las formas exhaustiva, parcial y mixta.

    • Exhaustiva. Mediante este procedimiento se analizan todos los elementos de la población. En general, sólo puede hacerse en poblaciones pequeñas, ya que, habitualmente, éstas no pueden estudiarse en su totalidad, bien sea por el gran número de sus elementos, bien sea porque se destruyen al ser consideradas. Así, por ejemplo, sería impensable, si se desea saber el porcentaje de mujeres casadas mexicanas que fuma, dirigirse a todas las mujeres afectadas por el estudio (éste sería un número muy grande) y otro tanto sucedería si se desea saber cuál es la vida de, una vez encendidos, los televisores de una marca concreta (al acabar el estudio estaría destruida la producción).

    • Parcial. Este tipo de observación se basa en el estudio de una parte de la población. Puede, a su vez, realizarse de dos formas: por subpoblaciones o por muestras.

    La observación parcial por subpoblaciones consiste en formar un subconjunto de la población tomando elementos del colectivo total que reúnan ciertas características. Éste sería el caso, por ejemplo, si se desea hacer un estudio sobre los talleres mecánicos y se seleccionan los que poseen más de cinco trabajadores. Un caso típico de esta situación es el cálculo de la llamada cesta de la compra, en la que se seleccionan los artículos de mayor consumo.

    La observación parcial por muestras consiste en la elaboración de un subconjunto que es representativo de la población. De esta manera, la muestra es una especie de «maqueta» de dicha población, ya que todo elemento de ella está representado en la muestra y, además, se halla en la misma proporción que en el colectivo total. Las muestras se confeccionan por sistemas aleatorios y no aleatorios. En el primer caso se utilizan métodos basados en el azar, mientras que en el segundo la selección se hace de acuerdo con ciertas reglas fijadas de antemano.

    • Mixta. Combina el método exhaustivo con el parcial. Mediante ella, ciertos caracteres, que se consideran básicos, se analizan exhaustivamente, mientras que el resto se estudian mediante muestra.

    El símbolo

    Finalmente, a la hora de iniciar el estudio de la estadística es necesario hablar del llamado sumatorio, , profusamente empleado en esta ciencia y con el que se expresa de forma abreviada una suma. Con él es posible «resumir» un conjunto de constantes y variables en un valor numérico único.

    = x1 + x2 + ....+ xn

    El símbolo sumatorio tiene las siguientes propiedades:

    • El sumatorio del producto de una constante por una variable es igual al producto de la constante por el sumatorio de la variable. Es decir:

    O, lo que es lo mismo, las constantes en producto o cociente pueden salir fuera del símbolo sumatorio.

    • El sumatorio de la suma algebraica de dos variables es igual a la suma algebraica de los sumatorios de dichas variables, lo que puede expresarse por la igualdad:

    • El sumatorio de una constante es igual al producto de esa constante por el número de veces que aparece. Es decir:

    k = k·n

    • Como consecuencia de las propiedades anteriores, resulta evidente que: