Estadística en Microcomputadores/INTRODUCCION
INTRODUCCION
La aplicación de técnicas estadísticas en el análisis de problemas concretos tuvo un marcado incremento con la aparición de los computadores. Ellos hicieron posible ejecutar, de manera rápida, cálculos que hasta ese momento habían requerido un importante esfuerzo manual, lo que dificultaba la aplicación de procedimientos estadísticos conocidos desde mucho tiempo atrás. A su vez, la presencia de los microcomputadores significó otro avance importante en la aplicación de las técnicas estadísticas. Estos equipos poseen una capacidad de proceso suficiente, y continuamente en aumento, para efectuar la mayor parte de las aplicaciones estadísticas usuales, lo que se ve apoyado por características como:
- Una alta disponibilidad.
- Facilidades para el manejo de datos y su intercambio entre diferentes aplicacionses.
- La portabilidad de programas y datos entre diferentes equipos.
- La sencillez de utilización, que permite su operación por los mismos usuarios de los resultados.
- Una operación intercativa entre el usuario y el equipo, que otorga una gran flexibilidad a la ejecución de procesos como los estadísticos.
- La disponibilidad usual de facilidades de graficación interesantes.
Las restricciones más importantes que aún poseen los microcomputadores normales en la ejecución de aplicaciones estadísticas están asociadas a su capacidad limitada de almacenamiento de grandes volúmenes de datos y a sus tiempos elevados de ejecución, en el caso de procesos complejos o ante datos de gran tamaño. Dichas limitaciones se van reduciendo paulatinamente, dado el desarrollo continuo que presentan estos equipos.
La realización de trabajos estadísticos en un microcomputador puede ser realizada de diferentes maneras, que involucran grados diversos de posibilidades y complejidad. Una primera opción es que el usuario, frente a un problema de tipo estadístico, desarrolle su propio programa de procesamiento, utilizando alguno de los lenguajes generales de programación disponibles para microcomputadores. Esta alternativa, aunque siempre posible, no es inevitable, excepto para aplicaciones complejas y muy específicas. Ello se debe a que, junto al avance importante de los microcomputadores en los últimos años, se produjo un proceso ininterrumpido de desarrollo de programas y sistemas que, ejecutados sobre un microcomputador, permitieran que un conjunto nuemroso de usuarios pudieran realizar aplicaciones de tipo estadístico. Este proceso se mantiene en la actualidad, apareciendo periodicamente algún sistema estadístico nuevo, así como versiones mejoradas de los existentes. La alternativa de mayor relevancia dentro de ello es la que ofrecen los programas específicos para desarrollar aplicaciones estadísticas. Estos programas, que se van haciendo cada vez más completos y poderosos, permiten realizar practicamente todos los procesos estadísticos usuales, en mayor o menor medida. Una característica propia de los programas estadísticos es que en general cuentan con facilidades para un manejo amplio de los datos requeridos por los procesos que consideran. Así, disponen de procedimientos para efectuar el ingreso, corrección, transformación y otros procesos sobre los datos, junto con una operación variada de archivos en soportes magnéticos externos. La cantidad de datos que pueden manejar varía según los diversos programas, permitiendo los más poderosos considerar volúmenes importantes, que además se encuentran en crecimiento continuo, debido al aumento permanente de capacidad de archivo de los equipos.
Frente a ello, los tiempos de procesamiento son aún de cierta magnitud, sobre todo en aplicaciones complejas o que involucran grandes volúmenes de datos. De todas maneras, esta es también una característica que va mejorando paulatinamente, con el aumento permanente de velocidad de los microcomputadores. Un aspecto importante que permite establecer diferencias significativas entre los diversos programas estadísticos es el propósito principal al que está destinado cada programa específico. Así, existen programas orientados a servir de apoyo en el aprendizaje de la Estadística, de manejo sencillo y capacidad de datos limitada; programas de mayor capacidad, para aplicaciones de nivel intermedio, y programas de gran envergadura, que incluyen procesos complejos y que permiten manejar volúmenes importantes de datos, destinados a aplicaciones de mayor relevancia o a trabajos de investigación. Otra posibilidad para efectuar trabajos estadísticos con microcomputadores es la utilización de programas utilitarios, de aplicación general. Estos programas han tenido un desarrollo importante en los últimos años, siguiendo el de los equipos, constituyéndose en herramientas poderosas para la ejecución de muchas aplicaciones en campos diversos, sin necesidad de tener que elaborar un programa ad-hoc para su ejecución. Los programas utilitarios disponibles se diferencian entre sí básicamente por la estructura de los datos que manejan y por el tipo de procesamiento que sobre éstos puede efectuarse, siendo los más conocidos dentro de ellos los programas tipo Planilla de Cálculo, los programas de manejo de Bases de Datos, Editores, Procesadores de textos y graficadores, entre otros. De ellos los de mayor aplicación potencial al tema estadístico son los de tipo Planilla de Cálculo ("spreadsheet"), ya que están específicamente configurados para manejar y efectuar cálculos sobre una organización matricial de datos usual en los procesos estadísticos. Además, estos programas utilitarios tienen en general incorporados para su ejecución directa ciertos procesos estadísticos de aplicación frecuente, pudiendo una buena parte de los restantes ser implementados con mayor o menor trabajo utilizando las facilidades de cálculo que los programas contienen.
De todo lo anterior se desprende que la utilización de microcomputadores en aplicaciones estadísticas presenta en la actualidad numerosas posibilidades e involucra diversos aspectos, que deben ser conocidos y apreciados, para que dicha utilización pueda ser efectiva.
Tratando de responder a esta necesidad el libro pretende servir de ayuda para un mejor conocimiento y uso de las posibilidades que brindan los microcomputadores en el desarrollo de aplicaciones estadísticas, así como suministrar una herramienta concreta, a nivel de programa, que pueda ser usada de manera directa y sencilla para realizar procesos estadísticos en un microcomputador. De acuerdo a este objetivo el libro está orientado a aquellas personas que, con un conocimiento por lo menos básico de Estadística, desean iniciarse en la utilización de microcomputadores en aplicaciones de esa disciplina. El contenido del libro está organizado en dos partes, pretendiendo responder cada una de ellas a un propósito específico dentro del objetivo general planteado. En la Parte A, entre los capítulos 1 y 8, se desarrolla una apreciación sintética de los temas estadísticos más usuales. En dicha apreciación se consideran los aspectos básicos de cada tema, destacando aquellos aspectos que interesan en su tratamiento computacional. No se desarrollan en detalle en la parte A procedimientos de cálculo concretos ni aspectos conceptuales ligados a las condiciones de aplicación e interpretación de resultados.
Esta primera parte, en su conjunto, pretende servir para lograr una apreciación básica de los procesos estadísticos involucrados en las implementaciones computacionales (particularmente en micros). Debe destacarse que dicha apreciación no resulta autosuficiente para lograr un conocimiento conceptual completo de los diversos temas considerados, resultando conveniente para leerla tener un conocimiento previo, por lo menos general, de cada tema estadístico tratado.
La aplicación práctica de la Estadística involucra, en un sentido amplio, algún trabajo numérico con datos experimentales, a fin de extraer de ellos un conocimiento mayor o alguna conclusión sobre la realidad de la que dichos datos provienen. Existen numerosos procesos que, con diferentes criterios, permiten efectuar dicho trabajo, pudiendo ser agrupados de acuerdo a sus característica básicas en temas estadísticos representativos. En el libro adoptamos una clasificación y ordenamiento bastante usuales de los temas estadísticos, sobre todo vinculadas a las herramientas computacionales. Dicha clasificación es la siguiente:
1) Manejo de Datos Involucra aquellos procesos que permiten manipular los datos estadísticos de manera que puedan ser despúes considerados en los restantes procesos estadísticos.
2) Análisis Descriptivo de Datos Contempla aquellos procesos que posibilitan obtener un mayor conocimiento a partir de los datos en análisis, sin definir a priori hipótesis que expliquen el comportamiento de dichos datos.
3) Distribuciones de Probabilidad Abarca los procesos que manejan modelos probabilísticos de comportamiento de variables estadísticas, denominados Distribuciones de Probabilidad.
4) Pruebas Estadísticas Los procesos que incluye permiten verificar el cumplimiento de hipótesis que se plantean con respecto al comportamiento de variables estadísticas.
5) Análisis de Variancia Implica el uso de modelos que permiten explicar los valores de una variable independiente o respuesta, en función de diferentes grupos en los que se pueden clasificar los valores de aquella.
6) Regresión Abarca el manejo de modelos que permiten también explicar los valores de una variable independiente, en función de un cierto conjunto de variables independientes.
7) Análisis Multivariado Involucra diversos procesos que permiten analizar en forma simultánea valores experimentales de un conjunto importante de variables estadísticas.
8) Series de Tiempo Abarca los procesos estadísticos que pueden llevarse a cabo con datos experimentales que responden a un ordenamiento temporal.
En la Parte B del libro, abarcando los capítulos 9 a 18, se presenta y describe una herramienta concreta para la ejecución de procesos estadísticos en un microcomputador: el sistema ESTAD. Este sistema, compuesto por un conjunto integrado de programas en lenguaje BASIC, tiene por finalidad principal servir como herramienta computacional de gran disponibilidad y sencillez útil como apoyo al aprendizaje estadístico básico, así como para adquirir experiencia sobre el uso de herramientas de microcomputación en aplicaciones de esa disciplina. De manera complementaria el sistema ESTAD puede ser utilizado en aplicaciones estadísticas a problemas efectivos que involucren volúmenes pequeños de datos. Otra utilidad del sistema es la de proveer un conjunto de rutinas estadísticas integradas en lenguaje BASIC, que pueden incorporarse a programas desarrollados ad-hoc para aplicaciones específicas.
El sistema ha sido diseñado siguiendo la organización de los procesos estadísticos adoptada en la Parte A del libro, con lo cual ésta le sirve de marco de referencia para la apreciación de los procesos estadísticos que contiene y de los resultados que suministra.
La disponibilidad del sistema ESTAD es directa, ya que se encuentra grabado en su totalidad en el diskete que incluye en el libro. Por otra parte, está construido en lenguaje BASIC intérprete, que se dispone en general como lenguaje estándar en los microcomputadores. Ello hace que el sistema sea transparente, pudiéndoselo modificar, agregarle procesos, o utilizar algunas de sus rutinas en programas especìficos. Otra característica del sistema es que en sus procesos se utilizan criterios de cálculo sencillos y en general de fácil comprensión, en lugar de aquellos más elaborados, actualizados y de mayor eficiencia computacional. Esta característica facilita enormemente la utilización del sistema como apoyo al aprendizaje, pero involucra tener precaución en su uso frente a datos con características anómalas.
Dicha precaución además se debe tener en la utilización del sistema en aplicaciones a problemas reales, de la misma manera que en cualquier otro sistema estadístico. Resulta necesario conocer la adecuación y limitaciones de las técnicas empleadas en cada caso, así como los criterios para interpretar los resultados, elementos éstos que no se consideran en el libro, salvo superficialmente, y que requieren un conocimiento previo. Para cada uno de los temas abarcados por el sistema ESTAD se incluye un detalle de los procedimientos de cálculo considerados, los pasos a realizar para su ejecución y ejemplos de la aplicación de éstos a datos reales también provistos junto con los programas. Dichos procedimientos y ejemplos agregan elementos concretos a la apreciación conceptual genérica abarcada por la Parte A.
Como contenido final del libro se incluyen, en sendos apéndices, los siguientes temas: a) Estructura de los programas del sistema ESTAD; b) Características de los archivos de datos en el sistema; c) Descripción de los errores del sistema y d) Descripción de los juegos de datos que se incluyen en el diskete y que se utilizan en la Parte B.
No se ha conisderado conveniente incluir en el libro un estudio comparativo de los diversos sistemas estadísticos específicos disponibles, tipo Guía de Usuario, ya que ello resulta de validez temporal limitada, dada la aparición permanente de nuevos programas o de versiones mejoradas de los existentes. Por otra parte, estudios comparativos actualizados de ese tipo se incluyen periodicamente en las revistas especializadas en temas de microcomputación.
En la preparación del libro se han consultado diversas fuentes bibliográficas, de las cuales las más representativas se incluyen al final de cada capítulo. Ha servido como guía general el libro de Afifi y Azen (ver referencia), que puede ya ser considerado como un "clásico" en la literatura relacionada con la Estadística y su tratamiento computacional.
Referencias
A.A. Afifi , S.P. Azen. Statistical Analysis: A Computer Oriented Approach. Academic Press, New York, 1979.