Estadística en Microcomputadores/Transformación de datos
11.7 TRANSFORMACION DE DATOS
Esta opción permite generar nuevos valores de variables en la memoria de trabajo, mediante la transformación de los valores existentes de una o varias variables existentes en la memoria. La opción permite varias posibilidades, que se seleccionan mediante el siguiente menú inicial:
TRANSFORMACIONES
1 - Mediante una Función
2 - Normalización
3 - Recodificación
4 - Corrimiento/Diferencias
5 - Cálculo de Rangos
6 - Cálculo de variables Indicatrices
7 - Ordenamiento
La transformación mediante una función permite obtener
valores de una variable como función matemática de los valores
de otras variables existentes en la memoria de trabajo, función
aplicada observación a observación.
La normalización implica obtener nuevos valores a partir de los originales de una variable, midiendo, en unidades de desvío estándar, la diferencia entre cada valor original y el valor medio de los datos.
La recodificación, a su vez, permite obtener nuevos valores transformando los preexistente de una variable mediante una tabla de equivalencias.
Con el corrimiento se obtienen nuevos valores para una variable mediante el desplazamiento de sus valores en una o más observaciones. En el caso de la diferencia la transformación implica que el valor de una nueva variable se obtiene como diferencia de valores consecutivos de otra variable original. Mediante el cálculo de rangos resulta posible obtener éstos para un conjunto de observaciones de una variable contenida en la memoria de trabajo.
Con el cálculo de variables indicatrices resulta posible transformar cada valor de una variable, en general cualitativa, en valores de variables binarias, que en conjunto son equivalentes a la primera.
Finalmente, mediante el ordenaniento resulta posible obtener valores de una nueva variable como resultado del ordenamiento de menor a mayor (o de mayor a menor) de los valores de otra. Los procedimientos específicos utilizados por el sistema para la ejecución de estas transformaciones de incluyen en el Cuadro 11.7 .
Los pasos a seguir para ejecutar alguna de las posibilidades de transformación que considera el sistema son los siguientes, una vez elegida una específica en el menú anterior:
a) Si no hay datos en la memoria de trabajo se sale de la opción. En caso contrario aparecen en pantalla las variables contenidas en la memoria de trabajo.
b) Si se eligió efectuar una transformación mediante una función y si ya existe una función definida previamente se interroga si se desea o no modificarla. En caso de respuesta negativa se mantiene la función existente. En caso de respuesta positiva se ingresa la función de transformación a considerar. En el caso de que ya exista una función previa, ésta puede ser modificada (editada) mediante las teclas de edición "Insert" y "Delete" usuales en los microcomputadores.
La expresión de transformación algebraica se define utilizando la sintaxis del lenguaje BASIC, pudiendo usar en ella las mismas variables ( V(j) e I ) y y operadores y funciones matemáticas definidas para el proceso de selección. Las siguientes expresiones son ejemplos válidos de funciones de transformación que se pueden definir:
V(3)*2 - 4*LN(V(2))
3.47*I+2.1*V(2) - 3.7*V(5)
(5.9 + SQR( V(7) )) / (V(3) - 1.7*V(1)*V(2))
Como ya dijimos, el valor de la nueva variable para cada observación se obtiene aplicando la expresión definida a los valores de las variables conocidas para la misma observación.
c) En el caso de haber seleccionado cualquiera de los procesos de transformación, excepto mediante una función, se selecciona la variable específica de la memoria de trabajo cuyos valores serán transformados.
d) Para el caso de recodificación y de cálculo de variables indicatrices se definen los grupos de valores actuales de la tabla de equivalencias. Esta definición se efectúa de manera idéntica a la definición de los grupos de clasificación, que se presenta en la sección .
En el caso de recodificación y para cada grupo de valores actuales definido en el paso anterior, se ingresa el correspondiente nuevo valor de la tabla de equivalencias.
e) En el caso de haber seleccionado el cálculo de diferencias o el corrimiento se elige cual de estas transformaciones se ejecuta, respondiendo a la interrogación correspondiente. Si la respuesta es negativa se efectúa el corrimiento de valores.
En ambos casos se ingresa el número k de observaciones a considerar en el proceso.
f) En el caso de seleccionar el ordenamiento se elige el tipo de ordenamiento a efectuar, mediante el siguiente menú:
TIPO DE ORDENAMIENTO
1 - De Menor a Mayor
2 - De Mayor a Menor
g) Definición de la posición de la memoria de trabajo donde se colocarán los valores resultado de la transformación (ver procedimiento en la sección ). En el caso de cálculo de variables indicatrices se debe definir una cantidad de variables igual al número de valores posibles establecido en
d) para la variable original.
g) En caso de que exista una condición de selección definida se interroga sobre si ella se considera o no en la transformación. En caso afirmativo, la transformación se efectúa sólo para las observaciones que cumplen la condición.
h) Ejecución por el computador de la transformación para cada observación y carga de los valores correspondientes en la posición (o posiciones) definida en el paso f). A la finalización del proceso aparece en pantalla el mensaje "Transformación Terminada".
Se presentan dos ejemplos de procesos de transformación. En el primero de ellos, cuyos resultados aparecen en el Cuadro 11.8 a) se realiza un proceso de transformación mediante una función aplicada a los datos de países de América Latina (AMERLAT), que se encuentran previamente cargados en la memoria de trabajo. La transformación, en este caso, involucra obtener una nueva variable, la densidad de población (13- Densidad), como cociente entre la población (3-Poblacion) y la superficie de cada país (2-Superficie). la función de transformación ingresada es: v(3)/v(2).
En el segundo ejemplo, consignado en el Cuadro 11.8 b) se lleva a cabo una recodificación, aplicada a la variable Tiempo de Gestación (3-TpoGest) en el juego de datos de nacimientos de la ciudad de Buenos Aires (NATIVBA), que se encuentran cargados en la memoria de trabajo. La tabla de recodificación definida para este proceso, mediante la cual se transforma la variable de cuantitativa en ordinal, es:
Valor actual Nuevo Valor
< 38 1
>=38 < 40 2
>=40 < 42 3
>=42 4
Los resultados se colocan en la variable 16-TgesCod.
CUADRO 11.7 - CRITERIOS DE TRANSFORMACION DE VARIABLES
Nomenclatura
xi, wi, zi Valores de las variables X, W, Z para una observación i.
yi Valor de la variable transformada Y para una observación i.
Casos de Transformación
Mediante
una Función yi = f( xi, wi, zi, ...)
Normalización yi = ( xi - x )/s
siendo x y s la media aritmética y el desvío estándar de la
variable X, respectivamente.
Recodificación Dada una tabla de equivalencias:
Valor Original Valor Transformado
>=x1 <x2 y1
>=x2 <x3 y2
........... ...
>=xk <xk+1 yk
.......... ...
>=xp yp
resulta:
yi = yk si xk<=xi<xk+1
Corrimiento/
Diferencia a) Corrimiento:
yi = xi-k , k entero.
b) Diferencia:
yi = xi - xi-k , entero
En ambos casos y1 a yk no están definidos.
Cálculo de Rangos Ordenando previamente los valores de x de menor a mayor:
. Si xi-1<xi<xi+1 Rango yi = i
. Si xi=xi+1=...=xi+k
Rangos yi, yi+1,...,yi+k=
(i+(i+1)+...+(i+k))/(k+1)
Cálculo de
Variables Dado un conjunto x1, x2, ...,xp de Indicatrices valores possibles de la variable X:
yki=1 si xi=xk+1
el resto de las y.i=0
Ordenamiento