La herramienta adecuada para realizar un trabajo estadístico

Las estadísticas son como armas poderosas. Si sabes cómo usarlas, son increíblemente valiosas. Pueden ayudarte a mejorar tu trabajo, obtener mayor eficacia y rapidez en alcanzar el objetivo. Pero si no eres cuidadoso, puedes arruinarlo todo.

Existen diversas técnicas estadísticas, cada una con un conjunto de propósitos. Si no estás familiarizado con estas herramientas, puedes quedar absorto en la etapa de selección del método. Sin embargo no te perderás si comprendes qué variables hay que analizar y cuáles son tus objetivos. Considera la siguiente jerarquía se selección de un método estadístico basándonos en este cuadro. Este diagrama de flujo tiene 5 cuestiones a responder:

1 – ¿Cuántas variables hay? –sólo una, más de una, demasiadas.

2 – ¿Cuál es el objetivo estadístico? — describir, identificar/clasificar, comparar/testear, predecir o explicar?

3 – ¿Qué escalas de medida se utilizan?

4 – ¿Existen variables dependientes e independientes?

5- ¿las muestras están relacionadas entre ellas espacialmente (1D, 2D o 3D), o por tiempo/secuencia (1D)?

Cuadro de selección estadística

Cuadro de selección estadística

La primera pregunta es sencilla. ¿Cuántas variables hay? Cuando la cantidad de variables es exagerada, y ya nos hemos asegurado que son absolutamente necesarias para realizar el análisis estadístico, entonces puede recomendarse utilizar un análisis clúster para intentar reducir su número a las más representativas o utilizar técnicas de reducción de datos para crear nuevas y más eficientes variables sustitutas.

La segunda decisión “¿Cuál es el objetivo estadístico?” nos ayudará a seleccionar un conjunto de técnicas estadísticas según sea nuestra finalidad.

La tercera pregunta “¿Qué escalas de medida se utilizan?” es un poco más compleja porque tienes que conocer qué es una escala de medida. Sólo necesitas en este caso conocer lo principal: existen las escalas nominales (listas de elementos de una categoría, como por ejemplo las provincias), las escalas ordinales (similares a las nominales, pero con una jerarquía que las permite ordenar de mayor a menor, ej bueno, regular, malo) y las escalas continuas (una variable numérica como el importe de ventas).

La cuarta pregunta “¿Existen variables dependientes e independientes? Es también una pregunta que necesita de conocimiento previo ya que estos conceptos aparecen en la teoría estadística. En particular, se debe entender por qué una variable debiera tener el foco de atención y otro grupo de variables servirían de soporte a esta. Además, si tu objetivo es “predecir”, debes tener una variable dependiente a pronosticar y un conjunto de variables independientes.

La quinta decisión es “¿están las muestras relacionadas entre ellas mismas? Existen tres formas de estarlo: por tiempo, espacialmente y por secuencia. Si es importante que la variable dependiente sea medida en un punto particular del tiempo / ubicación, tus datos están probablemente autocorrelacionados (relacionados entre ellos mismos). Puede que no sea significativa, aunque seguramente está presente en algún grado. La siguiente regla sirve para averiguar si estamos ante un problema que tiene una autocorrelación importante. Encontraremos autocorrelación cuando ante un cambio temporal/local en la secuencia de una variable se continúa con otro cambio en respuesta a él (por ejemplo, el alza del precio de la cotización de una acción, la influencia territorial del tráfico de una ciudad en sus alrededores).

Una vez respondidas las cinco cuestiones, habremos arribado a un conjunto acotado de herramientas estadísticas, las cuales podremos profundizar con mayor tranquilidad dado el ahorro de tiempo y errores en no utilizar la técnica equivocada.

Anuncios