Cinco errores, ejemplos y soluciones comunes en el análisis de datos

Cuando analizamos información debemos tener cuidado de no cometer estos errores comunes que incluso los analistas más experimentados corren el riesgo de cometer.

Algunas son bastante obvias, pero otras dependen de tener una mente entrenada y buenas prácticas de Control de Calidad para asegurarnos de que nuestras conclusiones estén libres de errores y no sean sesgadas.

Error nº1: datos no representativos

Esto ocurre cuando tu extracto de datos no es lo suficientemente representativo, es decir, hay un problema insuperable y tus datos no representarán la realidad y por tanto tus resultados serán inútiles.

Ejemplo:

Estoy analizando la comida favorita de los habitantes de la ciudad de Mexico, para llegar a esta conclusión tomo datos del barrio zona rosa. Con este conjunto de datos invariablemente llegarás a la conclusión de que la comida japonesa es la comida favorita, con un enorme margen de “certeza”.

Solución:

Planifique qué fuentes de datos están disponibles y qué alcance mínimo es necesario para tener un resultado confiable.

En este sentido, contar con las herramientas de análisis correctas y las prácticas correctas marcará la diferencia.

Error #2: Falta de familiaridad con los datos

Este problema es común cuando no tenemos dominio de un área determinada del conocimiento. La falta de conocimiento seguramente conducirá a errores de análisis que harán que sus conclusiones sean erróneas.

Ejemplo:

Recuerdo que apenas llegué al grupo de trabajo de Banestado hice un análisis de datos de cuentas corrientes y al final había un número absurdamente alto de cuentas que excedían el valor de corte, es decir, cuyos valores totales de transacción eran Alto y saltó a los ojos, parecía que había encontrado una gran cantidad de cuentas madre que se utilizan para el lavado de dinero.

Mi error fue no saber que para ese conjunto de datos había una duplicación y que cada operación tenía una contraoperación y no conocer los datos simplemente me llevó a duplicar el valor total de las transacciones.

Solución:

Busque profesionales y empresas que puedan ayudarle a comprender los datos disponibles y sus relaciones y detalles especiales que podrían llevarle a cometer un error.

Nadie está obligado a conocer todos los detalles de todas las áreas, pero la falta de conocimiento podría arruinar tus análisis.

Error #3: Escoger cerezas

La selección ocurre cuando comenzamos con una hipótesis que queremos probar y simplemente no podemos resistir la tentación de «intentarlo» eligiendo los datos que corroboran nuestra idea preconcebida. No sólo es poco ético, sino que invariablemente no sobrevivirá a una revisión, sino que puede tener consecuencias muy malas, especialmente en las áreas más sensibles como la seguridad y la salud públicas.

Ejemplo:

Estamos seguros de que un determinado individuo está involucrado en algo ilegal y por ello elegimos sólo los datos que son relevantes para llegar a la conclusión deseada.

Solución:

Al analizar tu información, deshazte de tus prejuicios y sé frío con los datos que tienes, sé fiel a los hechos que los datos te muestran.

Error #4: Falso positivo

El falso positivo suele estar relacionado con una revisión de datos deficiente o inexistente, sin confirmación de una segunda recopilación de datos, sin aplicación de mejores prácticas, sin herramientas correctas y sin buenos métodos de revisión.

Ejemplo:

Recuerdo que en una investigación por fraude en licitaciones públicas se detuvo a algunas personas por su participación en el crimen, entre ellas se detuvo a una persona completamente inocente y sin relación con la pandilla.

Lo que ocurrió cae dentro de las categorías de problemas de buenas prácticas mencionadas anteriormente: no hubo revisión y no había un conjunto de datos para contrapruebas en el momento de la recopilación de datos. Hubo un error y el registro del propietario del número era antiguo y no estaba actualizado.

Solución:

Revisa tu trabajo y trata siempre de cruzar datos de diversas fuentes, analizando varios ángulos diferentes del problema, algunas herramientas específicas te ayudarán en esta tarea.

Error nº 5: problema del martillo

Mi padre era mecánico y entendía bien la necesidad de utilizar la herramienta correcta para cada fase de su trabajo; Usó una frase que siempre me hizo mucha gracia: “Para los que sólo saben de martillos, todo es un clavo”.

Tu trabajo de análisis no tendrá calidad si no utilizas la herramienta adecuada, es decir, las herramientas para extraer, consolidar y generar inteligencia a partir de tu información son fundamentales y conocer la herramienta adecuada para el tipo de análisis es una parte importante del trabajo del analista. .analista.

Ejemplo:

MS Excel puede ser tu amigo y una herramienta muy útil, pero es posible que estés usando tus hojas de cálculo como un martillo.

Solución:

Mantente actualizado y conoce las mejores herramientas disponibles en el mercado y busca activamente obtenerlas, la calidad de tu trabajo es importante, al igual que tu reputación.