¿Cómo presentar los datos y resultados de una investigación de manera sencilla y correcta?
Cuarteto de Anscombe
En este post te muestro detalladamente de un modo muy sencillo como presentar los datos y resultados científicos. También presento el cuarteto de Anscombe, el cual nos presenta la necesidad de emplear correctamente diferentes medios para presentar nuestros datos científicos. El cuarteto de Anscombe nos hace reflexionar sobre cómo se deben presentar los datos científicamente. Montándonos un caso paradójico que nos hará reflexionar.
¿Dirías que los 4 gráficos tienen los mismos promedios, varianzas y correlaciones?
!La respuesta es sí!
En 1973, Anscombe nos presenta esta curiosa situación a la comunidad científica atendiendo a la problemática y necesidad de mostrar los datos de manera visual a través de gráficos y no solo conclusiones e interpretaciones a través de promedios, desviación estándar, mediana... El cuarteto es una demostración de la importancia de mirar gráficamente un conjunto de datos antes de analizarlos.
Cuando solo se realiza una estadística de comparación de medias o varianzas se están ignorando una gran cantidad de información potencialmente valiosa sobre la distribución de los resultados contenida en los datos recogidos en la investigación, información que es crucial para una comprensión más profunda del tema en cuestión.
En la actualidad esta problemática sigue vigente, siendo necesario el entendimiento y conocimiento de su existencia. Desde la ciencia se ha avanzado mucho y en la actualidad se utilizan diferentes estadísticos para intentar mostrar e interpretar correctamente los datos y no solo basarse una diferencia significativa mayor o menor de P=0.05 en la comparación de medias. Entre ellos se encuentran gran variedad de gráficos atendiendo a la naturaleza de los datos obtenidos, tamaños del efecto, porcentajes de cambio entre otros.
¿Cómo presentar los datos en un artículo científico experimental?
Bajo mi punto de vistas la primera tabla fundamental en los artículos científicos experimentales es la descripción de la muestra de estudio. En ella vemos la muestra de estudio del artículo describiendo el promedio de las variables junto a su rango (esto nos indica el espectro de las variables de la muestra).
En esta tabla debemos mostrar una descripción de nuestra muestra de la manera más completa posible.
Una vez hemos descrito nuestra muestra podemos seleccionar cómo debemos mostrar los resultados obtenidos de nuestro experimento. El orden de aparición de los resultados debemos de seleccionarlo atendiendo a la metodología que hemos empleado y a las variables que hemos evaluado. Un ejemplo sería en una investigación que hemos medido efecto de una sustancia en reposo y ejercicio. Podemos empezar mostrando y hablando de los resultados en reposo y luego en ejercicio. Para mostrar estos resultados tendríamos diferentes opciones:
-Tablas
-Figuras
En esta tabla vemos los resultados de las variables medidas en reposo. Encontramos los promedios de las variables junto a su desviación estandar (mide la dispersión de una distribución de datos). A la derecha vemos dos estadísticos:
d de Cohen: tamaño del efecto. Nos indica una magnitud en este caso es la diferencia entre las restas de las medias comparadas con la dispersión de los datos. d=(Media1-Media2)/desviación estandar.
Valor de la P: es un valor de probabilidad. Este estadístico nos indica si la hipótesis se rechaza o no se rechaza. La significación para establecer el rechazo de la hipótesis nula normalmente está en 0.05 o más restrictiva en 0.01.
Porcentaje de cambio: nos habla del porcentaje de cambio que ha sufrido una variable. Normalmente en investigación lo encontramos con una forma de triángulo.
La siguiente manera de presentar los datos es mediante una figura o gráfico de barras. Esta manera de presentar los datos es muy buena para variables en las que tenemos un único dato (promedio), no son lineales, etc. Ejemplo de ello es la máxima oxidación de grasas (es un dato específico) al igual que el Fatmax (intensidad a la que se produce la máxima oxidación de grasas). De este modo, visualmente nos queda muy claro el efecto de la sustancia y del placebo. Vemos la desviación estándar (palito superior, dispersión de los datos) y el asterisco que nos indica que hay diferencias significativas.
Las variables que son lineales recomiendo un gráfico lineal como el que observáis arriba. Nos muestra de manera clara y concisa los datos medidos para cada uno de los tratamientos. Estas variables son lineales puesto que se recoge un dato por cada carga de intensidad (30, 40, 50 ,60, 70 y 80 % del consumo de oxígeno máximo). En el vemos las desviaciones estándares superiores e inferiores y si hay o no diferencias significativas. En este caso en particular al haber 2 dosis de una sustancia en comparación con un placebo, la estadística nos compara respecto al placebo y entre las dosis. Asterisco cuando hay diferencias con el placebo y la daga cuando hay diferencias significativas respecto a 3 mg/kg de cafeína.
Gráfico fundamental para entender el comportamiento y efecto individual en cada sujeto. En este gráfico vemos cómo han respondido cada uno de los sujetos al efecto de la cafeína, el placebo o la falsa cafeína (la falsa cafeína en verdad era un placebo, pero se les indicaba a los sujetos que era cafeína. Evaluábamos el efecto placebo de esta sustancia). Cada una de las líneas que vemos en el gráfico, es un sujeto para la variable de máxima cantidad de grasas oxidada.
Este tipo de gráficos me encantan. Comprendemos que cada sujeto responde de diferente manera y el científico busca un promedio de efectividad para catalogar si es efectiva a o no, en este caso el efecto de la cafeína y del efecto placebo sobre la oxidación de grasas.
Para los entrenadores, nutricionistas, expertos del campo, este gráfico es de suma importancia atendiendo a que sus atletas o población pueden ser tanto el que mayor efecto ha tenido como al que no le hizo efecto.
Otro gráfico de gran utilidad y que refleja de manera simplificicada y perfectamente los resultados, es una mezcla de gráficos de barras con la respuesta individual (líneas horizontales). Me gusta mucho también. De este modo se muestran los promedios en las barras para los dos días experimentales (placebo y cafeína) con sus desviaciones estándares superiores, junto con la respuesta individual de cada sujeto. Donde vemos con líneas discontinuas los sujetos que van en contra del efecto general. Sin este gráfico no podríamos identificar que ha habido varias personas en el estudio que han tenido un efecto contrario o neutro al de la población general de estudio.
De tal modo es de suma importancia transmitir del modo más completo los resultados obtenidos en la investigación para una correcta interpretación y de este modo, una magnífica divulgación científica.
Nada que decir en la parte práctica y de aplicabilidad de esos estudios en el campo, donde por ejemplo un entrenador tendrá bajo su mando a la suma de toda la población de estudio. Tanto aquellos que están dentro de la campana de Gauss cercanos a la mediana, como los que se encuentran es sus extremos.
Es de suma importancia en ciencia, aportar del modo más completo toda la información posible (estadísticos, gráficos, tablas…) para el entendimiento correcto e interpretación de resultados, y con ello acercarnos lo más posible a verdad.
Por otro lado, tenemos que tener en cuenta que la ciencia se escribe para los científicos. Es fundamental una correcta interpretación de los datos, para poderlos extraer en el contexto social de manera adecuada y correcta.
RECORDEMOS QUE EL PRINCIPIO Y FINAL DE LA CIENCIA ES LA SOCIEDAD