Una mayor cantidad de datos no equivale necesariamente a una mayor calidad de los mismos, independientemente de la fuente.
Las afirmaciones basadas en una gran cantidad de datos pueden ser engañosas. En ocasiones esto se llama “big data” (datos procedentes de bases de datos muy grandes) o “datos del mundo real” (datos recogidos de forma rutinaria). Desafortunadamente, muchas veces, los datos recogidos de forma rutinaria no incluyen información sobre los “confusores”.
Los confusores son factores diferentes a los tratamientos comparados que pueden afectar a los desenlaces. Por ejemplo, un estudio puede comparar las personas más activas con las menos activas para determinar si ser más activo ayuda a perder peso. Si las personas más activas comen menos, eso sería un confusor, ya que la cantidad de comida ingerida puede afectar a la pérdida de peso.
Cuando se utilizan datos recogidos de forma rutinaria, solo es posible controlar los confusores conocidos previamente y medidos cuando se recogieron los datos. Por lo tanto, no se puede estar seguro de que la asociación entre un tratamiento y un desenlace signifique que ese tratamiento, en lugar de los confusores, causó el desenlace.
ATENCIÓN a las afirmaciones que dicen que un tratamiento tiene un efecto basándose en asociaciones encontradas mediante el “big data” o “datos del mundo real”.
Recursos y ejemplos
‘Exaggerated hopes and exaggerated fears’: 4 ways big data complicates research (“Esperanzas exageradas y miedos exagerados”: 4 formas en las que el big data complica la investigación). Artículo en inglés en AI in Healthcare.
https://www.aiin.healthcare/topics/research/4-ways-big-data-complicates-research