Exactitud de los datos (accuracy).
NATURALEZA
No es un concepto exclusivo de la IA. Hace referencia a la fidelidad de un dato, cálculo, o medida, evitando sesgos o direcciones equivocadas y adecuándose a la realidad, es un principio que se emplea en diversas disciplinas como son la ingeniería o la estadística, también en el terreno de la inteligencia artificial y el tratamiento de datos.
CONCEPTO
La exactitud es un componente de la calidad de los datos, para que sean precisos, deben tener un valor correcto y representarse deforma coherente y sin ambigüedades. Deben también venir actualizados cuando sea necesario y, en todo caso, periódicamente. El incumplimiento de este principio genera responsabilidad de los responsables y encargados, y de todos los que accedan a los datos y tomen decisiones. Pero no será imputable la inexactitud de los datos personales al responsable del tratamiento cuando haya adoptado las medidas razonables para que se supriman o rectifiquen sin dilación, o cuando los datos inexactos hayan sido obtenidos: directamente del afectado, de un mediador o intermediario, quien asumirá las responsabilidades, de otro responsable en virtud del ejercicio del derecho de portabilidad, o de un registro público (artículo 4 LOPDD y artículo 5 del Reglamento (UE) 2016/679). Una organización que almacene datos debe tener un proceso de control de su calidad. Son datos inexactos: los incompletos, faltos de fiabilidad, y los incoherentes o inconsistentes en su representación, y pueden merecer su rectificación o supresión.
IMPORTANCIA
La exactitud de los datos sirve a la veracidad en la información y a la utilidad de su tratamiento. Por otro lado, datos de baja calidad suponen una merma de eficacia de las decisiones de los sistemas de IA y generan todo tipo de problemas. Resulta extremadamente difícil diseñar herramientas de IA a partir de datos que no sean exactos
USOS Y RIESGOS
Los desafíos pueden venir de diversas vías en cualquier sistema.
Son inevitables los errores humanos en entradas manuales, a causa de errores tipográficos, de edición o en la composición del texto, que se perpetúan en el almacenamiento. Otra segunda causa emana de la decadencia u obsolescencia, una pérdida progresiva del valor o calidad de los datos, porque el transcurso del tiempo los haga inexactos según se transforman los contextos y distintos elementos que cambian constantemente. Una tercera, deriva del movimiento de datos de un sistema a otro y puede emanar del
software
y de su nueva ubicación o formato. El riesgo evidente es que a partir de esos datos (inexactos) se generan respuestas automatizadas inadecuadas por lo que es esencial una política activa en la garantía de la exactitud de los datos usados para diseñar y entrenar herramientas de IA.
AUTORES
Javier García Roca