Tecnología

Los datos sintéticos, la clave para mejorar la Inteligencia Artificial

Los datos sintéticos son la clave para hacer que el aprendizaje automático de la Inteligencia Artificial sea más rápido, y que se adopten algoritmos de la IA en nuestro día a día. Hacemos un repaso por las principales utilidades de estos datos y sus ventajas.

Muchos expertos creen que los datos sintéticos son la clave para hacer que el aprendizaje automático de la Inteligencia Artificial sea más rápido y que se adopten algoritmos de la IA en nuestro día a día.

Los datos sintéticos son datos artificiales fabricados por ordenadores, que los recopila de situaciones del mundo real. Estos datos son anónimos, y se crean con parámetros de cada usuario para que estos se asemejen al mundo real.

Por ejemplo, se pueden crear datos sintéticos con los datos reales pero sin utilizar nombres, correos electrónicos, números de seguridad social o direcciones de esos datos. Los modelos generativos pueden aprender datos reales así como crear datos que sean parecidos a estos.

Estos datos sintéticos tienen muchas utilidades, entre ellas minimizar el tiempo, el coste y el riesgo de las operaciones. Los datos sintéticos tienen un gran potencial para las máquinas de aprendizaje profundo y los algoritmos de IA.

Google, Amazon y Facebook tienen una ventaja considerable gracias a la cantidad de datos que crean a diario. Y es que la creación de datos sintéticos es más rentable que la recopilación de datos del mundo real la mayoría de las veces, y además algunas investigaciones evidencian que es posible obtener los mismos resultados utilizando datos sintéticos que datos de la realidad.

El problema de los datos sintéticos es que es difícil crear datos de gran calidad. Si estos datos no son muy parecidos a los datos reales, se perderá calidad. Como son réplicas de propiedades específicas de un conjunto de datos reales, algunos comportamientos aleatorios pueden pasar desapercibidos.

Los datos sintéticos pueden servir a nivel de registro para organizaciones médicas, para informar sobre los protocolos de atención y que la privacidad de los datos del paciente sea esencial.

La inteligencia artificial, el arma de doble filo que tiene en vilo a los expertos en ciberseguridad

Otra aplicación que se le puede dar a los datos sintéticos es en los sistemas de detección de actividad fraudulenta, donde se pueden probar y así no exponer registros financieros personales.

También en los equipos de DevOps para probar su software, así como en los algoritmos de aprendizaje. Waymo probó sus vehículos autónomos en carreteras simuladas.

Es decir, los datos sintéticos son una importante herramienta, sobre todo para la Inteligencia Artificial, que aumenta los algoritmos de aprendizaje automático cuando los datos reales son muy costosos de conseguir, o tienen difícil acceso.

Vía | Forbes

Sobre el autor de este artículo

Alicia Ruiz Fernández