Apple anuncia que busca ser “responsable” en entrenamiento de modelos de IA

Apple asegura que entrenó su modelo de IA de manera “responsable”

A través de un documento técnico que detalla los modelos que Apple desarrolló para impulsar Apple Intelligence, la empresa rechaza las acusaciones de utilizar datos privados de los usuarios. Además, aseguró que se basó en una combinación de datos públicamente disponibles y autorizados para Apple Intelligence.

La compañía fue acusada de utilizar un conjunto de datos llamado The Pile el cual contiene subtítulos de cientos de miles de videos de YouTube que fueron utilizados para entrenar un conjunto de modelos diseñados para el procesamiento en el dispositivo. Esto provocó la reacción de cientos de creadores de contenido en YouTube que afirmaron no haber dado su consentimiento.

En el documento técnico, la firma fundada por Steve Jobs asegura que los datos de entrenamiento para los modelos, llamados Apple Foundation Models (AFM) se obtuvieron de manera “responsable”. “El conjunto de datos de preentrenamiento consta de datos que hemos obtenido bajo licencia de editoriales, conjuntos de datos seleccionados de acceso público o de código abierto e información de acceso público rastreada por nuestro rastreador web, Applebot”, afirma Apple en el artículo. “Dado nuestro enfoque en la protección de la privacidad del usuario, observamos que no se incluyen datos privados de usuarios de Apple en la mezcla de datos”, agrega.

Los modelos AFM incluyen datos web disponibles públicamente, así como datos con licencias no reveladas. En cuanto a las fuentes autorizadas, Apple se puso en contacto con varios medios, entre ellos, NBC, Condé Nast e IAC, para cerrar acuerdos plurianuales por un valor de al menos 50 millones de dólares para entrenar modelos con los archivos de noticias. Por otro lado, surge polémica por los datos extraídos del código abierto.

“Nuestros modelos se han creado con el propósito de ayudar a los usuarios a realizar actividades cotidianas en sus productos Apple, basados en los valores fundamentales de Apple y arraigados en nuestros principios de IA responsable en cada etapa”, asegura Apple en el documento.

Pero, el artículo no precisa demasiados detalles sobre la información adicional proveniente del código abierto. Sin embargo, Apple señala que los usuarios pueden bloquear el rastreo de sus propios datos. Aunque esa no es siempre una situación viable para los usuarios quienes muchas veces tienen su contenido en un sitio que se niega a bloquear el rastreo de datos de Apple.

Frente a esta polémica, la carrera de Apple por posicionarse en el mercado de la inteligencia artificial no está desprovista de obstáculos. La firma debe tener en cuenta, al igual que muchas otras empresas, el escrutinio legal que puede implicar el desarrollo de la IA.