LA TADEO DEARTE 9 N.º 12 - 2023

IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD

IA GENERATIVA

DE IMÁGENES Y

LOS PROBLEMAS

DE LA

CREATIVIDAD

Lucia Santaella *

Fecha de recepción: 30 de junio de 2023 Fecha de aceptación: 11 de marzo de 2024

245 245/

* Doctora en Teoría de la Literatura por la PUCSP. Investigadora

1A del Consejo Nacional de Desarrollo Científico y Tecnológico

(CNPq). Profesora titular en el posgrado en Comunicación y

Semiótica y en Tecnologías de Inteligencia y Diseño Digital

de la Pontificia Universidad Católica de São Paulo (PUC-SP),

Brasil.

lbraga@pucsp.br | https://orcid.org/0000-0002-0681-6073

Sugerencia de citación: Santaella Lucia. IA generativa de imágenes y los problemas de la creatividad. La Tadeo DeArte 9, n.° 12,

2023: 1-21. https://doi.org/10.21789/24223158.2025

IMAGE

GENERATIVE

AI AND THE

ISSUES OF

CREATIVITY

AÍDA MANRIQUE LÓPEZ, JULLY ANDREA HERRERA JARAMILLO

LA TADEO DEARTE 9 N.º 12 - 2023

IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD

LA TADEO DEARTE 9 N.º 12 - 2023

Desde que se puso en manos de los usuarios, el im-

pacto que ha causado la IA generativa ha sido intenso.

Conformada por sistemas que van desde ChatGPT hasta

sistemas de producción de imágenes, todos ellos son

activados por comandos verbales de los usuarios que

inician procesos de diálogo entre humanos y máquina.

Este artículo tiene como objetivo discutir la IA genera-

tiva de imágenes y, con ella, el retorno de cuestiones

estéticas relacionadas con la autoría, la creatividad, la

originalidad y la autonomía que ahora reaparecen bajo

nuevas formas.

RESUMEN

>>>>>>

Palabras clave:

IA generativa; au-

toría; creatividad;

originalidad; auto-

nomía; arte.

247 247/

LUCIA SANTAELLA

ABSTRACT

>>>>>>

Since it was first made available to users, generative AI

has impacted the world greatly. Generative AI, which

includes systems like ChatGPT and other image-producing

interfaces, is activated by verbal commands with which

humans initiate dialogue processes with the machine. This

article aims to discuss image-generative AI and the return of

aesthetic issues, such as authorship, creativity, originality

and autonomy, which are now resurfacing in new shapes.

Keywords:

generative AI;

authorship;

creativity;

originality;

autonomy; art.

LA TADEO DEARTE 9 N.º 12 - 2023

IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD

INTRODUCCIÓN

Basado en fuentes teóricas y críticas sobre el papel que juega la crea-

tividad, especialmente la artística, en la vida sociocultural, y apoyado en

un método argumentativo, este artículo tiene como objetivo cuestionar los

dilemas que la inteligencia artificial generativa (IAG) aporta al concepto de

creatividad y otros similares. La discusión sobre el tema se caracteriza por

acaloradas controversias, desde 2021, cuando la IAG fue puesta directamen-

te en manos de los usuarios por la start-up Open AI, financiada por Microso,

entre otros lanzamientos.

La IAG corresponde con el estadio en que se encuentra hoy la investiga-

ción en inteligencia artificial (IA) que comenzó hace setenta años. Pero hubo

muchos altibajos antes de que la IA lograra el éxito hace pocas décadas. Este

desarrollo se debe a un salto del paradigma informático de los algoritmos

que ejecutan los pasos prescritos por la programación a los algoritmos que

están capacitados para aprender. Esto fue posible por una serie de razones,

incluido el aumento de la escalabilidad de las computadoras y el incremen-

to cada vez más gigantesco del volumen de datos que se concentraron en

manos de los que ahora se denominan grandes Tecs (Amazon, Facebook,

Microso, Twitter, etc.). Pero el gran protagonista del salto computacional

responsable del éxito de la IA es el Machine Learning, en especial la técnica

del Deep Learning, impulsada por redes neuronales que imitan —solo imitan,

ya que no pueden copiar— el funcionamiento de las redes neuronales de

nuestro cerebro (Russel y Norvig 2010).

Antes del auge de la IAG, la IA se entendía como modelos de aprendi-

zaje automático que pueden aprender a hacer predicciones basadas en

datos. Algunos ejemplos son modelos entrenados en millones de datos para

predecir si una radiografía determinada muestra signos de un tumor o si es

probable que un prestatario determinado no pague un préstamo. La IAG,

sin embargo, constituye un nuevo nivel de la IA. Según Zewe (2023), la IAG es

un modelo de aprendizaje automático entrenado para crear nuevos datos,

en lugar de hacer una predicción sobre un conjunto de datos específico. Un

sistema IAG es aquel que aprende a generar más objetos que se parecen a los

datos con los que fue entrenado. En definitiva, IAG se refiere a modelos de

aprendizaje profundo capaces de generar texto, imágenes y otros contenidos

de alta calidad a partir de los datos con los que fueron entrenados (IBM).

Aunque la IAG no se limita a la producción de textos, fue y sigue siendo

intensa la agitación que el ChatGPT está creando en el mundo, lamentable-

mente acompañada de incesantes malentendidos. Antes de dar una opi-

nión o incluso evaluar, es necesario buscar comprender. Por lo tanto, esta

discusión empieza con una introducción didáctica al ChatGPT que tiene en

mira poner algunas preguntas en sus lugares apropiados. En verdad, fue su

explosión lo que retroactivamente llamó la atención sobre los sistemas de

producción de imágenes que se lanzaron en 2021. Es a estos sistemas de

imágenes a los que será dedicada la atención de este artículo.

249 249/

LUCIA SANTAELLA

¿QUÉ ES EL CHATGPT?

Avances en la investigación de la IA que impulsaron al ChatGPT:

1. Las redes neuronales de aprendizaje profundo son unidades de proce-

samiento en capas interconectadas. ¿Qué hacen? Reconocer patrones

en grandes volúmenes de datos.

2. Un avance destacable en Deep Learning que desembocó en el ChatGPT

es el que tuvo lugar en Natural Language Processing (NLP), gracias a un

tipo especial de redes neuronales, las denominadas Large Language

Models, utilizadas en traducciones, Chat Bots, etc. ¿Qué hacen ellas?

Algoritmos que aprenden a hacer asociaciones probabilísticas entre

miles de millones de palabras y frases que les permiten generar textos,

traducir, responder preguntas, resumir textos, etc.

3. ¿Qué les permite hacer esto? Se trata de un algoritmo probabilístico de

un tipo especial llamado Transformer, lanzado en 2017, y un modelo muy

copiado, Bert, de Google, en 2018, que permite entrenar los algoritmos

en varios procesadores paralelos.

4. Así nació la familia de transformadores (transformador generativo pre-

entrenado) que dio origen a la IAG. Esto provocó un gran avance en la IA,

que saltó de la IA predictiva que operaba hasta entonces, pasando su

centro a la IAG que está en la base de ChatGPT. La familia comenzó con

GPT-1, luego 2, 3, 3.5, este sobre la base del ChatGPT lanzado a fines de

noviembre de 2022, y actualmente ChatGPT4 (Deep Learning Book 2023;

Davenport y Mittal 2022).

LA TADEO DEARTE 9 N.º 12 - 2023

IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD

ChatGPT-3.5 o 4 no es el único fruto de la IAG. Es necesario diferenciar algunos árboles del

bosque. En 2022 se lanzaron varias IAGs de imagen. Hay cuatro aplicaciones que más se han uti-

lizado para este tipo de traducción. DALL E fue creado por la empresa estadounidense Open AI.

Lanzado en 2021, es pionero en el género y actualmente se encuentra en su segunda versión más

potente. Midjourney, por otro lado, es un algoritmo de imágenes generativas desarrollado por un

laboratorio de investigación independiente del mismo nombre. Tiene varias versiones disponi-

bles a través de un modelo freemium, pero, a diferencia del DALL E, solo se accede a través de una

extensión de la aplicación Discord llamando y enviando mensajes de texto.

En agosto de 2022 se lanzó Stable Diusion, también una herramienta de IA para imágenes.

El algoritmo se distingue de los demás en que sus desarrolladores ponen a disposición su código

fuente y el recurso funciona de forma totalmente gratuita. Otra diferencia con relación a DALL-E y

Midjourney es el hecho de que la versión completa de Stable-Diusion hace su procesamiento en

la máquina del usuario, mientras que las demás recurren al procesamiento en la nube. El sistema

de Google, por su parte, es Imagen. Estos modelos también tienen sus fundamentos técnicos en

Transformer, que es el más utilizado en el procesamiento del lenguaje natural. Pero, en el caso

de las imágenes, funcionan a través de una red neuronal basada en la tecnología Diusion Models

(modelos de difusión), que utiliza el aprendizaje multimodal para conectar la semántica entre

textos e imágenes. La familia de modelos de difusión es muy poderosa con un rendimiento récord

en muchas aplicaciones, incluida la síntesis de imágenes, la generación de videos y el diseño de

moléculas (Díaz 2022).

El gran avance detrás de los nuevos modelos está en la forma en que se generan las imáge-

nes. La primera versión de DALL E utilizó una extensión de la tecnología detrás del modelo de

lenguaje GPT-3 de Open AI, produciendo imágenes al predecir el siguiente píxel en una imagen

como si fueran palabras en una oración. En cambio, el DALL E 2 usa el modelo de difusión que se

presenta como redes neuronales entrenadas para limpiar imágenes eliminando el ruido pixelado

agregado por el proceso de entrenamiento. El proceso consiste en tomar fotos y cambiar algunos

píxeles a la vez, en varios pasos, hasta que se borran las imágenes originales y no quedan más

que píxeles aleatorios. Luego, la red neuronal se entrena para revertir este proceso y predecir

cómo se vería la versión menos pixelada de una imagen dada. El resultado es que, si se le da un

desorden de píxeles a un modelo fuzzy, él intentará generar algo un poco más limpio. Volviendo

a conectar la imagen limpia, el modelo producirá algo aún más limpio. Este proceso de actua-

lización elimina gradualmente el ruido de la imagen hasta que se parece mucho a la imagen de

destino.

Según Mali (2023), la destreza de DALL E surge de su extenso entrenamiento en un conjunto

de datos masivo que contiene pares texto-imagen. Este conjunto de datos abarca una amplia

gama de imágenes, desde fotografías realistas hasta pinturas abstractas. Esta vasta formación

dota a DALL E de la capacidad de comprender las relaciones estadísticas entre texto e imágenes.

Como resultado, DALL E tiene la capacidad de generar imágenes realistas y creativas, puede

adaptarse a diferentes estilos según la descripción del texto proporcionada, ofreciendo una hete-

rogénea gama de posibilidades artísticas.

Todos los modelos de texto-imagen se denominan multimodales porque producen imágenes

a partir de los comandos verbales de los usuarios. Aunque los distintos modelos lograron buenos

LAS CATEGORÍAS

DE IAG

251 251/

LUCIA SANTAELLA

resultados, el que ganó gran notoriedad fue, de hecho, Stable Diusion. Hay básicamente dos

maneras de hacer que funcione. Uno de ellos se llama “palabra a imagen”: simplemente se des-

cribe una escena, el soware lee lo escrito y genera una imagen. El otro modo se llama “imagen

a imagen”, cuando el usuario agrega una imagen para cambiarla. Estos cambios son de varios

tipos, como, por ejemplo, cambiar el fondo, añadir elementos, cambiar colores y otras posibilida-

des. Todo lo que se necesita es que el usuario esté dispuesto a experimentar. También es posible

cambiar la imagen de un borrador. Para ello, se coloca una máscara sobre la imagen mostrando

lo que se quiere cambiar. También puede aumentar la resolución de una imagen. El programa

todavía es capaz de unir imágenes, formando una composición (Bonfim 2022).

Con todo eso, las puertas estaban abiertas de par en par para la IA generativa. Open AI re-

gistró un millón de usuarios en solo 2,5 meses. Más de un millón de personas comenzaron a usar

Stable Diusion a través de su servicio pago Dream Studio en menos de la mitad de ese tiempo;

muchos más usaron Stable Diusion a partir de aplicaciones de terceros o instalaron la versión

gratuita en sus propias computadoras. El ritmo de desarrollo de estos modelos ha sido impre-

sionante. En solo unos meses, la tecnología inspiró cientos de titulares de periódicos y portadas

de revistas, llenó las redes sociales con memes, puso en marcha una máquina de propaganda y

provocó una intensa reacción.

De gran valor como una documentación de los primeros impactos que tuvo la IAG en artistas

y diseñadores son los testimonios que Will Douglas Heaven (2022) publicó en MIT Technology

Review. Son testimonios de hecho importantes para comprender la efervescencia entre los

artistas, especialmente en lo que se refiere a la agencia y autonomía de sus producciones. Si bien

las aplicaciones de IA como ayudas creativas ya se habían incorporado a los sistemas artísticos

desde al menos el año 2020 (West y Burbano 2020) con la IA generativa, los artistas se vieron

involucrados en una de las mayores convulsiones en una generación.

Los creadores quedaron desconcertados, dice Allen Stevenson, un artista digital con sede

en California que ha trabajado en estudios de efectos visuales como DreamWorks: “Para perso-

nas con capacitación técnica como yo, es bastante desalentador. Eres como, ‘Oh, Dios mío, eso

es todo mi trabajo’. Entré en una crisis existencial durante el primer mes de usar DALL E”. Pero

mientras algunos todavía se están recuperando del impacto, muchos, incluido Stevenson, están

encontrando formas de trabajar con estas herramientas y anticipar lo que viene después (cf.

Heaven 2022).

Para Chad Nelson, un creador digital que ha trabajado en videojuegos y programas de tele-

visión, las plantillas de texto a imagen son una innovación única en la vida. “Esta tecnología lo

lleva de un destello en su cabeza a un primer borrador en segundos”, dice. “La velocidad a la que

puedes crear y explorar es revolucionaria, más allá de lo que he experimentado en 30 años” (cf.

Heaven 2022).

Paul Trillo, un artista digital y de video que también vive en California, cree que la tecnología

hará que sea más fácil y rápido generar ideas para efectos visuales. “La gente dice que esta es la

muerte de los artistas de efectos especiales o la muerte de los diseñadores de moda”, pero “no

UNA ESCENA

EN EBULLICIÓN

LA TADEO DEARTE 9 N.º 12 - 2023

IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD

creo que sea la muerte de nada. Creo que significa que no tenemos que trabajar por la noche y los

fines de semana” (cf. Heaven 2022).

Stevenson también testifica que ha experimentado DALL E en cada paso del proceso que uti-

liza un estudio de animación para producir una película, incluido el diseño de personajes y entor-

nos. “Con la DALL E, puedo hacer el trabajo de múltiples departamentos en cuestión de minutos.

Es alentador para todas las personas que nunca pudieron crear porque era demasiado costoso o

demasiado técnico”, dice. “Pero da miedo si no estás abierto al cambio” (cf. Heaven 2022).

Nelson, por su parte, cree que hay más por venir. Eventualmente, él ve que esta tecnología

será adoptada no solo por los gigantes de los medios, sino también por las firmas de arquitectu-

ra y diseño. Pero ella aún no está lista. “Ahora es como si tuvieras una caja mágica, un pequeño

mago”, continúa. “Esto es excelente si solo desea seguir generando imágenes, pero no si necesita

un socio creativo. Si quiero crear historias y construir mundos, esa pareja necesita tener más

conciencia de lo que estoy creando” (cf. Heaven 2022).

Las empresas de fotografía de archivo están adoptando posiciones diferentes. Getty prohibió

las imágenes generadas por IA. Shutterstock firmó un acuerdo con Open AI para incorporar DALL

E en su sitio web y dice que iniciará un fondo para reembolsar a los artistas cuyo trabajo se utilizó

para entrenar a los modelos.

Los modelos fueron probados durante unos meses. Pasado el momento de sorpresa y expe-

rimentación, dado que los modelos se alimentan de miles de millones de imágenes ya producidas

por humanos, los artistas comenzaron a reivindicar la autoría y propiedad intelectual de imáge-

nes consideradas muy similares a las de su propia creación (Butterick 2023). Estas contradiccio-

nes, que involucran todas las cuestiones complejas sobre la creatividad, la autoría, los derechos

de autor y la autonomía, exigen ponderaciones y evaluaciones que un método argumentativo nos

ayudará a discutir a continuación.

253 253/

LUCIA SANTAELLA

IA Y ARTE ANTES DE

LA IA GENERATIVA

Es necesario considerar que el concepto de crea-

tividad presenta una variedad de interpretaciones y

significados, así como existen tipos de creatividad: an-

tropológica, psicológica, histórica y metafísica. Por tan-

to, la creatividad no se limita al arte y el diseño, ya que

también puede manifestarse en la ingeniería, la ciencia

e incluso en el mundo empresarial. Sin embargo, es en

los distintos territorios del arte donde la creatividad se

manifiesta de forma más dominante. Esto no implica

caer en la concepción romántica del artista impulsa-

do por la inspiración, pues toda producción artística

presupone el desarrollo de habilidades específicas, el

dominio de medios e instrumentos, el aprendizaje de

materiales y técnicas, además de los conocimientos

teóricos que surgen de una práctica extensa (Hutson

2023).

Dado que los medios utilizados por artistas y dise-

ñadores cambian históricamente, y cada vez que surgen

nuevos materiales y tecnologías, el concepto de crea-

tividad se pone en duda. No sorprende, por tanto, que,

antes de la disrupción provocada por la IAG, las aplica-

ciones de IA utilizadas en el arte ya estuvieran acompa-

ñadas de interrogantes y la consiguiente implosión de

certezas previas “sobre temas, significados y narrativas

involucradas en conceptos como la creatividad”, obra

de arte, juicio de expertos y formación de cánones”

(Arielle y Manovich 2022a, 18). Lamentablemente, por

regla general, las preguntas tienden a seguir una ten-

dencia que conviene evitar, es decir, olvidar e ignorar

las transformaciones tecnológicas en los procesos

productivos y de creación visual y sonora que prece-

dieron y condujeron hasta el punto donde se produjo

el surgimiento de la IA y su uso en procesos creativos.

Argumentan Arielle y Manovich (2022a, 7):

Para comenzar, debemos considerar el hecho de

que todo el trabajo creativo en medios y diseño

hoy en día se lleva a cabo en un entorno digital,

es decir, implica el uso de soware, servicios

y recursos en línea apropiados. Los creadores

tienen acceso instantáneo a numerosos trabajos

realizados por otros a través de las redes sociales

y sitios especializados para compartir arte, foto-

grafía, video y música (ej., DeviantArt, Art Station,

Behance, SoundCloud), así como a sitios web

con archivos multimedia, plantillas, y efectos (ej.,

Shutterstock, Adobe Stock y un sinfín de otros).

Sin ir muy lejos, es necesario recordar que las

alianzas con las máquinas computacionales ya estaban

vigentes en los modelos 3D con el uso de algoritmos

que simulan efectos de fuentes de luz, sombras, niebla,

transparencia, translucidez, texturas, profundidad

de campo, movimiento. desenfoque, etc. Pero, para

permanecer dentro del paradigma de la IA —antes de la

IAG—, las creaciones y discusiones sobre sus diversos

aspectos dentro y fuera del mundo académico han sido

frecuentes en muchos países y también en Brasil.

En el campo de la IA y el arte, Sergio J. Venâncio

Júnior (2019) publicó un artículo en el que propone una

reflexión sobre las obras de arte equipadas con IA, des-

tacando cuestiones como la autonomía y la creatividad.

En primer lugar, se ofrecen algunos trabajos a modo

de ejemplo, para discutir el problema de la autonomía

creativa bajo el cual comúnmente se interpretan estas

iniciativas. Las referencias de los algoritmos evolutivos

y la cibernética culminan en un modelo particular para

analizar obras en términos de sintaxis, semántica y

pragmática. Tal modelo ofrece una posible segmenta-

ción del espectro de la creatividad humana, al tiempo

LA TADEO DEARTE 9 N.º 12 - 2023

IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD

que aclara algunos desafíos para el desarrollo de

máquinas creativas. Finalmente, se presenta una pro-

puesta artística que utiliza recursos de IA para generar

dibujos, trayendo una situación en la que la máquina

influye, interfiere y redefine un proceso creativo que

diluye las intenciones del artista.

Entre algunos artistas radicados en Brasil

(Santaella 2021), es bastante significativo el trabajo

creativo y conceptual de Baio (2022, 106) sobre la

dimensión estética de la IA, que, según el autor, “pone

en tela de juicio, por un lado, cómo se representa la IA y

cómo crea un imaginario en relación con la tecnología.

Por otro lado, también cómo suceden los procesos au-

tomatizados de mediación y producción de sentido, que

interpretan datos para informar formas de ver y sentir”.

Para Craig (2022, VI-XI), soportes como la IA, el

aprendizaje automático, los sistemas locativos, la

realidad mixta, virtual y aumentada, la computación en

la nube y las tecnologías ubicuas son hoy constitutivos

de una cultura computacional que permite la expansión

de la creatividad humana. Pocas tecnologías han tenido

tanto impacto en la creatividad como la IA en tan poco

tiempo, dando como resultado prácticas innovadoras

acompañadas de análisis académicos y críticas sobre

sus antecedentes e influencias. Craig nombró a este

contexto IA creativa para, desde un punto de vista

centrado en el ser humano, abarcar, por ejemplo, arte

robótico, obras de arte de IA distribuidas en sitios,

artistas de IA, músicos artificiales, imágenes sintéticas

generadas por redes neuronales, autores de IA y bots de

periodistas.

Arielle y Manovich (2022b) publicaron un artículo

muy provocativo con el siguiente título: “AI-estética

y el mito antropocéntrico de la creatividad”. El texto

comienza con una afirmación relativamente obvia, a sa-

ber: “Desde principios del siglo XXI, la computación, el

análisis de datos y la inteligencia artificial han ingresa-

do gradualmente al ámbito estético”, acompañando to-

das las transformaciones en el universo digital e incluso

ingresando al campo del bioarte, mediante el uso de

algoritmos genéticos (Santaella 2004). Hoy en día, como

atestiguan muchos artistas y críticos de arte y cultura,

la IA se utiliza cada vez más para generar nuevos tipos

de artefactos sintéticos, que incluyen, por supuesto,

obras de arte, música, diseños y textos.

AUTORÍA,

CREATIVIDAD Y

ORIGINALIDAD EN

EL ARTE DE LA IA

En un texto publicado en Springer Series on Cultural Computing (Santaella 2022), argumenté

que el surgimiento de la fotografía, seguido de los recursos electrónicos y computacionales, y lue-

go de la multiplicidad de posibilidades que abre al artista el universo digital, constituye supues-

tos fundamentales de continuidad para comprender las alianzas tecnológicas que los artistas

han buscado durante al menos dos siglos y que hoy culminan en la IA. Esto no significa buscar un

punto de llegada que minimice la importancia de las discusiones en torno al tema de la IA —que

es nuevo—, sino, en primer lugar, repetir que, desde la invención de la fotografía, cada vez que se

incorpora una nueva tecnología en el trabajo artístico, esto provoca un retorno de las discusiones

sobre el estatus del arte, la autoría y la creatividad.

255 255/

LUCIA SANTAELLA

Precisamente por eso, lo que el artículo pretendía, en segundo lugar, era plantear argumen-

tos que pudieran llevar la discusión al campo específico de los nuevos desafíos que la IA está tra-

yendo a la creatividad humana. El interés del artículo, por tanto, era mostrar que, en el campo de

las artes, con la IA, asistimos al surgimiento de un nuevo modo de producción creativa y artística

que ha sido incorporado por los artistas y que despierta el interés de teóricos y críticos de la cul-

tura y las artes. Inseparable de la discusión sobre autoría y creatividad es el no menos complejo y

controvertido concepto de originalidad. En palabras de Arielle y Manovich (2022b):

¿Qué tipo de recombinación de ideas, analogías inusuales y conexiones conceptuales se

consideran el sello distintivo de la originalidad? ¿A quién debemos atribuir la autoría si un

artefacto o imagen es producto de dispositivos, algoritmos y extensiones tecnológicas

que generan y reinterpretan la intención de un artista o diseñador? Dado que la cadena de

producción está mediada por intervenciones de soware de terceros cada vez más complejas

(como efectos y filtros de fotos y videos o algoritmos de retoque), ¿cómo determinar dónde se

ha producido la innovación creativa y quién es su autor?

Los autores también afirman que, cada vez que se alcanza un hito tecnológico, el rayo parece

ir más allá, pero siempre relacionado con los supuestos habituales a la hora de utilizar y atribuir

conceptos como inteligencia y creatividad. El encuentro entre la IA y la estética es aún más crucial

porque el arte se considera un dominio esencialmente humano, y su intratabilidad y complejidad

no parecen ser susceptibles de reducción algorítmica. Mucha gente considera el arte, la estética

y la creatividad el colmo de las capacidades humanas; son, por tanto, vistas como la última barri-

cada contra los avances en IA, por lo que está a una distancia muy grande de lo que los avances

tecnológicos pueden reproducir.

Según los autores, consideramos que los humanos son creativos y negamos este carácter

a la IA porque entendemos relativamente cómo funciona la IA, pero no entendemos lo suficien-

te cómo funcionan los humanos. Por lo tanto, a menudo se sobreestima la creatividad como

facultad humana simplemente porque no entendemos cómo funciona, y reemplazamos esta falta

de comprensión con una concepción típicamente romántica de la intuición creativa. También es

muy relevante recordar que la idea de la creatividad pura parte de una exaltación de la auto-

nomía individual que solo se consolidó en la modernidad. En radical contraste, en Platón, por

ejemplo, el artista es expulsado de la República por no ser más que un simple imitador.

Uno de los puntos más altos del texto de Arielle y Manovich (2022b) se encuentra en el diag-

nóstico de que nuestra percepción de la IA y sus avances tiende a ser marcada —como lo fue la

llegada de la computadora— desde una perspectiva antropocéntrica de agencia y creatividad.

Una perspectiva, además, difícil de superar, porque la superación supondría descentrar lo hu-

mano de su pretendida soberanía exclusivista. Esta pretensión ha obstruido el camino necesario

“ya trazado por las teorías poshumanas clásicas, como en los trabajos de Donna Haraway y Rosi

Braidotti, o por la propuesta de Bruno Latour de “reensamblar lo social” mediante la inclusión de

entidades humanas y no humanas, abarcando no solo agentes naturales no humanos (animales o

plantas), sino también artificiales” (Arielle y Manovich 2022b).

El tema del descentramiento humano ha ocupado el pensamiento de los teóricos de la

cultura y especialmente está en el núcleo de las preocupaciones de los académicos involucrados

en el tema del Antropoceno. Pero el problema no es tan nuevo como puede parecer. Ya comen-

zó con los debates sobre lo poshumano, en la década de 1990, centrados especialmente en las

transformaciones introducidas en el cuerpo humano y la ontología del humano por la aparición

de prótesis que cuestionaban radicalmente los viejos límites entre lo natural y lo artificial (Hayles

1999). Los debates continuaron en la entrada del siglo XXI con nuevas discusiones sobre el giro de

lo no humano (Grusin 2015; Santaella 2017) cuya paternidad los autores buscaban, de hecho, en

el parlamento de las cosas de Bruno Latour (1994; Lemos 2013; Amaral 2015).

Ante todo esto, se ha instalado un nuevo escenario de crítica cultural en simultáneo con el

uso de las aplicaciones de IA como aliadas de la creación artística, especialmente en el campo

de la música. A pesar de las trabas conservadoras que siempre se imponen, las relaciones entre

la IA y el arte, el diseño y la economía creativa ya tendían hacia un consenso relativo en artistas,

críticos y curadores de arte expertos, hasta que surgió la IA de imágenes generativas que traía

de vuelta los problemas con una nueva forma, temas debatidos repetidamente, al menos desde

Duchamp, pero rodeados ahora de mucha confusión tanto teórica como práctica.

LA TADEO DEARTE 9 N.º 12 - 2023

IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD

La confusión no es accidental. La introducción, en los espacios expositivos consagrados,

de objetos prosaicos recopilados de la vida cotidiana, tuvo un sabor revolucionario debido al

cuestionamiento que estos objetos provocaron sobre el concepto de arte. Sin embargo, por revo-

lucionario que fuera, no dejaba de estar relacionado con las estrictas existencias y experiencias

humanas y contextos igualmente humanos. Lo que la IA ya aportó como novedad y la IAG destaca

es el hecho de que el humano ya no es el agente exclusivo, sino que se le suma un nuevo socio no

humano. En este caso, ¿el producto resultante seguirá siendo considerado “arte”? (Hutson 2023).

De hecho, tanto el texto de Arielle y Manovich (2022b) como otros de la misma época llegaron

antes de la IAG, que provocó un tsunami precisamente porque dio lugar a un tema crucial que

hasta ahora ha sido poco explorado: el de la autonomía. Cuando, bajo la acción de un comando

verbal, un sistema artificial es capaz de producir una imagen o un vídeo, es la competición no

sólo con la creatividad, sino, sobre todo, con la autonomía humana la que entra en juego.

Desde la llegada de la cultura informática, la producción práctica y teórica de Lev Manovich

es inmejorable, especialmente porque su competencia en informática le permite investigar los

problemas desde dentro. Tan cierto es que, avant-la-lettre, Manovich ha publicado varios artícu-

los sobre la estética de la IAG desde 2023. En el primero de ellos, en coautoría con Arielle (2023),

los autores inician los siete argumentos sobre la IA de imágenes y medios generativos declarando

que estas imágenes “son artefactos culturales genuinamente nuevos con contenido, estética y

estilos nunca vistos”.

A diferencia de las imágenes tradicionales, las generativas no parten de borradores o boce-

tos, ni dependen de cámaras que captan, a través de dispositivos sensoriales, imágenes percepti-

blemente visibles. Tampoco se crean a partir de modelos computacionales, es decir, las imágenes

infográficas cuya aparición provocó tanta euforia en la década de 1980. Las imágenes generativas

de IA, por el contrario, se producen intersemióticamente a partir de comandos verbales que dis-

paran gigantescas bases de datos de imágenes extraídas, en la medida de lo posible, del registro

existente de la historia visual humana. Por tanto, según Aurielle y Manovich (2023), el resultado

saca a la luz géneros, estilos y procesos del pasado.

Hay, por tanto, un interesante juego de pasado y presente. Si bien el acto real de producir y

crear la estética generativa es distinto del pasado, por otro lado, es el gigantesco pasado visual

disponible el que pasa a primer plano. En este juego, sin embargo, hay una similitud relevante con

la forma de crear a partir de un pasado relativamente reciente, relacionado con el modernismo

de las décadas de 1910 y 1920, de un vasto universo de medios visuales que se fue expandiendo a

AUTORÍA Y AUTONOMÍA

TRAS LA IAG

257 257/

LUCIA SANTAELLA

medida que aparecía en el ensamblaje y el collage. En este sentido, “las IAGs continúan, cierta-

mente a mucha mayor escala y aprovechando la automatización, las técnicas creativas de combi-

nación de imágenes y medios preexistentes”, algo que ya se había anticipado a menor escala de

automatización en el arte producido a partir de bases de datos (Manovich 1998).

La diferencia con las imágenes generativas ahora, como nos recuerda Manovich, es que la

imaginación del artista no se deja asfixiar por el ruido gigantesco del pasado, ni caer en la seduc-

ción de lo que parece estar ya listo. Es precisamente al tema de la copia y el estereotipo al que

Manovich (2023) dedica su artículo sobre el hecho de que las imágenes que resultan de la IA gene-

rativa dependen completamente del comando dado. Ellas pueden parecer estereotipadas como

quiere Manovich, pero mi explicación sobre esto es que, ante el gigantesco banco de imágenes

con el que fueron formadas, la tendencia es la misma que prevaleció en la era del apogeo de la

comunicación de masas, es decir, el aplanamiento por la media. Por lo tanto, deshacerse de esto

depende no solo de la imaginación, sino también del conocimiento previo del artista y diseñador

de estilos y patrones más inusuales del pasado para forzar las reacciones de traducción del sis-

tema más allá del estereotipo. Así es que Manovich tiene razón cuando afirma que las imágenes,

innovadoras o no, tienden a presentar composiciones perfectamente equilibradas, hermosas

paletas de colores y líneas y formas que crean patrones rítmicos.

Sin embargo, el sistema no es mágico. Hay límites que el artista debe superar. Entre los

límites, Manovich enfatiza la tendencia a la previsibilidad y al lugar común, hasta el punto de que

es difícil que las imágenes escapen a una apariencia puramente kitsch, no en el sentido de mal

gusto, sino en el de una imaginería desgastada. Las declaraciones de Manovich contienen los

juicios respetables de un artista experimentador. Sin embargo, muchos no estarían de acuerdo

con su comparación de imágenes generativas con un arte de copiar.

Gopnik (2023) piensa diferente cuando dice que los sistemas como el DALL E 2 no funcionan

con luces y sombras; operan en la historia del arte, en la reserva casi inagotable de imágenes en

las que se forman. Y el poder de las imágenes radica en sus ambigüedades. “Mirando las imáge-

nes, podemos quedar fascinados por las atmósferas y las incertidumbres”, expresa. De hecho,

todo depende del diálogo creativo que se produce entre el artista y el sistema cuando se insiste

en la improbabilidad y en lo que aún no se ha visto, lo que puede resultar en criaturas quiméricas

y mundos imposibles.

De hecho, no se puede, por lo mismo, estar de acuerdo con que el arte producido con la

mediación da la IAG sea el producto de una mera copia. Prefiero llamarlo un arte de traducciones

intersemióticas sin precedentes entre la sabiduría visual contenida en los comandos y el poder

de juicio del artista sobre los resultados obtenidos como respuestas. Se trata, sobre todo, de tra-

ducciones intersemióticas del verbo a la imagen que dependen de la paciencia y la insistencia del

artista hasta cumplir su deseo de creación. El hecho de ser una máquina la que responde al deseo

no roba, sino que, por el contrario, obedece al deseo creador, cuya autonomía pertenece única y

exclusivamente al artista.

LA TADEO DEARTE 9 N.º 12 - 2023

IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD

PARA CONCLUIR

Ninguna tecnología del lenguaje ha desaparecido en el horizonte desde que se inventaron la

fotografía y el fonógrafo. Las que desaparecieron, por ejemplo, el telégrafo y luego el fax, fueron

sustituidas por tecnologías más eficientes, pero con las mismas funciones. En el caso actual de

la IAG para la producción de imágenes, la decisión no vendrá de los teóricos y críticos, sino de los

artistas y productores visuales. Si nos basamos en el uso que los artistas han hecho a lo largo de

la historia, y siguen haciendo, de las tecnologías que se ponen a su disposición, se puede concluir

con cierta certeza que la IAG ha llegado para quedarse, crecer y multiplicarse.

Esto es lo que hemos visto, por ejemplo, en la transición de DALL E a DALL E 2, de Chat GPT

3 a 4 y, en particular, con el lanzamiento de Sora, un nuevo modelo Open AI que permite crear

vídeos de hasta 60 segundos desde mensajes de texto. Argu,enta Beiguelmann (2024):

Se avecinan transformaciones sustanciales en la producción audiovisual. Es importante

recalcar que esta no es la primera incursión de empresas tecnológicas en este campo. Google

también está probando este tipo de tecnología de texto a vídeo, con Lumiere; y Runway,

otra empresa que ofrece comercialmente este servicio desde hace al menos seis meses. […]

Sora impacta profundamente nuestras concepciones del audiovisual y marca un punto de

inflexión tecnológico que no es despreciable.

Sin duda vendrán otros, trayendo consigo no solo el potencial de colaboración creativa con

artistas y diseñadores, sino también todas las externalidades negativas que la IA conlleva: pro-

piedad de los datos, privacidad y debates difíciles sobre el impacto en las carreras y la pérdida de

empleos.

Sin embargo, los argumentos que planteó este artículo no deben llevar a entender, al menos

por el momento, que, siendo capaz de producir y modificar imágenes comandadas por enuncia-

dos humanos, estas imágenes tienen autonomía propia. No olvidemos que funciones como GPT-3

y 4, PaLM de Google regurgitan patrones de texto ingeridos de los miles de millones de documen-

tos humanos en los que están capacitados. Del mismo modo, DALL E, Stable Diusion y otros del

mismo tipo reproducen asociaciones entre texto e imágenes que se encuentran en miles de millo-

nes de ejemplos en línea. Estos ejemplos son productos de las capacidades y acciones humanas.

Entonces, lo que parece estar emergiendo es una asociación sin precedentes entre humanos

e IA a la que los productores y artistas visuales adaptarán sus habilidades creativas. Además, el

papel de los críticos culturales es, ante todo, estar bien informados para comprender y evaluar en

tanto se mantengan a cierta distancia de los prejuicios antropocéntricos.

Se puede encontrar concordancia con esta afirmación en un texto de Oppenlaender (2022)

íntegramente dedicado a los principios emergentes de una teoría de la creatividad que surge de

la IAG, una teoría desarrollada a partir del modelo conceptual de las cuatro P de Rhodes (1961) —

producto, persona, proceso y entorno—: se trata de una comunidad estética que ya constituye un

ecosistema artístico de IAG, lo cual no es casualidad, ya que los artistas nunca se hacen esperar.

259 259/

LUCIA SANTAELLA

R

• Amaral, Gustavo Rick. «Uma dose de pragmatismo para as

epistemologias contemporâneas: Latour e o parlamento das

coisas». Teccogs: Revista Digital de Tecnologias Cognitivas,

TIDD | PUC-SP 12 (2015): 92-118.

• Arielle, Emanuele, y Manovich, Lev. «Who is an Artist in the

Soware Era». Capítulo 2. 2022a. Disponible en: http://

manovich.net/index.php/projects/artificial-aesthetics-book.

Acceso el 30 de mayo de 2023.

• Arielle, Emanuele, y Manovich, Lev.AI-aesthetics and the

Anthropocentric Myth of Creativity». Nodes 1 (2022): 19-20.

• Arielle, Emanuele, y Manovich, Lev.«Seven Arguments about

AI Images and Generative Media». Capítulo 5. 2023. Disponible

en: http://manovich.net/index.php/projects/artificial-

aesthetics-book. Acceso el 30 de mayo de 2023.

• Baio, Cesar. «Os algoritmos & as formas de ver/sentir: rastros

de uma prática artística desviante». En Simbioses do humano &

tecnologias, editado por Lucia Santaella, 103-134. São Paulo:

EDUSP, 2022.

• Beiguelman, Giselle. «Um prompt na tela e uma ideia

na cabeça». Revista Zoom, 2024. Disponible en: https://

revistazum.com.br/colunistas/um-prompt-na-tela-e-uma-

ideia-na-cabeca/. Acceso el 2 de marzo de 2024.

• Bonfim, Ariel. «Stable Diusion, entendendo a tecnologia

que cria arte». 2022. Disponible en: https://diolinux.com.br/

editorial/stable-diusion-tecnologia-arte.html. Acceso el 10

de abril de 2023.

• Butterick, Matthew. «Stable Diusion Litigation. Because AI

Needs to Be Fair & Ethical to Everyone». 2023. Disponible en:

https://archive.ph/cccMs#selection-17.0-691.115. Acceso el 10

de marzo de 2023.

• Craig, Vear. «Preface». En The Language of Creative AI:

Practices, Aesthetics and Structures, editado por Craig Vear y

Fabrizio Poltronieri, vii-xiv. Suiça: Springer, 2022. https://doi.

org/10.1007/978-3-031-10960-7

• Davenport, Thomas H., y Mittal, Nitin. «How Generative AI Is

Changing Creative Work». Harvard Business Review. Disponible

en: https://hbr.org/2022/11/how-generative-ai-is-changing-

creative-work. Acceso el 10 de abril de 2023.

• Deep Learning Book. «Capítulo 79: Conhecendo o Modelo

GPT-3 (Generative Pre-trained Transformer)». Disponible

en: https://www.deeplearningbook.com.br/?s=Transformer.

Acceso el 15 de marzo de 2023.

• Díaz, B. «Los modelos de difusión claramente explicados».

Disponible en: https://impulsatek.com/los-modelos-de-

difusion-claramente-explicados/. Acceso el 10 de noviembre

de 2023.

• Gopnik, Adam. «What Can A.I. Art Teach Us About the Real

Thing?» 2023. Disponible en: https://www.newyorker.com/

culture/cultural-comment/what-can-ai-art-teach-us-about-

the-real-thing. Acceso el 10 de mayo de 2023.

• Grusin, Richard. «Introduction». En The Nonhuman Turn,

editado por Richard Grusin, vii-xxix. Minneapolis: The

University of Minnesota Press, 2015.

• Heaven, Will Douglas. «Generative AI is Changing Everything

but What is Le When the Hype is Gone». MIT Technology

Review, 2022. Disponible en: https://www.technologyreview.

com/2022/12/16/1065005/generative-ai-revolution-art/.

Acceso el 22 de marzo de 2023.

• Hutson, James. «AI and the Creative Process». 2023.

Disponible en: https://daily.jstor.org/ai-and-the-creative-

process-part-one/. Acceso el 10 de febrero de 2024.

• IBM Research. «What Is Generative Artificial Intelligence».

Disponible en: https://research.ibm.com/blog/what-is-

generative-AI. Acceso el 7 de marzo de 2024.

• Latour, Bruno. Jamais fomos modernos: Ensaio de antropologia

simétrica. Traducido por Carlos Irineu da Costa. Rio de Janeiro:

Ed. 34, 1994.

• Lemos, André. A comunicação das coisas: Teoria ator-rede e

cibercultura. São Paulo: Annablume, 2013.

• Mali, Surabhi. «Understanding DALL-E: How Diusion Models

Transform Text into Images». 2023. Disponible en: https://

medium.com/@surabhimali/understanding-dall-e-how-

diusion-models-transform-text-into-images-part-4-aiseries-

de84e7ad7584#:~:text=DALL%2DE%20operates%20on%20

the,until%20the%20desired%20image%20emerges. Acceso el

14 de noviembre de 2023.

• Manovich, Lev. «Database as a Symbolic Form». 1998.

Disponible en: http://manovich.net/index.php/projects/

database-as-a-symbolic-form. Acceso el 20 de mayo de 2023.

• Oppenlaender, Jonas. «The Creativity of Text-to-Image

Generation». Academic Mindtreck, noviembre de 2022,

Tampere, Finlandia. https://doi.org/10.1145/3569219.3569352

• Rhodes, Mel. «An Analysis of Creativity». The Phi Delta Kappan

42, no. 7 (1961).

• Russell, Stuart J., y Norvig, Peter. Artificial Intelligence: A

Modern Approach. 3.ª ed. New Jersey: Prentice Hall, 2010.

• Santaella, Lucia. Corpo e comunicação: Sintoma da cultura. São

Paulo: Paulus, 2004.

• Santaella, Lucia. «Ignições da arte contemporânea na virada

especulativa». En Ignições, editado por Cleomar Rocha y Lucia

Santaella, 69-86. Goiânia: UFG, 2017.

• Santaella, Lucia. Inteligencia artificial y cultura: Oportunidades

y desafíos para el sur global. 1.ª ed. París y Montevideo: Oficina

Regional de Ciencias de la UNESCO para América Latina y

UNESCO Montevideo, vol. 1, 2021.

• Venâncio Júnior, Sérgio José. «Arte e inteligências artificiais:

Implicações para a criatividade». ARS 17, no. 35 (2019): 183-

201. https://doi.org/10.11606/issn.2178-0447.ars.2019.152262

• West, Ruth, y Burbano, Andrés, coord. «AI, Arts & Design:

Questioning Learning Machines». Artnodes, no. 26 (2020): 1-9.

UOC. https://doi.org/10.7238/a.v0i26.3390