LA TADEO DEARTE 9 N.º 12 - 2023
IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD
IA GENERATIVA
DE IMÁGENES Y
LOS PROBLEMAS
DE LA
CREATIVIDAD
Lucia Santaella *
Fecha de recepción: 30 de junio de 2023 Fecha de aceptación: 11 de marzo de 2024
245 245/
* Doctora en Teoría de la Literatura por la PUCSP. Investigadora
1A del Consejo Nacional de Desarrollo Científico y Tecnológico
(CNPq). Profesora titular en el posgrado en Comunicación y
Semiótica y en Tecnologías de Inteligencia y Diseño Digital
de la Pontificia Universidad Católica de São Paulo (PUC-SP),
Brasil.
lbraga@pucsp.br | https://orcid.org/0000-0002-0681-6073
Sugerencia de citación: Santaella Lucia. IA generativa de imágenes y los problemas de la creatividad. La Tadeo DeArte 9, n.° 12,
2023: 1-21. https://doi.org/10.21789/24223158.2025
IMAGE
GENERATIVE
AI AND THE
ISSUES OF
CREATIVITY
AÍDA MANRIQUE LÓPEZ, JULLY ANDREA HERRERA JARAMILLO
LA TADEO DEARTE 9 N.º 12 - 2023
IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD
LA TADEO DEARTE 9 N.º 12 - 2023
Desde que se puso en manos de los usuarios, el im-
pacto que ha causado la IA generativa ha sido intenso.
Conformada por sistemas que van desde ChatGPT hasta
sistemas de producción de imágenes, todos ellos son
activados por comandos verbales de los usuarios que
inician procesos de diálogo entre humanos y máquina.
Este artículo tiene como objetivo discutir la IA genera-
tiva de imágenes y, con ella, el retorno de cuestiones
estéticas relacionadas con la autoría, la creatividad, la
originalidad y la autonomía que ahora reaparecen bajo
nuevas formas.
RESUMEN
>>>>>>
Palabras clave:
IA generativa; au-
toría; creatividad;
originalidad; auto-
nomía; arte.
247 247/
LUCIA SANTAELLA
ABSTRACT
>>>>>>
Since it was first made available to users, generative AI
has impacted the world greatly. Generative AI, which
includes systems like ChatGPT and other image-producing
interfaces, is activated by verbal commands with which
humans initiate dialogue processes with the machine. This
article aims to discuss image-generative AI and the return of
aesthetic issues, such as authorship, creativity, originality
and autonomy, which are now resurfacing in new shapes.
Keywords:
generative AI;
authorship;
creativity;
originality;
autonomy; art.
LA TADEO DEARTE 9 N.º 12 - 2023
IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD
INTRODUCCIÓN
Basado en fuentes teóricas y críticas sobre el papel que juega la crea-
tividad, especialmente la artística, en la vida sociocultural, y apoyado en
un método argumentativo, este arculo tiene como objetivo cuestionar los
dilemas que la inteligencia artificial generativa (IAG) aporta al concepto de
creatividad y otros similares. La discusión sobre el tema se caracteriza por
acaloradas controversias, desde 2021, cuando la IAG fue puesta directamen-
te en manos de los usuarios por la start-up Open AI, financiada por Microso,
entre otros lanzamientos.
La IAG corresponde con el estadio en que se encuentra hoy la investiga-
ción en inteligencia artificial (IA) que comenzó hace setenta años. Pero hubo
muchos altibajos antes de que la IA lograra el éxito hace pocas décadas. Este
desarrollo se debe a un salto del paradigma informático de los algoritmos
que ejecutan los pasos prescritos por la programación a los algoritmos que
están capacitados para aprender. Esto fue posible por una serie de razones,
incluido el aumento de la escalabilidad de las computadoras y el incremen-
to cada vez más gigantesco del volumen de datos que se concentraron en
manos de los que ahora se denominan grandes Tecs (Amazon, Facebook,
Microso, Twitter, etc.). Pero el gran protagonista del salto computacional
responsable del éxito de la IA es el Machine Learning, en especial la técnica
del Deep Learning, impulsada por redes neuronales que imitan —solo imitan,
ya que no pueden copiar— el funcionamiento de las redes neuronales de
nuestro cerebro (Russel y Norvig 2010).
Antes del auge de la IAG, la IA se entendía como modelos de aprendi-
zaje automático que pueden aprender a hacer predicciones basadas en
datos. Algunos ejemplos son modelos entrenados en millones de datos para
predecir si una radiografía determinada muestra signos de un tumor o si es
probable que un prestatario determinado no pague un préstamo. La IAG,
sin embargo, constituye un nuevo nivel de la IA. Según Zewe (2023), la IAG es
un modelo de aprendizaje automático entrenado para crear nuevos datos,
en lugar de hacer una predicción sobre un conjunto de datos específico. Un
sistema IAG es aquel que aprende a generar más objetos que se parecen a los
datos con los que fue entrenado. En definitiva, IAG se refiere a modelos de
aprendizaje profundo capaces de generar texto, imágenes y otros contenidos
de alta calidad a partir de los datos con los que fueron entrenados (IBM).
Aunque la IAG no se limita a la producción de textos, fue y sigue siendo
intensa la agitación que el ChatGPT está creando en el mundo, lamentable-
mente acompañada de incesantes malentendidos. Antes de dar una opi-
nión o incluso evaluar, es necesario buscar comprender. Por lo tanto, esta
discusión empieza con una introducción didáctica al ChatGPT que tiene en
mira poner algunas preguntas en sus lugares apropiados. En verdad, fue su
explosión lo que retroactivamente llamó la atención sobre los sistemas de
producción de imágenes que se lanzaron en 2021. Es a estos sistemas de
imágenes a los que será dedicada la atención de este artículo.
249 249/
LUCIA SANTAELLA
¿QUÉ ES EL CHATGPT?
Avances en la investigación de la IA que impulsaron al ChatGPT:
1. Las redes neuronales de aprendizaje profundo son unidades de proce-
samiento en capas interconectadas. ¿Qué hacen? Reconocer patrones
en grandes volúmenes de datos.
2. Un avance destacable en Deep Learning que desembocó en el ChatGPT
es el que tuvo lugar en Natural Language Processing (NLP), gracias a un
tipo especial de redes neuronales, las denominadas Large Language
Models, utilizadas en traducciones, Chat Bots, etc. ¿Qué hacen ellas?
Algoritmos que aprenden a hacer asociaciones probabilísticas entre
miles de millones de palabras y frases que les permiten generar textos,
traducir, responder preguntas, resumir textos, etc.
3. ¿Qué les permite hacer esto? Se trata de un algoritmo probabilístico de
un tipo especial llamado Transformer, lanzado en 2017, y un modelo muy
copiado, Bert, de Google, en 2018, que permite entrenar los algoritmos
en varios procesadores paralelos.
4. Así nació la familia de transformadores (transformador generativo pre-
entrenado) que dio origen a la IAG. Esto provocó un gran avance en la IA,
que saltó de la IA predictiva que operaba hasta entonces, pasando su
centro a la IAG que está en la base de ChatGPT. La familia comenzó con
GPT-1, luego 2, 3, 3.5, este sobre la base del ChatGPT lanzado a fines de
noviembre de 2022, y actualmente ChatGPT4 (Deep Learning Book 2023;
Davenport y Mittal 2022).
LA TADEO DEARTE 9 N.º 12 - 2023
IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD
ChatGPT-3.5 o 4 no es el único fruto de la IAG. Es necesario diferenciar algunos árboles del
bosque. En 2022 se lanzaron varias IAGs de imagen. Hay cuatro aplicaciones que más se han uti-
lizado para este tipo de traducción. DALL E fue creado por la empresa estadounidense Open AI.
Lanzado en 2021, es pionero en el género y actualmente se encuentra en su segunda versión más
potente. Midjourney, por otro lado, es un algoritmo de imágenes generativas desarrollado por un
laboratorio de investigación independiente del mismo nombre. Tiene varias versiones disponi-
bles a través de un modelo freemium, pero, a diferencia del DALL E, solo se accede a través de una
extensión de la aplicación Discord llamando y enviando mensajes de texto.
En agosto de 2022 se lanzó Stable Diusion, también una herramienta de IA para imágenes.
El algoritmo se distingue de los demás en que sus desarrolladores ponen a disposición su código
fuente y el recurso funciona de forma totalmente gratuita. Otra diferencia con relación a DALL-E y
Midjourney es el hecho de que la versión completa de Stable-Diusion hace su procesamiento en
la máquina del usuario, mientras que las demás recurren al procesamiento en la nube. El sistema
de Google, por su parte, es Imagen. Estos modelos también tienen sus fundamentos técnicos en
Transformer, que es el más utilizado en el procesamiento del lenguaje natural. Pero, en el caso
de las imágenes, funcionan a través de una red neuronal basada en la tecnología Diusion Models
(modelos de difusión), que utiliza el aprendizaje multimodal para conectar la semántica entre
textos e imágenes. La familia de modelos de difusión es muy poderosa con un rendimiento récord
en muchas aplicaciones, incluida la síntesis de imágenes, la generación de videos y el diseño de
moléculas (Díaz 2022).
El gran avance detrás de los nuevos modelos está en la forma en que se generan las imáge-
nes. La primera versión de DALL E utilizó una extensión de la tecnología detrás del modelo de
lenguaje GPT-3 de Open AI, produciendo imágenes al predecir el siguiente píxel en una imagen
como si fueran palabras en una oración. En cambio, el DALL E 2 usa el modelo de difusión que se
presenta como redes neuronales entrenadas para limpiar imágenes eliminando el ruido pixelado
agregado por el proceso de entrenamiento. El proceso consiste en tomar fotos y cambiar algunos
píxeles a la vez, en varios pasos, hasta que se borran las imágenes originales y no quedan más
que píxeles aleatorios. Luego, la red neuronal se entrena para revertir este proceso y predecir
cómo se vería la versión menos pixelada de una imagen dada. El resultado es que, si se le da un
desorden de píxeles a un modelo fuzzy, él intentará generar algo un poco más limpio. Volviendo
a conectar la imagen limpia, el modelo producirá algo aún más limpio. Este proceso de actua-
lización elimina gradualmente el ruido de la imagen hasta que se parece mucho a la imagen de
destino.
Según Mali (2023), la destreza de DALL E surge de su extenso entrenamiento en un conjunto
de datos masivo que contiene pares texto-imagen. Este conjunto de datos abarca una amplia
gama de imágenes, desde fotografías realistas hasta pinturas abstractas. Esta vasta formación
dota a DALL E de la capacidad de comprender las relaciones estadísticas entre texto e imágenes.
Como resultado, DALL E tiene la capacidad de generar imágenes realistas y creativas, puede
adaptarse a diferentes estilos según la descripción del texto proporcionada, ofreciendo una hete-
rogénea gama de posibilidades artísticas.
Todos los modelos de texto-imagen se denominan multimodales porque producen imágenes
a partir de los comandos verbales de los usuarios. Aunque los distintos modelos lograron buenos
LAS CATEGORÍAS
DE IAG
251 251/
LUCIA SANTAELLA
resultados, el que ganó gran notoriedad fue, de hecho, Stable Diusion. Hay básicamente dos
maneras de hacer que funcione. Uno de ellos se llama “palabra a imagen”: simplemente se des-
cribe una escena, el soware lee lo escrito y genera una imagen. El otro modo se llama “imagen
a imagen”, cuando el usuario agrega una imagen para cambiarla. Estos cambios son de varios
tipos, como, por ejemplo, cambiar el fondo, añadir elementos, cambiar colores y otras posibilida-
des. Todo lo que se necesita es que el usuario esté dispuesto a experimentar. También es posible
cambiar la imagen de un borrador. Para ello, se coloca una máscara sobre la imagen mostrando
lo que se quiere cambiar. También puede aumentar la resolución de una imagen. El programa
todavía es capaz de unir imágenes, formando una composición (Bonfim 2022).
Con todo eso, las puertas estaban abiertas de par en par para la IA generativa. Open AI re-
gistró un millón de usuarios en solo 2,5 meses. Más de un millón de personas comenzaron a usar
Stable Diusion a través de su servicio pago Dream Studio en menos de la mitad de ese tiempo;
muchos más usaron Stable Diusion a partir de aplicaciones de terceros o instalaron la versión
gratuita en sus propias computadoras. El ritmo de desarrollo de estos modelos ha sido impre-
sionante. En solo unos meses, la tecnología inspiró cientos de titulares de periódicos y portadas
de revistas, llenó las redes sociales con memes, puso en marcha una máquina de propaganda y
provocó una intensa reacción.
De gran valor como una documentación de los primeros impactos que tuvo la IAG en artistas
y diseñadores son los testimonios que Will Douglas Heaven (2022) publicó en MIT Technology
Review. Son testimonios de hecho importantes para comprender la efervescencia entre los
artistas, especialmente en lo que se refiere a la agencia y autonomía de sus producciones. Si bien
las aplicaciones de IA como ayudas creativas ya se habían incorporado a los sistemas artísticos
desde al menos el año 2020 (West y Burbano 2020) con la IA generativa, los artistas se vieron
involucrados en una de las mayores convulsiones en una generación.
Los creadores quedaron desconcertados, dice Allen Stevenson, un artista digital con sede
en California que ha trabajado en estudios de efectos visuales como DreamWorks: “Para perso-
nas con capacitación técnica como yo, es bastante desalentador. Eres como, ‘Oh, Dios mío, eso
es todo mi trabajo’. Entré en una crisis existencial durante el primer mes de usar DALL E”. Pero
mientras algunos todavía se están recuperando del impacto, muchos, incluido Stevenson, están
encontrando formas de trabajar con estas herramientas y anticipar lo que viene después (cf.
Heaven 2022).
Para Chad Nelson, un creador digital que ha trabajado en videojuegos y programas de tele-
visión, las plantillas de texto a imagen son una innovación única en la vida. “Esta tecnología lo
lleva de un destello en su cabeza a un primer borrador en segundos”, dice. “La velocidad a la que
puedes crear y explorar es revolucionaria, más allá de lo que he experimentado en 30 años” (cf.
Heaven 2022).
Paul Trillo, un artista digital y de video que también vive en California, cree que la tecnología
hará que sea más fácil y rápido generar ideas para efectos visuales. “La gente dice que esta es la
muerte de los artistas de efectos especiales o la muerte de los diseñadores de moda”, pero “no
UNA ESCENA
EN EBULLICIÓN
LA TADEO DEARTE 9 N.º 12 - 2023
IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD
creo que sea la muerte de nada. Creo que significa que no tenemos que trabajar por la noche y los
fines de semana” (cf. Heaven 2022).
Stevenson también testifica que ha experimentado DALL E en cada paso del proceso que uti-
liza un estudio de animación para producir una película, incluido el diseño de personajes y entor-
nos. “Con la DALL E, puedo hacer el trabajo de múltiples departamentos en cuestión de minutos.
Es alentador para todas las personas que nunca pudieron crear porque era demasiado costoso o
demasiado técnico”, dice. “Pero da miedo si no estás abierto al cambio” (cf. Heaven 2022).
Nelson, por su parte, cree que hay más por venir. Eventualmente, él ve que esta tecnología
será adoptada no solo por los gigantes de los medios, sino también por las firmas de arquitectu-
ra y diseño. Pero ella aún no está lista. “Ahora es como si tuvieras una caja mágica, un pequeño
mago”, continúa. “Esto es excelente si solo desea seguir generando imágenes, pero no si necesita
un socio creativo. Si quiero crear historias y construir mundos, esa pareja necesita tener más
conciencia de lo que estoy creando” (cf. Heaven 2022).
Las empresas de fotografía de archivo están adoptando posiciones diferentes. Getty prohibió
las imágenes generadas por IA. Shutterstock firmó un acuerdo con Open AI para incorporar DALL
E en su sitio web y dice que iniciará un fondo para reembolsar a los artistas cuyo trabajo se utilizó
para entrenar a los modelos.
Los modelos fueron probados durante unos meses. Pasado el momento de sorpresa y expe-
rimentación, dado que los modelos se alimentan de miles de millones de imágenes ya producidas
por humanos, los artistas comenzaron a reivindicar la autoría y propiedad intelectual de imáge-
nes consideradas muy similares a las de su propia creación (Butterick 2023). Estas contradiccio-
nes, que involucran todas las cuestiones complejas sobre la creatividad, la autoría, los derechos
de autor y la autonomía, exigen ponderaciones y evaluaciones que un método argumentativo nos
ayudará a discutir a continuación.
253 253/
LUCIA SANTAELLA
IA Y ARTE ANTES DE
LA IA GENERATIVA
Es necesario considerar que el concepto de crea-
tividad presenta una variedad de interpretaciones y
significados, así como existen tipos de creatividad: an-
tropológica, psicológica, histórica y metafísica. Por tan-
to, la creatividad no se limita al arte y el diseño, ya que
también puede manifestarse en la ingeniería, la ciencia
e incluso en el mundo empresarial. Sin embargo, es en
los distintos territorios del arte donde la creatividad se
manifiesta de forma más dominante. Esto no implica
caer en la concepción romántica del artista impulsa-
do por la inspiración, pues toda producción artística
presupone el desarrollo de habilidades específicas, el
dominio de medios e instrumentos, el aprendizaje de
materiales y técnicas, además de los conocimientos
teóricos que surgen de una práctica extensa (Hutson
2023).
Dado que los medios utilizados por artistas y dise-
ñadores cambian históricamente, y cada vez que surgen
nuevos materiales y tecnologías, el concepto de crea-
tividad se pone en duda. No sorprende, por tanto, que,
antes de la disrupción provocada por la IAG, las aplica-
ciones de IA utilizadas en el arte ya estuvieran acompa-
ñadas de interrogantes y la consiguiente implosión de
certezas previas “sobre temas, significados y narrativas
involucradas en conceptos como la creatividad, obra
de arte, juicio de expertos y formación de cánones
(Arielle y Manovich 2022a, 18). Lamentablemente, por
regla general, las preguntas tienden a seguir una ten-
dencia que conviene evitar, es decir, olvidar e ignorar
las transformaciones tecnológicas en los procesos
productivos y de creación visual y sonora que prece-
dieron y condujeron hasta el punto donde se produjo
el surgimiento de la IA y su uso en procesos creativos.
Argumentan Arielle y Manovich (2022a, 7):
Para comenzar, debemos considerar el hecho de
que todo el trabajo creativo en medios y diseño
hoy en día se lleva a cabo en un entorno digital,
es decir, implica el uso de soware, servicios
y recursos en línea apropiados. Los creadores
tienen acceso instantáneo a numerosos trabajos
realizados por otros a través de las redes sociales
y sitios especializados para compartir arte, foto-
grafía, video y música (ej., DeviantArt, Art Station,
Behance, SoundCloud), así como a sitios web
con archivos multimedia, plantillas, y efectos (ej.,
Shutterstock, Adobe Stock y un sinfín de otros).
Sin ir muy lejos, es necesario recordar que las
alianzas con las máquinas computacionales ya estaban
vigentes en los modelos 3D con el uso de algoritmos
que simulan efectos de fuentes de luz, sombras, niebla,
transparencia, translucidez, texturas, profundidad
de campo, movimiento. desenfoque, etc. Pero, para
permanecer dentro del paradigma de la IA —antes de la
IAG—, las creaciones y discusiones sobre sus diversos
aspectos dentro y fuera del mundo académico han sido
frecuentes en muchos países y también en Brasil.
En el campo de la IA y el arte, Sergio J. Venâncio
Júnior (2019) publicó un arculo en el que propone una
reflexión sobre las obras de arte equipadas con IA, des-
tacando cuestiones como la autonomía y la creatividad.
En primer lugar, se ofrecen algunos trabajos a modo
de ejemplo, para discutir el problema de la autonomía
creativa bajo el cual comúnmente se interpretan estas
iniciativas. Las referencias de los algoritmos evolutivos
y la cibernética culminan en un modelo particular para
analizar obras en términos de sintaxis, semántica y
pragmática. Tal modelo ofrece una posible segmenta-
ción del espectro de la creatividad humana, al tiempo
LA TADEO DEARTE 9 N.º 12 - 2023
IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD
que aclara algunos desafíos para el desarrollo de
máquinas creativas. Finalmente, se presenta una pro-
puesta artística que utiliza recursos de IA para generar
dibujos, trayendo una situación en la que la máquina
influye, interfiere y redefine un proceso creativo que
diluye las intenciones del artista.
Entre algunos artistas radicados en Brasil
(Santaella 2021), es bastante significativo el trabajo
creativo y conceptual de Baio (2022, 106) sobre la
dimensión estética de la IA, que, según el autor, “pone
en tela de juicio, por un lado, cómo se representa la IA y
cómo crea un imaginario en relación con la tecnología.
Por otro lado, también cómo suceden los procesos au-
tomatizados de mediación y producción de sentido, que
interpretan datos para informar formas de ver y sentir.
Para Craig (2022, VI-XI), soportes como la IA, el
aprendizaje automático, los sistemas locativos, la
realidad mixta, virtual y aumentada, la computación en
la nube y las tecnologías ubicuas son hoy constitutivos
de una cultura computacional que permite la expansión
de la creatividad humana. Pocas tecnologías han tenido
tanto impacto en la creatividad como la IA en tan poco
tiempo, dando como resultado prácticas innovadoras
acompañadas de análisis académicos y críticas sobre
sus antecedentes e influencias. Craig nombró a este
contexto IA creativa para, desde un punto de vista
centrado en el ser humano, abarcar, por ejemplo, arte
robótico, obras de arte de IA distribuidas en sitios,
artistas de IA, músicos artificiales, imágenes sintéticas
generadas por redes neuronales, autores de IA y bots de
periodistas.
Arielle y Manovich (2022b) publicaron un artículo
muy provocativo con el siguiente título: “AI-estética
y el mito antropocéntrico de la creatividad”. El texto
comienza con una afirmación relativamente obvia, a sa-
ber: “Desde principios del siglo XXI, la computación, el
análisis de datos y la inteligencia artificial han ingresa-
do gradualmente al ámbito estético”, acompañando to-
das las transformaciones en el universo digital e incluso
ingresando al campo del bioarte, mediante el uso de
algoritmos genéticos (Santaella 2004). Hoy en día, como
atestiguan muchos artistas y críticos de arte y cultura,
la IA se utiliza cada vez más para generar nuevos tipos
de artefactos sintéticos, que incluyen, por supuesto,
obras de arte, música, diseños y textos.
AUTORÍA,
CREATIVIDAD Y
ORIGINALIDAD EN
EL ARTE DE LA IA
En un texto publicado en Springer Series on Cultural Computing (Santaella 2022), argumenté
que el surgimiento de la fotografía, seguido de los recursos electrónicos y computacionales, y lue-
go de la multiplicidad de posibilidades que abre al artista el universo digital, constituye supues-
tos fundamentales de continuidad para comprender las alianzas tecnológicas que los artistas
han buscado durante al menos dos siglos y que hoy culminan en la IA. Esto no significa buscar un
punto de llegada que minimice la importancia de las discusiones en torno al tema de la IA —que
es nuevo—, sino, en primer lugar, repetir que, desde la invención de la fotografía, cada vez que se
incorpora una nueva tecnología en el trabajo artístico, esto provoca un retorno de las discusiones
sobre el estatus del arte, la autoría y la creatividad.
255 255/
LUCIA SANTAELLA
Precisamente por eso, lo que el artículo pretendía, en segundo lugar, era plantear argumen-
tos que pudieran llevar la discusión al campo específico de los nuevos desafíos que la IA está tra-
yendo a la creatividad humana. El interés del artículo, por tanto, era mostrar que, en el campo de
las artes, con la IA, asistimos al surgimiento de un nuevo modo de producción creativa y artística
que ha sido incorporado por los artistas y que despierta el interés de teóricos y críticos de la cul-
tura y las artes. Inseparable de la discusión sobre autoría y creatividad es el no menos complejo y
controvertido concepto de originalidad. En palabras de Arielle y Manovich (2022b):
¿Qué tipo de recombinación de ideas, analogías inusuales y conexiones conceptuales se
consideran el sello distintivo de la originalidad? ¿A quién debemos atribuir la autoría si un
artefacto o imagen es producto de dispositivos, algoritmos y extensiones tecnológicas
que generan y reinterpretan la intención de un artista o diseñador? Dado que la cadena de
producción está mediada por intervenciones de soware de terceros cada vez más complejas
(como efectos y filtros de fotos y videos o algoritmos de retoque), ¿cómo determinar dónde se
ha producido la innovación creativa y quién es su autor?
Los autores también afirman que, cada vez que se alcanza un hito tecnológico, el rayo parece
ir más allá, pero siempre relacionado con los supuestos habituales a la hora de utilizar y atribuir
conceptos como inteligencia y creatividad. El encuentro entre la IA y la estética es aún más crucial
porque el arte se considera un dominio esencialmente humano, y su intratabilidad y complejidad
no parecen ser susceptibles de reducción algorítmica. Mucha gente considera el arte, la estética
y la creatividad el colmo de las capacidades humanas; son, por tanto, vistas como la última barri-
cada contra los avances en IA, por lo que está a una distancia muy grande de lo que los avances
tecnológicos pueden reproducir.
Según los autores, consideramos que los humanos son creativos y negamos este carácter
a la IA porque entendemos relativamente cómo funciona la IA, pero no entendemos lo suficien-
te cómo funcionan los humanos. Por lo tanto, a menudo se sobreestima la creatividad como
facultad humana simplemente porque no entendemos cómo funciona, y reemplazamos esta falta
de comprensión con una concepción típicamente romántica de la intuición creativa. También es
muy relevante recordar que la idea de la creatividad pura parte de una exaltación de la auto-
nomía individual que solo se consolidó en la modernidad. En radical contraste, en Platón, por
ejemplo, el artista es expulsado de la República por no ser más que un simple imitador.
Uno de los puntos más altos del texto de Arielle y Manovich (2022b) se encuentra en el diag-
nóstico de que nuestra percepción de la IA y sus avances tiende a ser marcada —como lo fue la
llegada de la computadora— desde una perspectiva antropocéntrica de agencia y creatividad.
Una perspectiva, además, difícil de superar, porque la superación supondría descentrar lo hu-
mano de su pretendida soberanía exclusivista. Esta pretensión ha obstruido el camino necesario
“ya trazado por las teorías poshumanas clásicas, como en los trabajos de Donna Haraway y Rosi
Braidotti, o por la propuesta de Bruno Latour de “reensamblar lo social” mediante la inclusión de
entidades humanas y no humanas, abarcando no solo agentes naturales no humanos (animales o
plantas), sino también artificiales” (Arielle y Manovich 2022b).
El tema del descentramiento humano ha ocupado el pensamiento de los teóricos de la
cultura y especialmente está en el núcleo de las preocupaciones de los académicos involucrados
en el tema del Antropoceno. Pero el problema no es tan nuevo como puede parecer. Ya comen-
zó con los debates sobre lo poshumano, en la década de 1990, centrados especialmente en las
transformaciones introducidas en el cuerpo humano y la ontología del humano por la aparición
de prótesis que cuestionaban radicalmente los viejos límites entre lo natural y lo artificial (Hayles
1999). Los debates continuaron en la entrada del siglo XXI con nuevas discusiones sobre el giro de
lo no humano (Grusin 2015; Santaella 2017) cuya paternidad los autores buscaban, de hecho, en
el parlamento de las cosas de Bruno Latour (1994; Lemos 2013; Amaral 2015).
Ante todo esto, se ha instalado un nuevo escenario de crítica cultural en simultáneo con el
uso de las aplicaciones de IA como aliadas de la creación artística, especialmente en el campo
de la música. A pesar de las trabas conservadoras que siempre se imponen, las relaciones entre
la IA y el arte, el diseño y la economía creativa ya tendían hacia un consenso relativo en artistas,
críticos y curadores de arte expertos, hasta que surgió la IA de imágenes generativas que traía
de vuelta los problemas con una nueva forma, temas debatidos repetidamente, al menos desde
Duchamp, pero rodeados ahora de mucha confusión tanto teórica como práctica.
LA TADEO DEARTE 9 N.º 12 - 2023
IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD
La confusión no es accidental. La introducción, en los espacios expositivos consagrados,
de objetos prosaicos recopilados de la vida cotidiana, tuvo un sabor revolucionario debido al
cuestionamiento que estos objetos provocaron sobre el concepto de arte. Sin embargo, por revo-
lucionario que fuera, no dejaba de estar relacionado con las estrictas existencias y experiencias
humanas y contextos igualmente humanos. Lo que la IA ya aportó como novedad y la IAG destaca
es el hecho de que el humano ya no es el agente exclusivo, sino que se le suma un nuevo socio no
humano. En este caso, ¿el producto resultante seguirá siendo considerado “arte”? (Hutson 2023).
De hecho, tanto el texto de Arielle y Manovich (2022b) como otros de la misma época llegaron
antes de la IAG, que provocó un tsunami precisamente porque dio lugar a un tema crucial que
hasta ahora ha sido poco explorado: el de la autonomía. Cuando, bajo la acción de un comando
verbal, un sistema artificial es capaz de producir una imagen o un vídeo, es la competición no
sólo con la creatividad, sino, sobre todo, con la autonomía humana la que entra en juego.
Desde la llegada de la cultura informática, la producción práctica y teórica de Lev Manovich
es inmejorable, especialmente porque su competencia en informática le permite investigar los
problemas desde dentro. Tan cierto es que, avant-la-lettre, Manovich ha publicado varios artícu-
los sobre la estética de la IAG desde 2023. En el primero de ellos, en coautoría con Arielle (2023),
los autores inician los siete argumentos sobre la IA de imágenes y medios generativos declarando
que estas imágenes “son artefactos culturales genuinamente nuevos con contenido, estética y
estilos nunca vistos”.
A diferencia de las imágenes tradicionales, las generativas no parten de borradores o boce-
tos, ni dependen de cámaras que captan, a través de dispositivos sensoriales, imágenes percepti-
blemente visibles. Tampoco se crean a partir de modelos computacionales, es decir, las imágenes
infográficas cuya aparición provocó tanta euforia en la década de 1980. Las imágenes generativas
de IA, por el contrario, se producen intersemióticamente a partir de comandos verbales que dis-
paran gigantescas bases de datos de imágenes extraídas, en la medida de lo posible, del registro
existente de la historia visual humana. Por tanto, según Aurielle y Manovich (2023), el resultado
saca a la luz géneros, estilos y procesos del pasado.
Hay, por tanto, un interesante juego de pasado y presente. Si bien el acto real de producir y
crear la estética generativa es distinto del pasado, por otro lado, es el gigantesco pasado visual
disponible el que pasa a primer plano. En este juego, sin embargo, hay una similitud relevante con
la forma de crear a partir de un pasado relativamente reciente, relacionado con el modernismo
de las décadas de 1910 y 1920, de un vasto universo de medios visuales que se fue expandiendo a
AUTORÍA Y AUTONOMÍA
TRAS LA IAG
257 257/
LUCIA SANTAELLA
medida que aparecía en el ensamblaje y el collage. En este sentido, “las IAGs continúan, cierta-
mente a mucha mayor escala y aprovechando la automatización, las técnicas creativas de combi-
nación de imágenes y medios preexistentes”, algo que ya se había anticipado a menor escala de
automatización en el arte producido a partir de bases de datos (Manovich 1998).
La diferencia con las imágenes generativas ahora, como nos recuerda Manovich, es que la
imaginación del artista no se deja asfixiar por el ruido gigantesco del pasado, ni caer en la seduc-
ción de lo que parece estar ya listo. Es precisamente al tema de la copia y el estereotipo al que
Manovich (2023) dedica su artículo sobre el hecho de que las imágenes que resultan de la IA gene-
rativa dependen completamente del comando dado. Ellas pueden parecer estereotipadas como
quiere Manovich, pero mi explicación sobre esto es que, ante el gigantesco banco de imágenes
con el que fueron formadas, la tendencia es la misma que prevaleció en la era del apogeo de la
comunicación de masas, es decir, el aplanamiento por la media. Por lo tanto, deshacerse de esto
depende no solo de la imaginación, sino también del conocimiento previo del artista y diseñador
de estilos y patrones más inusuales del pasado para forzar las reacciones de traducción del sis-
tema más allá del estereotipo. Así es que Manovich tiene razón cuando afirma que las imágenes,
innovadoras o no, tienden a presentar composiciones perfectamente equilibradas, hermosas
paletas de colores y líneas y formas que crean patrones rítmicos.
Sin embargo, el sistema no es mágico. Hay límites que el artista debe superar. Entre los
límites, Manovich enfatiza la tendencia a la previsibilidad y al lugar común, hasta el punto de que
es difícil que las imágenes escapen a una apariencia puramente kitsch, no en el sentido de mal
gusto, sino en el de una imaginería desgastada. Las declaraciones de Manovich contienen los
juicios respetables de un artista experimentador. Sin embargo, muchos no estarían de acuerdo
con su comparación de imágenes generativas con un arte de copiar.
Gopnik (2023) piensa diferente cuando dice que los sistemas como el DALL E 2 no funcionan
con luces y sombras; operan en la historia del arte, en la reserva casi inagotable de imágenes en
las que se forman. Y el poder de las imágenes radica en sus ambigüedades. “Mirando las imáge-
nes, podemos quedar fascinados por las atmósferas y las incertidumbres”, expresa. De hecho,
todo depende del diálogo creativo que se produce entre el artista y el sistema cuando se insiste
en la improbabilidad y en lo que aún no se ha visto, lo que puede resultar en criaturas quiméricas
y mundos imposibles.
De hecho, no se puede, por lo mismo, estar de acuerdo con que el arte producido con la
mediación da la IAG sea el producto de una mera copia. Prefiero llamarlo un arte de traducciones
intersemióticas sin precedentes entre la sabiduría visual contenida en los comandos y el poder
de juicio del artista sobre los resultados obtenidos como respuestas. Se trata, sobre todo, de tra-
ducciones intersemióticas del verbo a la imagen que dependen de la paciencia y la insistencia del
artista hasta cumplir su deseo de creación. El hecho de ser una máquina la que responde al deseo
no roba, sino que, por el contrario, obedece al deseo creador, cuya autonomía pertenece única y
exclusivamente al artista.
LA TADEO DEARTE 9 N.º 12 - 2023
IA GENERATIVA DE IMÁGENES Y LOS PROBLEMAS DE LA CREATIVIDAD
PARA CONCLUIR
Ninguna tecnología del lenguaje ha desaparecido en el horizonte desde que se inventaron la
fotografía y el fonógrafo. Las que desaparecieron, por ejemplo, el telégrafo y luego el fax, fueron
sustituidas por tecnologías más eficientes, pero con las mismas funciones. En el caso actual de
la IAG para la producción de imágenes, la decisión no vendrá de los teóricos y críticos, sino de los
artistas y productores visuales. Si nos basamos en el uso que los artistas han hecho a lo largo de
la historia, y siguen haciendo, de las tecnologías que se ponen a su disposición, se puede concluir
con cierta certeza que la IAG ha llegado para quedarse, crecer y multiplicarse.
Esto es lo que hemos visto, por ejemplo, en la transición de DALL E a DALL E 2, de Chat GPT
3 a 4 y, en particular, con el lanzamiento de Sora, un nuevo modelo Open AI que permite crear
vídeos de hasta 60 segundos desde mensajes de texto. Argu,enta Beiguelmann (2024):
Se avecinan transformaciones sustanciales en la producción audiovisual. Es importante
recalcar que esta no es la primera incursión de empresas tecnológicas en este campo. Google
también está probando este tipo de tecnología de texto a vídeo, con Lumiere; y Runway,
otra empresa que ofrece comercialmente este servicio desde hace al menos seis meses. […]
Sora impacta profundamente nuestras concepciones del audiovisual y marca un punto de
inflexión tecnológico que no es despreciable.
Sin duda vendrán otros, trayendo consigo no solo el potencial de colaboración creativa con
artistas y diseñadores, sino también todas las externalidades negativas que la IA conlleva: pro-
piedad de los datos, privacidad y debates difíciles sobre el impacto en las carreras y la pérdida de
empleos.
Sin embargo, los argumentos que planteó este artículo no deben llevar a entender, al menos
por el momento, que, siendo capaz de producir y modificar imágenes comandadas por enuncia-
dos humanos, estas imágenes tienen autonomía propia. No olvidemos que funciones como GPT-3
y 4, PaLM de Google regurgitan patrones de texto ingeridos de los miles de millones de documen-
tos humanos en los que están capacitados. Del mismo modo, DALL E, Stable Diusion y otros del
mismo tipo reproducen asociaciones entre texto e imágenes que se encuentran en miles de millo-
nes de ejemplos en línea. Estos ejemplos son productos de las capacidades y acciones humanas.
Entonces, lo que parece estar emergiendo es una asociación sin precedentes entre humanos
e IA a la que los productores y artistas visuales adaptarán sus habilidades creativas. Además, el
papel de los críticos culturales es, ante todo, estar bien informados para comprender y evaluar en
tanto se mantengan a cierta distancia de los prejuicios antropocéntricos.
Se puede encontrar concordancia con esta afirmación en un texto de Oppenlaender (2022)
íntegramente dedicado a los principios emergentes de una teoría de la creatividad que surge de
la IAG, una teoría desarrollada a partir del modelo conceptual de las cuatro P de Rhodes (1961) —
producto, persona, proceso y entorno—: se trata de una comunidad estética que ya constituye un
ecosistema artístico de IAG, lo cual no es casualidad, ya que los artistas nunca se hacen esperar.
259 259/
LUCIA SANTAELLA
R
Amaral, Gustavo Rick. «Uma dose de pragmatismo para as
epistemologias contemporâneas: Latour e o parlamento das
coisas». Teccogs: Revista Digital de Tecnologias Cognitivas,
TIDD | PUC-SP 12 (2015): 92-118.
Arielle, Emanuele, y Manovich, Lev. «Who is an Artist in the
Soware Era». Capítulo 2. 2022a. Disponible en: http://
manovich.net/index.php/projects/artificial-aesthetics-book.
Acceso el 30 de mayo de 2023.
Arielle, Emanuele, y Manovich, Lev.AI-aesthetics and the
Anthropocentric Myth of Creativity». Nodes 1 (2022): 19-20.
Arielle, Emanuele, y Manovich, Lev.«Seven Arguments about
AI Images and Generative Media». Capítulo 5. 2023. Disponible
en: http://manovich.net/index.php/projects/artificial-
aesthetics-book. Acceso el 30 de mayo de 2023.
Baio, Cesar. «Os algoritmos & as formas de ver/sentir: rastros
de uma prática artística desviante». En Simbioses do humano &
tecnologias, editado por Lucia Santaella, 103-134. São Paulo:
EDUSP, 2022.
Beiguelman, Giselle. «Um prompt na tela e uma ideia
na cabeça». Revista Zoom, 2024. Disponible en: https://
revistazum.com.br/colunistas/um-prompt-na-tela-e-uma-
ideia-na-cabeca/. Acceso el 2 de marzo de 2024.
Bonfim, Ariel. «Stable Diusion, entendendo a tecnologia
que cria arte». 2022. Disponible en: https://diolinux.com.br/
editorial/stable-diusion-tecnologia-arte.html. Acceso el 10
de abril de 2023.
Butterick, Matthew. «Stable Diusion Litigation. Because AI
Needs to Be Fair & Ethical to Everyone». 2023. Disponible en:
https://archive.ph/cccMs#selection-17.0-691.115. Acceso el 10
de marzo de 2023.
Craig, Vear. «Preface». En The Language of Creative AI:
Practices, Aesthetics and Structures, editado por Craig Vear y
Fabrizio Poltronieri, vii-xiv. Suiça: Springer, 2022. https://doi.
org/10.1007/978-3-031-10960-7
Davenport, Thomas H., y Mittal, Nitin. «How Generative AI Is
Changing Creative Work». Harvard Business Review. Disponible
en: https://hbr.org/2022/11/how-generative-ai-is-changing-
creative-work. Acceso el 10 de abril de 2023.
Deep Learning Book. «Capítulo 79: Conhecendo o Modelo
GPT-3 (Generative Pre-trained Transformer)». Disponible
en: https://www.deeplearningbook.com.br/?s=Transformer.
Acceso el 15 de marzo de 2023.
Díaz, B. «Los modelos de difusión claramente explicados».
Disponible en: https://impulsatek.com/los-modelos-de-
difusion-claramente-explicados/. Acceso el 10 de noviembre
de 2023.
Gopnik, Adam. «What Can A.I. Art Teach Us About the Real
Thing?» 2023. Disponible en: https://www.newyorker.com/
culture/cultural-comment/what-can-ai-art-teach-us-about-
the-real-thing. Acceso el 10 de mayo de 2023.
Grusin, Richard. «Introduction». En The Nonhuman Turn,
editado por Richard Grusin, vii-xxix. Minneapolis: The
University of Minnesota Press, 2015.
Heaven, Will Douglas. «Generative AI is Changing Everything
but What is Le When the Hype is Gone». MIT Technology
Review, 2022. Disponible en: https://www.technologyreview.
com/2022/12/16/1065005/generative-ai-revolution-art/.
Acceso el 22 de marzo de 2023.
Hutson, James. «AI and the Creative Process». 2023.
Disponible en: https://daily.jstor.org/ai-and-the-creative-
process-part-one/. Acceso el 10 de febrero de 2024.
IBM Research. «What Is Generative Artificial Intelligence».
Disponible en: https://research.ibm.com/blog/what-is-
generative-AI. Acceso el 7 de marzo de 2024.
Latour, Bruno. Jamais fomos modernos: Ensaio de antropologia
simétrica. Traducido por Carlos Irineu da Costa. Rio de Janeiro:
Ed. 34, 1994.
Lemos, André. A comunicação das coisas: Teoria ator-rede e
cibercultura. São Paulo: Annablume, 2013.
Mali, Surabhi. «Understanding DALL-E: How Diusion Models
Transform Text into Images». 2023. Disponible en: https://
medium.com/@surabhimali/understanding-dall-e-how-
diusion-models-transform-text-into-images-part-4-aiseries-
de84e7ad7584#:~:text=DALL%2DE%20operates%20on%20
the,until%20the%20desired%20image%20emerges. Acceso el
14 de noviembre de 2023.
Manovich, Lev. «Database as a Symbolic Form». 1998.
Disponible en: http://manovich.net/index.php/projects/
database-as-a-symbolic-form. Acceso el 20 de mayo de 2023.
Oppenlaender, Jonas. «The Creativity of Text-to-Image
Generation». Academic Mindtreck, noviembre de 2022,
Tampere, Finlandia. https://doi.org/10.1145/3569219.3569352
Rhodes, Mel. «An Analysis of Creativity». The Phi Delta Kappan
42, no. 7 (1961).
Russell, Stuart J., y Norvig, Peter. Artificial Intelligence: A
Modern Approach. 3.ª ed. New Jersey: Prentice Hall, 2010.
Santaella, Lucia. Corpo e comunicação: Sintoma da cultura. São
Paulo: Paulus, 2004.
Santaella, Lucia. «Ignições da arte contemporânea na virada
especulativa». En Ignições, editado por Cleomar Rocha y Lucia
Santaella, 69-86. Goiânia: UFG, 2017.
Santaella, Lucia. Inteligencia artificial y cultura: Oportunidades
y desaos para el sur global. 1.ª ed. París y Montevideo: Oficina
Regional de Ciencias de la UNESCO para América Latina y
UNESCO Montevideo, vol. 1, 2021.
Venâncio Júnior, Sérgio José. «Arte e inteligências artificiais:
Implicações para a criatividade». ARS 17, no. 35 (2019): 183-
201. https://doi.org/10.11606/issn.2178-0447.ars.2019.152262
West, Ruth, y Burbano, Andrés, coord. «AI, Arts & Design:
Questioning Learning Machines». Artnodes, no. 26 (2020): 1-9.
UOC. https://doi.org/10.7238/a.v0i26.3390