La automatización del arte
Autoría, valor y sentido en la época del aprendizaje maquínico
El arte del pasado ya no existe como existió en otro tiempo. Ha perdido su autoridad. Un lenguaje de imágenes ha ocupado su lugar. Y lo que importa ahora es quién usa ese lenguaje y para qué lo usa.
John Berger, Modos de ver, p. 41
La industrialización de lo único
En 1935 el pensador alemán Walter Benjamin publicó “La obra de arte en la época de su reproductibilidad técnica”; un escrito que estaba destinado a ocupar un lugar central en las discusiones sobre arte de las décadas venideras y que hoy, a la luz de acontecimientos que están en pleno desarrollo, vuelve a constituirse como un punto de referencia ineludible. Exponía allí su preocupación en torno a las consecuencias de las nuevas tecnologías de reproducción técnica de imágenes y sonidos, como el fonógrafo, el cine y la fotografía, sobre la experiencia y la idea misma del arte en la cultura occidental. John Berger nos propone esta lectura:
Lo que han hecho los medios modernos de reproducción ha sido destruir la autoridad del arte y sacarlo -o mejor, sacar las imágenes que reproducen- de cualquier espacio privilegiado. Por primera vez en la historia, las imágenes artísticas son efímeras, ubicuas, insustanciales, disponibles, sin valor, libres. Nos rodean del mismo modo que nos rodea el lenguaje. Han entrado en la corriente principal de la vida sobre la que no tienen poder alguno por si mismas. (Modos de ver 41)
En estos momentos transitamos lo que puede ser visto como una nueva vuelta de tuerca en la historia de la infraestructura técnica del arte: ya no se trata de qué pasa cuando hacemos muchas copias de lo mismo, sino de lo que sucede cuando disponemos de sistemas de producción ilimitada de cosas diferentes. Yendo un paso más allá de la lógica industrial de la producción seriada, con sus efectos homogeneizadores en la trama social, nos internamos, sin aviso y sin preparación, en el nuevo mundo de la industrialización de lo único.
En los últimos tiempos hemo visto cómo las redes neuronales y los sistemas de “aprendizaje maquínico” producen resultados cada vez más sofisticados y sorprendentes en el campo de la generación de imagen, texto, video y sonido. Por ejemplo, podemos ingresar unas breves instrucciones en alguno de los sistemas denominados “text-to-image”, como Midjourney, Stable Diffusion o Dall-E y obtener, al cabo de unos segundos, una imagen digital que responde al contenido, estilo y atmósfera que solicitamos, a veces de manera tosca o banal, pero otras con hallazgos sorprendentes. De manera parecida, podemos sostener conversaciones con ChatGPT u otros “grandes modelos de lenguaje” (Large Language Models) sobre cualquier tema imaginable, y pedirle textos sobre temas específicos, en formatos que van de poemas a recetas de cocina y de escritos académicos a programas de computación.
La revolución técnica que dio pie a las reflexiones de Benjamin fue el primer movimiento en dirección hacia la proliferación de la experiencia estética, que dejó de requerir el desplazamiento físico del receptor a los recintos augustos del museo, el teatro o la sala de concierto, y se introdujo en cambio en la intimidad de su hogar bajo la forma de la revista ilustrada, la radio, el fonógrafo y más tarde la televisión. El siglo XX presenció el desarrollo de industrias culturales que preservaban, sin embargo, una estructura centralizada, con unos pocos focos de producción (editoriales, sellos discográficos, estudios de cine, emisoras de radio y televisión) que producían contenidos para un público numeroso que se limitaba a recibir copias de lo mismo.
Con el paso a un sistema de producción industrializado se conservaba, no obstante, una distribución de tareas característica de la era moderna, en la cual, como señala Boris Groys, “los artistas eran minoría y los espectadores, mayoría” (13). La configuración centralizada de esta “época del broadcasting” predominó durante décadas, y recién comenzó a mostrar fisuras hacia fines del siglo XX, con el advenimiento de las cámaras digitales de foto y video, que pronto se tornaron ubicuas por su integración en los teléfonos celulares, y de la Internet, una plataforma de publicación abierta de alcance instantáneo y global. Estas novedades técnicas promovieron un nuevo giro en el sistema productivo del arte, ya que “ha[n] alterado la relación numérica tradicional entre los productores de imágenes y los consumidores. Hoy en día, hay más gente interesada en producir imágenes que en mirarlas” (14).
Ingresamos de ese modo en un nuevo territorio, que se ha dado en llamar “economía de la atención”: el tiempo de atención humana se convierte en un bien escaso y valioso, que demanda el despliegue de estrategias cada vez más sofisticadas para logar su captura y retención. En lugar de espectadores que hacen cola para ver un cuadro o una película, tenemos imágenes y videos que hacen cola en la pantalla para tener su chance de capturar nuestro interés durante más de un segundo.
Así, las nuevas corporaciones que dominan la Internet, de las redes sociales a los sitios de comercio electrónico y las plataformas de streaming, han desarrollado sistemas algorítmicos de recomendación, jerarquización de contenidos y publicidad personalizada que apuntan a maximizar la cantidad de tiempo que los usuarios pasan en ellas. Despliegan a tal fin recursos como el almacenamiento de datos personales y patrones de actividad, el análisis estadístico, la inteligencia artificial, y la “personalización de masas”. De ese modo, la punta de lanza de las tecnologías digitales se ensambla, de manera cada vez más íntima y muchas veces tóxica, con los oscuros mecanismos de la afectividad y los impulsos humanos más básicos.
Pero la historia de ningún modo termina allí. En la actualidad asistimos al vertiginoso despliegue de un nuevo giro tecnológico en la producción y reproducción de la cultura. Ya no se trata de que la mayor parte de los humanos, celular en mano, seamos artistas, sino de que ahora se agregan también sistemas no humanos capaces de producir texto, sonido, imagen y video en cantidad y variedad ilimitadas. La explosión de bienes culturales que ya estaba en curso, a su vez, explota, multiplicada por la recombinación automatizada del aprendizaje maquínico.
Es un principio económico básico que todo aquello que abunda, que se encuentra en exceso por sobre cualquier necesidad correlativa, tiende a carecer de valor. ¿Cómo podría, sin embrago, sucederle algo así al objeto artístico? Parece indispensable que pueda destacarse de los objetos “comunes”, que pueda en algún sentido considerarse diferente, especial, y por lo tanto valioso. En su momento las preocupaciones de Benjamin giraban en torno a la pérdida del valor de culto de la obra de arte, esa experiencia secular pero cuasi-religiosa de encuentro con un objeto singular, que entrañaba una relación íntima con una “lejanía” o la manifestación de un más allá. Si algo quedaba del aura en la época del broadcasting, como cierta pátina de prestigio adherida a la obra de un artista aún en la forma derivada de su reproducción industrial, con las tecnologías digitales la retirada del aura se profundiza hasta tornarse un punto sin dimensión en el horizonte: una referencia teórica que no tiene correlato alguno en la experiencia actual de la cultura. Los bienes culturales, muchas veces perdida su relación con un autor identificable, se precipitan ante nosotros en un torrente sin fin; en una lucha por nuestro interés en la que se las tienen que “arreglar por sí mismos”, sin expectativa, contexto o prestigio que prepare su recepción. La lógica de la escasez, que sigue rigiendo de manera implacable la circulación y el acceso a los bienes materiales, ha sido sustituida en el campo de la cultura por la problemática de la sobreabundancia, que nos resulta mucho menos familiar y para la que no parece que estemos preparados.
Entre sus efectos posibles se encuentran la saturación, el agotamiento y el aburrimiento. Quien se encuentra abrumado por el exceso de estímulos pierde la capacidad de discernir diferencias, de ver lo que cada cosa tiene de único y de formular juicios críticos. Pierde, en resumen, la capacidad de valorar que es la base de la experiencia artística, y no dedica por lo tanto el tiempo necesario para una apreciación cuidadosa. Si estados mentales de ese tipo se volvieran preponderantes en la cultura digital automatizada, terminaríamos por asistir a un proceso de “comoditización” del arte: su transformación en una suerte de medio estético homogéneo que impregna la vida entera, sin que nada se destaque o tenga efecto alguno más allá de los segundos o minutos que le dedicamos antes de que el siguiente contenido capture, de manera igualmente fugaz, nuestra atención.
La pregunta por el arte
Ahora bien, se podría objetar a esta penosa visión de una cultura ahogada en su propia abundancia que, en realidad, no todo es lo mismo, que en medio del ruido y la furia sigue habiendo producciones singulares y valiosas y que, siguiendo los pasos de Groys, somos excesivamente generosos al aplicar palabra “arte” a los torrentes de selfies, memes y videos de mascotas que inundan las redes sociales. Podríamos negarles también esa etiqueta a las producciones de cualquier tipo de sistema automatizado o, simplemente, no-humano. Entonces, antes de decretar cuál es el destino del arte en la era de la inteligencia artificial deberíamos tal vez responder a esta pregunta: ¿es efectivamente “arte” lo que hacen (o al menos una pequeña fracción de lo que hacen) los sistemas de aprendizaje maquínico? ¿pueden las computadoras ser agentes de producción artística?
Se trata, naturalmente, de una cuestión muy difícil de abordar, por al menos dos razones: una de índole práctica y la otra teórica. Primero, porque lo que esos sistemas son capaces de hacer está cambiando de manera acelerada: no era lo mismo hace seis meses, y sin duda será diferente en otros seis. Segundo, y más fundamental, porque tendríamos que ponernos de acuerdo en qué estamos diciendo cuando hablamos de “arte” — cometido notoriamente imposible. Sin embargo, estos escollos no impiden que, en ciertos rincones de las redes sociales, se desarrollen discusiones encarnizadas sobre esta misma cuestión (si es arte, por ejemplo, lo que hace quien ingresa unas instrucciones en Midjourney), que con frecuencia reactivan argumentos y controversias de antigua data, que ya circularon en torno del impresionismo, las vanguardias y las declaraciones de la muerte del autor. A esta altura de las cosas debería resultar claro para todo el mundo que no podemos aspirar a una definición o consenso que nos permita discernir aquello que es arte de lo que no lo es. Pareciera, sin embargo, que no podemos dejar de plantear la cuestión. Revitalizada por la apertura de una nueva frontera tecnológica, verificamos hoy una vez más la persistencia inagotable de la pregunta por el arte.
Hasta hace muy poco podíamos reposar al menos en el acuerdo elemental de que, sea lo que fuere, el arte se trataba de una actividad humana. Ahora, incluso esa certeza parece temblar. Hemos inventado máquinas que pueden hacer por sí solas cosas que se parecen mucho a cosas que llamamos “arte” durante mucho tiempo. En los foros de Internet hay gente que insiste en que Dall-E o ChatGPT siguen siendo herramientas al servicio de un creador humano, que pone en marcha el proceso ingresando unas instrucciones, y muchas veces selecciona los mejores entre una multiplicidad de producciones. Se embarcan incluso en un proceso iterativo de refinamiento de esos comandos llamado “ingeniería de instrucciones” (prompt engineering), con el fin de obtener resultados cada vez más elaborados y precisos. Pero el grado de imprevisibilidad y autonomía de estos sistemas sigue siendo, no obstante, enorme, al punto que cabe cuestionar si llamarlas “herramientas” sigue teniendo sentido. Al mismo tiempo la intervención humana se reduce a un mínimo: una suerte de estímulo inicial, que tal vez deje muy pronto de ser necesario (o que ya haya dejado de serlo, como lo demuestran los experimentos en curso con sistemas automáticos denominados Auto-GPT).
Las dificultades que hemos mencionado nos resguardan de cualquier pretensión de darle una respuesta final a estas preguntas. Sin embargo, nada impide que hagamos algunas observaciones con un formato condicional: si pensamos que el arte es tal o cual cosa, entonces las máquinas podrían (o no podrán jamás) hacer arte. Por ejemplo: si nos contamos entre quienes piensan que una obra artística es la manifestación de un talento singular, es decir, el resultado del dominio acabado de una técnica, fruto de una larga práctica, entonces es muy probable que las máquinas no puedan hacer arte. Una red neuronal que genera imágenes, por ejemplo, no puede empuñar un pincel, no se trenza en una lucha incierta con unos materiales rebeldes, sino que simplemente asigna valores de color a píxeles en una grilla. En otras palabras, opera en un ámbito de entidades matemáticas, y no tiene que vérselas con la materia.
El talento o la competencia técnica eran sin duda un requisito necesario en el marco del paradigma del arte que imperó en Occidente durante siglos (cuando menos, desde el Renacimiento). Pero desde principios del siglo XX ese pilar de la artisticidad fue cuestionado de maneras variadas y efectivas, entre las que se cuentan los experimentos dadaístas, el cuadrado negro de Malevich, el urinario de Duchamp, y la tradición del arte conceptual en general. Después de tales acontecimientos, se ha vuelto muy difícil sostener al talento como guardián en la puerta de entrada al territorio de lo artístico. Quienes insisten todavía en ello han quedado relegados a los suburbios de cierto academicismo retrógrado.
Este giro quitaría entonces una barrera para que las computadoras, desprovistas como están de cuerpo en cual, laboriosamente, hacer carne unas habilidades, sean artistas. Sin embargo, como observa Emanuele Arielli, hay aquí encerrada una paradoja: es el arte tradicional, “académico”, el que las redes neuronales mejor pueden copiar. El hecho de que tenga regularidades y procedimientos reconocibles lo torna imitable: podemos comprobarlo pidiéndole a Midjourney representaciones de cualquier cosa imaginable en el estilo de Rembrandt, Monet o Picasso. En cambio, estamos seguramente a considerable distancia todavía de que una máquina pueda producir un Duchamp: la línea conceptual que enhebra sus obras, formalmente muy diversas, es mucho más difícil de aprehender. Así, señala Arielli, se podría dar vuelta la crítica que tantas veces se ha usado para atacar al arte contemporáneo, “incluso un niño podría hacer eso”, y decir del arte académico “¡Incluso una inteligencia artificial podría hacer eso!” (8).
El espectro de un autor
Pero, en cualquier caso, el talento no parece ser el tema más candente. Las discusiones en las redes giran más bien en torno a diferentes versiones de si los productos de inteligencias artificiales (en inglés, “AI art”) tienen ciertas cualidades que, según algunos, son propias del arte y que sólo un creador humano puede otorgarles, como una intención, un mensaje, o un sentido que lo conecte con el resto del mundo. Sostienen, en definitiva, que las máquinas no pueden hacer arte porque el arte es comunicación, algo que sucede entre un emisor y un receptor (humanos) o, en otras palabras, que no hay arte sin autor.
Estos polemistas digitales retoman, en muchos casos probablemente sin saberlo, discusiones muy viejas. Reactivan una concepción tradicional del arte como vehículo de identificación o empatía, que nos permite “ponernos en los zapatos de otro” y mirar el mundo desde perspectivas diferentes a la nuestra. Por ejemplo, en el año 1897 León Tolstoi lo expresaba de esta manera:
El arte es una actividad humana que consiste en lo siguiente: que una persona, de manera consciente, por medio de ciertos signos externos, transmita a otras algunos sentimientos que ha experimentado, y que otras personas se vean afectadas por esos sentimientos y los vivan ellas mismas. (20)
Mucho más cerca de nosotros, en el 2016, John Berger volvió a recoger este hilo:
La función del de arte es llevarnos de la obra al proceso de creación que contiene. Al mirarla estamos, en efecto, mirando a través de los ojos del artista; ingresando en una instancia concreta de su mirada. Estamos mirando una mirada. Y, desde la mirada del artista, aprendemos acerca de las capacidades de nuestra especie y las posibilidades que encierra nuestro futuro… (Panorámicas 67)
Entre medio de estas dos manifestaciones tan cercanas en espíritu, sin embargo, pasaron muchísimas cosas. En particular, varias figuras cercanas al (post)estructuralismo francés desarrollaron críticas minuciosas de la figura del autor como recurso explicativo de la obra y fuente última de un sentido único que el espectador (o su versión profesional, el crítico) deberían desentrañar. Quien lo expuso de modo más nítido fue seguramente Roland Barthes, en un famoso artículo titulado, justamente, “La muerte del autor”. Allí decía:
[…] la escritura es la destrucción de toda voz, de todo origen. La escritura es ese lugar neutro, compuesto, oblicuo, al que va a parar nuestro sujeto, el blanco-y-negro en donde acaba por perderse toda identidad, comenzando por la propia identidad del cuerpo que escribe. (1)
Se trata de una valorización de la agencia y la autonomía del lenguaje mismo, que más adelante ilustra, curiosamente, refiriéndose a un autor específico:
En Francia ha sido, sin duda, Mallarmé el primero en ver y prever en toda su amplitud la necesidad de sustituir por el propio lenguaje al que hasta entonces se suponía que era su propietario; para él, igual que para nosotros, es el lenguaje, y no el autor, el que habla; escribir consiste en alcanzar, a través de una previa impersonalidad […] ese punto en el cual sólo el lenguaje actúa, “performa”, y no “yo”: toda la poética de Mallarmé consiste en suprimir al autor en beneficio de la escritura. (2)
Si nos sentimos cercanos a la tradición que representan Tolstoi y Berger tenemos que concluir que ningún arte puede provenir de las redes neuronales, ya que ellas no tienen (por el momento y hasta donde sabemos) sentimientos, conciencia, una mirada particular sobre el mundo o una historia personal. Son, en definitiva, sistemas electrónicos que manipulan información, encuentran regularidades estadísticas en grandes bancos de datos, e interpolan o extrapolan a partir de ellas. Lejos de tener una individualidad definida, un sistema text-to-image puede “pintar” en cualquier estilo que esté representado en los materiales con los que fue entrenado. Cuenta con una capacidad de mímesis universal que representa un potencial inagotable, pero que también lo despoja de toda singularidad. Esa mímesis se reduce a la capacidad de recombinar patrones y regularidades, pero se trata de un juego sintáctico puramente formal: la red no sabe qué está haciendo. En algunos casos esa inocencia perfecta salta a la vista: por ejemplo, en las manos. Versiones recientes de estos sistemas producían muchas veces figuras humanas perfectamente verosímiles hasta que uno llegaba a las manos, y se encontraba entonces con morfologías extrañas: muy pocos dedos, o demasiados, morfologías monstruosas, inciertos ovillos de carne. Los diseñadores de estos sistemas están, naturalmente, muy ocupados actualmente en el intento de solucionar estos problemas. Pero luchan contra una realidad muy fundamental de las redes neuronales.
Podríamos ilustrarlo de este modo: Las redes podrán pintar como Van Gogh, pero no pueden cortarse una oreja. No solo porque no tienen orejas (ni manos con las que cortarlas), sino porque son irremediablemente superficiales. Nada hay por detrás de la manipulación de símbolos. En la idea que tenemos de Van Gogh, la pintura y el seccionamiento de orejas son manifestaciones de la misma mente; señales visibles de algo más complejo, oscuro y profundo que no se agota en esas acciones: una forma particular de vivir, sentir y entender el mundo. Su estilo no es meramente una textura, o una forma particular de disponer trazos y colores, sino que trae a la superficie una intensidad singular. Está cargado de significado porque opera una cierta comunicación de lo incomunicable.
Ahora bien, tenemos que admitir, con los estructuralistas, que Van Gogh murió hace mucho, que no está aquí con su oreja cortada, y que aún si estuviera su presencia sería irrelevante para la relación que cada uno de nosotros pueda entablar con su obra: lo que hay ante nosotros, en el momento clave en el que podríamos decir que el arte sucede, es el cuadro, y nada más. Dado que, hoy en día, la inmensa mayoría de los encuentros con cuadros de Van Gogh suceden a través de una pantalla, y el aura del objeto original no es un factor que esté en juego, ¿por qué deberíamos tener experiencias diferentes ante una foto de un cuadro real y ante una imitación lograda de una IA? Que la segunda sea una producción artificial es un dato externo a la imagen, con el que podemos no contar y, en una suerte de test de Turing artístico, vernos efectivamente persuadidos de que es la obra de un autor humano.
Puede suceder, sin embargo, que la falsedad potencial de esa creencia no la torne irrelevante. Es decir, que nuestra experiencia ante la imagen no sea la misma si pensamos que proviene de una máquina o de un humano — o de tal humano en particular. No se trata de reponer al autor como “dueño” de la obra o como fuente privilegiada del sentido, si no por el contrario de pensarlo como una dimensión del acto de contemplación o lectura — de pensar, tomando la expresión de Michel Foucault, en una función autor que se construye de acuerdo con condiciones histórica y culturalmente variables, pero que también tiene efectos muy determinados. Es siempre una construcción o un fantasma, pero un fantasma que habla, un alma que atraviesa la materialidad de la obra insuflándole vida.
Una parte de esa función autor sería, por ejemplo, enhebrar juntas una serie de obras en aquello que, colectivamente, se llama “la obra” de un artista. Se despliega entonces una historia, una trama de continuidades y rupturas, un diálogo entre diferentes trabajos, que puede modificar por entero la apreciación de cada uno por separado. El autor permanece entre ellas como un punto de fuga sin dimensión, en el que sin embargo todas convergen. Nada de esto sucede en el caso de las redes: ellas no tienen historia. Cada producto de su funcionamiento se alza por sí solo, el resultado instantáneo de su entrenamiento, una consigna provista por un usuario, y una dosis de azar. Una vez hecho su trabajo, la red retorna, inalterada, a su estado originario. No hay crecimiento, acumulación ni investigación insistente de un problema.
El lenguaje que habla
Hay un sentido importante en el cual la versión actual de las, así llamadas, “inteligencias artificiales” es diferente de aquello que tantas veces anticipó la ciencia ficción del siglo XX. Los libros y películas nos mostraban en general robots o computadoras inteligentes que, aunque tuvieran un archivo enciclopédico de conocimientos, se comportaban como un individuo. Eran en el fondo la versión artificial de una mente humana. Pero las redes de hoy en día no son así. ChatGPT, por ejemplo, está entrenado con el contenido de texto de, básicamente, la Internet entera. Sus respuestas parecen provenir de un lugar de enunciación neutro, impersonal, equilibrado, políticamente correcto. Guarda una semejanza, en ese sentido, con otro producto de la inteligencia colectiva en la era digital: la Wikipedia. En el caso de Midjourney o Dall-E, han sido alimentadas con miles de millones de imágenes que representan una porción enorme de la cultura visual contemporánea. Como ya hemos observado, eso conlleva que pueden imitar cualquier estilo, pero también que carecen de uno propio (de no ser por ciertos glitches característicos, como las manos con muchos dedos).
Lejos de ser la reproducción tecnológica de un sujeto particular o de un autor, cada una de estas redes es a la vez todos y nadie: una suerte de sujeto colectivo o de “mente de enjambre”. La extracción gradual de regularidades durante el entrenamiento resulta en verdaderos archivos comprimidos de la esfera informacional en la que habitamos hoy en día los humanos. El parentesco con la compresión de archivos es más que una metáfora: en el transcurso de ese proceso la red es expuesta a una enorme cantidad de unidades de información (imágenes, texto, o lo que fuera) y va destilando paulatinamente lo que ellas tienen en común: regularidades y patrones que podemos imaginar como zonas más densamente pobladas en un espacio de posibilidades de muchas dimensiones que se denomina espacio latente.
Que los sistemas de los que venimos hablando estén entrenados con prácticamente todas las fuentes de información a las que es posible echar mano en Internet demuestra que las corporaciones tecnológicas que están por detrás de estos desarrollos actúan con puntillosa fidelidad a uno de los principios básicos del capitalismo: la privatización de los bienes comunes. Procediendo a una suerte de “extractivismo digital”, echan mano de las trazas informacionales que todos nosotros producimos a diario, sin detenerse en consideraciones sobre derechos de autor o atribución correcta. Es un acto de apropiación que las corporaciones excusan y minimizan por el hecho de que la red neuronal no retiene literalmente ninguno de los ítems con los que fue entrenada, sino que se queda apenas con un “aroma”, una síntesis etérea e invisible de estructuras en común entre ese fragmento de información y muchísimos otros que se le parecen.
Encontramos aquí otra versión de la muerte del autor: en la síntesis de lo común que operan las redes van a morir todas las singularidades, todas las historias personales, las diferencias idiosincráticas y los nombres propios. En cierto sentido, las redes son la realización tecnológica de un ideal estructuralista: cuando las ponemos a funcionar, es el lenguaje mismo (de la cultura contemporánea) el que habla. Para Descartes el uso razonado del lenguaje era una de las marcas del espíritu, que hace a los humanos algo más que meras máquinas. Ahora, sin embargo, hemos conseguido hacer una máquina de lenguaje que habla sola, y en esa automatización del espíritu, volvernos a nosotros mismos irrelevantes.
La regeneración de lo viejo
Ahora bien: ese archivo comprimido, ese descomunal ovillo de esencias destiladas que pueblan el espacio latente parece dotado de una potencia infinita. Nunca terminaremos de explorar los contenidos virtuales que, por mera interpolación y recombinación azarosa, podemos extraer de esa caja de Pandora. Pero puede suceder que la misma estructura que lo dota de virtualidades sin fin entrañe limitaciones insalvables. Es lo que, en una publicación del año 2020, proponen Vladan Joler y Mateo Pasquinelli. Empiezan por denunciar las “mistificaciones” de la inteligencia artificial, que en sus encarnaciones actuales no es alguna forma de cognición alienígena, sino un instrumento de magnificación de conocimiento, que ayuda a percibir patrones y correlaciones en gigantescos espacios de datos más allá del alcance humano. Es decir que no son aparatos sofisticados de cognición sino más bien de percepción, que amplían nuestras fronteras sensibles en el terreno de la información de modo análogo al microscopio y el telescopio en el campo óptico.
Que operen, como decíamos más arriba, a partir de una síntesis de lo común en una multiplicidad de datos es al mismo tiempo su poder y su límite último:
Como técnica de compresión de la información, el aprendizaje maquínico automatiza la dictadura del pasado, de taxonomías y patrones de comportamiento pasados sobre el presente. Este problema puede denominarse la regeneración de lo viejo: la aplicación de una visión homogénea de espacio-tiempo que restringe la posibilidad de un nuevo evento histórico.
La “regeneración de lo viejo” tiene como contraparte la “indetección de lo nuevo”, la ceguera para todo aquello que sea marginal, minoritario, extraordinario o en cualquier sentido ajeno a los patrones predominantes en el cuerpo de datos. En términos artísticos, esto equivaldría a decir que las redes neuronales están condenadas a operar dentro del territorio del cliché.
La trillada pregunta “¿la IA puede ser creativa?” debería reformularse en términos técnicos: ¿El aprendizaje maquínico puede crear obras que no sean imitaciones del pasado? ¿El aprendizaje maquínico puede extrapolarse más allá de los límites estilísticos de sus datos de entrenamiento? La “creatividad” del aprendizaje maquínico se limita a la detección de estilos a partir de sus datos de entrenamiento y luego a la improvisación aleatoria dentro de esos estilos. En otras palabras, el aprendizaje maquínico puede explorar e improvisar sólo dentro de los límites lógicos que están establecidos por los datos de entrenamiento. Para todos estos asuntos, y su grado de compresión de información, sería más preciso denominar el arte de aprendizaje maquínico como arte estadístico.
En la perspectiva de Joler y Pasquinelli vemos, por una parte, un intento tranquilizador de reponer la centralidad de lo humano al desplazar el aprendizaje maquínico al lugar de la herramienta (de conocimiento). Sin embargo, regresando a una pregunta que ya formulamos más arriba, la cuestión es cuánta autonomía, cuántos comportamientos imprevistos, cuántas sorpresas hacen falta antes de que decidamos que la palabra “herramienta” es definitivamente inapropiada. De forma parecida, podríamos sospechar que la capacidad de “improvisación aleatoria” dentro de los estilos representados en los datos de entrenamiento no es, a fin de cuentas, poca cosa. Los humanos, en tanto sistemas orientados a la repetición de secuencias aprendidas y al reconocimiento de patrones, somos particularmente malos para el azar. Basta con que hagamos el intento de pensar una serie de números “al azar”: no sólo encontraremos la tarea bastante trabajosa, sino que nos descubriremos haciendo trampa; inventando todo el tiempo reglas provisorias para pasar de un número a otro en una suerte de simulación poco lograda de lo imprevisto. Las computadoras, en cambio, cuentan con generadores de (pseudo)azar muy rápidos y eficientes, y son en ese sentido ampliamente superiores a nosotros.
Por cierto, ante algunas producciones extrañamente inquietantes de las redes text-to-image, o ante ciertas respuestas insólitas de los modelos de lenguaje natural, es difícil pensar que nos encontramos ante una mera “regeneración de lo viejo”. Por más que estemos de acuerdo en ese diagnóstico desde un punto de vista teórico, hay algo que no encaja con la experiencia. Buena parte de la conmoción social que están generando las tecnologías de aprendizaje maquínico en este momento tiene que ver con la sensación compartida de que está sucediendo algo nuevo, raro, difícil de entender y preocupante.
Por otra parte, mirando las cosas desde la dirección opuesta, podríamos preguntar: ¿Cómo creamos los humanos? ¿No somos acaso también máquinas de repetir? ¿No es la lucha interminable e íntima de cada artista encontrar estrategias y recursos para escapar a los clichés — tanto a los que saturan su medio ambiente cultural como a los propios? ¿No trabajamos siempre sobre la recombinación de materiales ya existentes? ¿No es acaso el cliché, por necesidad, siempre nuestro material y nuestro medio?
El segundo criterio al que apelaba Descartes para distinguir a los humanos de las máquinas era la libertad: el hecho de que no estemos predeterminados para la ejecución de una tarea particular. Sin embargo, todos sabemos cuánto nos cuesta hacer algo diferente de lo que hemos aprendido, de lo que ya es un hábito y se ha vuelto parte integral de nuestro ser. Podríamos encontrar que el generador de números pseudo-aleatorios de cualquier computadora, o el ruido a partir del cual construyen sus imágenes Midjourney y Dall-E son formas más humildes, pero también más eficaces, de la famosa libertad. Conversamente, detrás de la crítica de Joler y Pasquinelli parece esconderse todavía el espectro de ese espíritu libre que describía Descartes y que era un privilegio humano inalienable.
La generación automatizada de variaciones azarosas es desde hace tiempo un recurso para la producción de arte. Representa una de las tantas formas contemporáneas de ruptura con la figura del artista-genio que heredamos de siglos pasados, que supuestamente desarrollaba su trabajo creativo sobre la base de cierto acceso privilegiado a un plano trascendente, del susurro de la musa o de una fuente oscura y misteriosa de inspiración. La pionera del arte generativo Vera Molnar se refiere al potencial creativo del azar en estos términos:
Existe esta vieja idea romántica llamada “intuición”. El artista tiente talento, es un genio, se sienta, toma un trago… y crea. Y la intuición hace lo suyo. A veces produce algo bueno, a veces no. Ahora, cuando trabajamos con computadoras, somos modernos y decimos “la intuición está pasada de moda, no me interesa”. Pero hay algo que puede reemplazar a la intuición. Es el azar. Porque, por supuesto, tenemos máquinas cada vez más sofisticadas, que pueden mostrarte millones de posibilidades que, con tu limitada imaginación, jamás hubieras pensado. Así que enriquecen los sentidos.
En otras palabras, hay un reverso oscuro de la pregunta sobre si las máquinas pueden hacer arte o ser creativas. La mera formulación de ese interrogante conlleva el supuesto implícito de que el arte y la creatividad son privilegios humanos, y desde ese marco de referencia concede la posibilidad de que nuevas criaturas tecnológicas invadan ese jardín durante tanto tiempo vallado. Pero en la tarea de indagar esa cuestión, nos encontramos muy pronto con esta otra: ¿en qué medida los humanos somos mecánicos? Como señala Emanuele Arielli, el hecho de que unos sistemas artificiales hagan cuadros, melodías y poemas capaces de pasar por creaciones humanas, y aprueben por ende en un Test de Turing artístico, revela en su contracara que los humanos somos mucho más mecánicos de lo que pensamos. Ser creativo, nos dice, “es una etiqueta que un observador asigna a fenómenos cuyos procesos subyacentes desconoce” (18). Desde esta perspectiva, la creatividad sería una propiedad de las cajas negras: el efecto de superficie de un ocultamiento.
Los datos no sufren
Los seres humanos somos, desde el inicio, tecnológicos. Nuestras herramientas no sólo le dan forma a nuestro mundo, sino que configuran en cada tiempo y lugar la esfera de lo que podemos hacer y, por lo tanto, aquello que somos. Pero más allá de su funcionalidad práctica las herramientas son una manifestación palpable de nuestros deseos y capacidades, y por lo tanto un espejo en el que podemos mirarnos, un recurso heurístico para la autocomprensión. En este sentido, las redes neuronales no son diferentes. Ha llegado el tiempo de experimentar, en términos técnicos, cuál puede ser el significado concreto de palabras tales como “inteligencia”, “creatividad”, “imaginación” o “conciencia”. Las discusiones que solían ser competencia de filósofos y psicólogos ahora incluyen también a ingenieros y matemáticos.
Consideremos entonces la hipótesis de que el modo básico de operación de los humanos sea, al igual que las redes, la “regeneración de lo viejo”; de que se nos parezcan tal vez más de lo que quisiéramos, dado que tanto ellas como nosotros somos sistemas orientados a la extracción y reproducción de regularidades. Pero, aún si concedemos este punto, habría que observar de inmediato un sentido en el que todavía somos radicalmente diferentes. En el caso de los humanos, su cognición y comportamiento son irreducibles a un sistema predictivo: es necesario verlos, en todo caso, como el resultado de un complejo nudo de sistemas de diferentes tipos y niveles. En concreto, y a diferencia de las redes, tenemos un cuerpo, vivimos en un mundo material en el que nos chocamos con cosas y en una sociedad repleta de otros humanos con quienes conversamos, peleamos, trabajamos o hacemos el amor. A diferencia de ellas, tenemos hambre, deseo sexual, ambiciones, temores, inseguridades, y sabemos que nos vamos a morir. La creación humana, por ende, se gesta en condiciones más complejas. El cantautor Nick Cave, opinando sobre una canción escrita por ChatGPT “en el estilo de Nick Cave”, lo expresó de manera contundente:
Las canciones emergen del sufrimiento. Quiero decir con eso que dependen de la lucha interna y compleja de la creación y que, hasta donde yo sé, los algoritmos no tienen sentimientos. Los datos no sufren. ChatGPT no tiene un ser interior, no ha estado en ningún lado, no ha soportado nada, no ha tenido la audacia de avanzar más allá de sus limitaciones, y por lo tanto no tiene la capacidad para una experiencia compartida trascendente, dado que no tiene limitaciones que trascender.
Puede suceder que ambas cosas sean ciertas: por un lado, las redes hacen arte “como nosotros”, porque ambos trabajamos en el seno del cliché, a partir de la imitación y mezcla de modelos conocidos. Pero desde otra perspectiva somos totalmente diferentes, porque ellas operan dentro de la armonía estancada del espacio latente, como una suerte de versión tecnológica del mundo de las Ideas de Platón. Nosotros, por el contrario, trabajamos desde un nudo de tensiones nunca resueltas y siempre cambiantes entre las múltiples fuerzas que nos atraviesan (físicas, conceptuales, afectivas, sociales, políticas…) y que confluyen todas en ese lugar vacío pero tormentoso que llamamos “yo”. Ellas crean desde la generalidad de lo común. Nosotros creamos desde la singularidad absoluta de nuestro lugar en el mundo.
Está claro que Nick Cave se inscribe, junto a Tolstoi y Berger, en la tradición que concibe al arte como un vehículo de empatía. Pero tenemos que decir: si el arte no es comunicación, si no hace falta que supongamos a nadie del otro lado de la obra, entonces “arte” es sinónimo de “placer estético” o “belleza” o “estímulo interesante”. Sucede completamente del lado del receptor: es arte lo que a mí me parece artístico. Eso no parece encajar bien con el uso que le damos habitualmente a la palabra. En la naturaleza encontramos cosas que nos producen ese tipo de sensaciones, y que sin embargo no llamamos arte. Nadie las hizo, no expresan una intención comunicativa, no son un mensaje.
Nos vemos en la necesidad de discernir entre la obra como arreglo formal de elementos (palabras en una serie, colores en el espacio, notas musicales en el tiempo) y la obra como algo que dice algo acerca de algo (que no es la obra). Por un lado, la obra en tanto es un mundo en sí misma. Por otro, la obra en tanto forma parte de un mundo. Con más precisión, debemos diferenciar entre sus aspectos sintácticos y semánticos.
En torno a lo segundo, no se trata de pretender que cada obra tiene un significado, como una palabra en un diccionario. Pero si vemos a la obra como un mensaje, no sólo necesitamos postular un autor implicado, sino también un campo virtual de propuestas, alusiones o preguntas expresadas por ella. En tanto composición de elementos, nada impide que una máquina se vuelva tan buena como un autor humano, e incluso lo supere en sutileza y complejidad. En tanto mensaje sobre algo más, las máquinas no tienen nada que hacer, porque no saben nada de nada que no sea el lenguaje mismo.
La cuestión del valor en el arte en la época de su producción automatizada se plantea entonces como una suerte de encrucijada. Tenemos ahora unas máquinas que son extraordinariamente eficientes en la tarea de producir simulacros de mensaje: unidades de información que se ven exactamente como si alguien estuviera expresándose, pero detrás de las cuales no hay nadie. Hasta allí no quedaría otro destino para esa actividad humana que solíamos llamar “arte” que su disolución definitiva en la producción industrial de lo único. Pero puede suceder que todavía haya una “salsa secreta” que distingue a las producciones humanas de las maquínicas. Para Nick Cave ese ingrediente fundamental es el sufrimiento. Más en general, se trataría de la singularidad del nudo de tensiones afectivas que habita en cada uno de nosotros. Ese es el núcleo que parece, por el momento, estar lejos de cualquier posibilidad de reproducción tecnológica.
La situación plantea demandas para todas las partes involucradas — que no son nuevas, pero que tal vez adquieran ahora una renovada intensidad. Del lado del receptor, el desafío de conservar despierta la sensibilidad necesaria para discernir, en medio del ruido infinito, los mensajes que le hablan de un modo personal y que pueden ayudarle a estar menos solo, a ver las cosas de otro modo y a compartir un poco el peso de vivir en un mundo desquiciante. De lado del creador, el imperativo de ser menos maquínico, de recurrir a lo más íntimo de su humanidad para expresar mensajes singulares que no queden sumergidos en el océano iridiscente de la cultura automática.
Este texto fue presentado como ponencia en las Primeras Jornadas de Economías Digitales (Filosofía, Política y Arte), en la Universidad Nacional de San Juan (Provincia de San Juan, Argentina), el día 9 de junio de 2023.
Bibliografía
Arielli, Emanuele. “Even and AI could do that”. Artificial Aesthetics: A critical guide to AI, Media and Design. Publicación independiente, 2021. http://manovich.net/index.php/projects/ai-aesthetics
Barthes, Roland. La muerte del autor. Publicación online, 2009. https://teorialiteraria2009.files.wordpress.com/2009/06/barthes-la-muerte-del-autor.pdf
Benjamin, Walter. “La obra de arte en la época de su reproductibilidad técnica”. Discursos interrumpidos I. Taurus, 1989.
Berger, John. Modos de ver. Editorial Gustavo Gili, 2010.
Berger, John. Panorámicas: Ensayos sobre arte y política. Editorial Gustavo Gili, 2019.
Cave, Nick. The Red Hand Files. Issue 218. 2023. https://www.theredhandfiles.com/chat-gpt-what-do-you-think/
Foucault, Michel. ¿Qué es un autor?. El cuenco de plata, 2010.
Groys, Boris. “Introducción: Poética vs. estética”. Volverse público. Caja Negra, 2014.
Molnar, Vera. Randomness. Video online, 2019. https://muda.co/veramolnar/
Pasquinelli, Matteo y Joler, Vladan. The Nooscope Manifested: Artificial Intelligence as Instrument of Knowledge Extractivism. KIM HfG Karlsruhe and Share Lab, 2020. http://nooscope.ai
Tolstoi, Leon. ¿Qué es el arte?. Eneida, 2018.