Javi López ⛩️
Javi López ⛩️

@javilop

32 Tweets 5 reads Jan 01, 2023
FAQ de IAs generativas (Dalle2, MidJourney, SD) 🤖
Hay ciertas preguntas que surgen una y otra vez con este tema. Es normal: como toda vanguardia se va abriendo camino y más y más gente se interesa.
He reunido aquí las principales preguntas y respuestas BIEN desarrolladas 🧵👇
(1) ¿Qué son?
En este artículo las explico al detalle: sumapositiva.com
(2) ¿Cuáles son las herramientas que más utilizas? ¿Por dónde empiezo?
Aquí tienes una lista. Pero ojo, esto cambia MUY rápido. Va a la velocidad de la luz:
(3.1) Copyright. ¿A quién pertenecen la imágenes creadas?
No hay jurisprudencia al respecto, por lo que a no ser que los términos de uso de la plataforma en las que las generes diga lo contrario, en términos generales el copyright sobre las img. es de quien las genera.
SIGUE👇
(3.2) Las principales plataformas como StableDiffusion, MidJourney y Dalle-2 dejan claro en sus términos de uso que ceden la autoría de las imágenes a los usuarios que las generen.
(3.3) Si vives en USA: supuestamente (no está del todo claro) allí no existe protección de copyright para obras generadas únicamente por una máquina. PERO, los derechos de autor sí son posibles en los casos en que el creador pueda probar que hubo participación humana sustancial.
(3.4) Por ejemplo, en USA, ha salido a colación varias veces en prensa temas relacionados con una obra (un comic, "Zarya of the Dawn") que ha sido rechazada por la oficina del copyright recientemente.
(3.5) La artista ha puesto un recurso, dado que alega que la dirección de cada viñeta del comic, así como el hilo conductor de la historia, prueba "participación humana sustancial".
¡Veremos en qué acaba!
(3.6) Si no vives de USA, a día de hoy, nada de esto te aplica.
Si aún así tienes duda: basta con que cambies la imagen generada lo suficiente para que la autoría quede clara que es tuya.
(3.7) Y en el peor de los casos, imaginar un mundo en el que otras personas puedan aprovechar las imágenes/vídeos/creaciones que hayas generado para tu proyectos en sus propias creaciones, no me parece personalmente un drama. El Open Source llevado al extremo.
(4) ¿Significa esto que puedo crear un comic de Super Mario con IA y venderlo?
¡Por supuesto que no!
Personajes como Mickey Mouse, Spiderman, etc. están protegidos por IP. Da igual si los dibujas a carboncillo o con IA... no puedes vender una obra en la que aparezcan.
(5.1) ¿Puedo al menos imitar estilos? Me gustaría hacer un comic estilo "Studio Ghibli".
¡Sí, puedes!
Los estilos no tienen copyright. De hecho Studio Ponoc, formada por ex-trabajadores de Studio Ghibli está haciendo películas al más puro estilo Ghibli sin problemas.
(5.2) Otro ejemplo: ¿recuerdas la peli Anastasia? ¿Parece de Disney, no? Pues no. Era de Fox. Y ningún problema.
Por fortuna los estilos no pueden tener derechos de autor, o el diseño y el arte estarían en un bloque perpetuo.
(6.1) ¿Están copiando las IAs? ¿Hacen "collages"?
Os dejo con este vídeo de @DotCSV.
(6.2) Según explica, las IAs no copian ni hacen collages.
"Observan" una ingente cantidad de img. y "aprenden" a descomponerlas en patrones de alto nivel que las conforman (trazos, composición, etc).
Luego, sobre estos patrones, pueden fusionarlos para llegar a nuevas ideas.
(6.3) En definitiva: observan obras de todo tipo y de cualquier artista como podría hacer un humano, aprenden los patrones de alto nivel y finalmente los fusionan llegando a nuevas creaciones.
(6.4) En el futuro su número de inputs podría ser aún mayor: modelos tridimensionales del cuerpo humano y de cualquier animal para comprender perfectamente su anatomía, "ojos" en el mundo real a través de cámaras, sonidos, música, etc...
(6.5) Os dejo también con este vídeo de @AntonioCREA13 que lo explica muy bien, desde el punto de vista de un artista:
youtu.be
(7.1) ¿Por qué entonces a veces generan firmas o marcas de agua?
Porque entienden que es un "patrón de alto nivel".
Si por ejemplo la IA ha observado cuadros de 1800 con firma, y le pides que te dibuje un cuadro, puede tender a intentar generar una "firma" imaginaria.
(7.2) ¿De dónde saca la firma entonces? La inventa.
De la misma forma que genera una cara nueva, la IA a veces genera firmas que podríamos considerar como "una media de algunas de las firmas observadas".
Lo mismo con títulos, logos, piñas, zapatos, etc...
(8.1) ¿Es posible que una IA genere dos imágenes iguales?
No, los modelos de difusión, incluso utilizando un número semilla (con el que puedes forzar que la imagen se genere prácticamente igual) son NO deterministas, por lo que siempre habrá algunas pequeñas diferencias.
(8.2) No estoy seguro de en qué capa (¿software? ¿hardware?) surge ese azar. Aún no he conseguido alguien que me responda a esa pregunta. ¿Quizás @antor lo sepa?
(9.1) ¿Qué limitaciones tienen a día de hoy?
Una famosa es la de las manos: se les dan fatal 😂. Tampoco son buenas con textos/fuentes.
Y en general tienen infinidad de pequeños fallos que muchos disfrutan señalando.
(9.2) Pero ten en cuenta que hace apenas un año no eran capaces más que de crear un icono de un aguacate silla... y ya a día de hoy pueden generar un fotograma de una peli imaginaria, con actores inventados.
(9.3) Es solo cuestión de tiempo que sus generaciones sean perfectas e indistinguibles de cualquier ilustración, render o fotografía creadas por un humano. Y +adelante, vídeo y tiempo real.
Como pasó en la peli The Artifact, que os recomiendo muy mucho 😉
(10) ¿Son arte? ¿Son creativas?
Uf, esos debates son taaaaaan de 2022 😂
«El arte tiene la bonita costumbre de echar a perder todas las teorías artísticas.» — Marcel Duchamp.
Busca: #noesarte 👉
En realidad da un poco igual. Existen.
(11.1) ¿Hacia dónde se mueve todo esto?
No debería poner predicciones en una FAQ, pero... oye, es mi FAQ 😂
Creo que la industria del diseño, entretenimiento, videojuegos, cine, etc. van a sufrir un tsunami transformador en los próximos años.
(11.2) Creo que todas suites de diseño acabarán integrando la IA y que en breve trabajar con IAs no se simplificará al hecho de escribir un prompt y esperar una generación, sino que EN TIEMPO REAL se podrán ir moldeando todos los detalles, estilo, iluminación, materiales, etc.
(11.3) De hecho, aunque rudimentarios, están ya saliendo plugins como churros. Y la forma de trabajo no es "escribo un buen prompt y pista". No, es un proceso de trabajo completo.
Y el in-painting se van a quedar en juguete cuando llegue el tiempo real.
youtu.be
(11.4) Y al poder ejecutarse en tiempo real, vendrán no solo una nueva forma de diseñar "líquida"... sino también videojuegos y CGI cuyas imágenes no tendrán una base poligonal, sino generadas pixel a pixel en tiempo real: el videojuego generativo llevado al extremo.
(11.5) Hasta un niño de 5 años, hablando y moviendo sus manitas, podrá crear mundos de fantasía.
¡Hacia ahí nos movemos!
Por cierto, estoy seguro que esta FAQ se va a quedar obsoleta en prácticamente todos sus puntos muy rápidamente.
¡Esto va muy rápido!
(12) ¿Existe alguna guía para iniciarse en esto de las IAs generativas?
¡Me alegro que lo preguntes! 🤣
Estoy trabajando en una que encima viene con novela gráfica de horror cósmico. ¡Los mecenas tendrán acceso al borrador online en breve!
libros.com

Loading suggestions...