¿Sabías que las imágenes de Crónicatech están creadas con inteligencia artificial? Ha sido un recurso valioso para dar un toque único al sitio sin invertir grandes sumas de dinero. En este artículo encontrarás las opciones más relevantes para hacer imágenes de inteligencia artificial a partir de texto (T2I -texto to image-), así como sus limitaciones y sus costos. La mayoría de los servicios existentes ofrecen un periodo de prueba gratuito, pero después debes pagar.
En cada una de las plataformas, hice una prueba compleja para que resulten claras las diferencias entre cada plataforma: le pedí a cada una generar un logo de WhatsApp tomando café.
Esta instrucción pone a prueba la inteligencia de estos sistemas porque elaborar un producto coherente bajo esa premisa demanda abstracción y creatividad. Veamos cómo le fue a Dall-E 2, Stable Diffusion, Craiyon, Jasper y Neural Love.
Lee también: 5 formas creativas de usar ChatGPT para tus estrategias de marketing
Dall-E 2
Dall-E 2 es el servicio ofrecido por OpenAI. Cuando te registras, la plataforma te ofrece 50 créditos gratuitos para probar. Cada consulta que hagas, gastará un crédito. También puedes subir imágenes a la plataforma y pedirle que le haga ajustes o variaciones. Este tipo de uso también consume créditos.
La opción más poderosa es la de generación de imágenes a partir de texto. El sistema entenderá tanto tus consultas en inglés como en español. Mientras lo usas, Dall-E te dará ejemplos de uso y trucos para aprovechar su potencial al máximo. Si añades ciertas palabras clave a tu consulta, los resultados serán más pulcros o tendrán un estilo gráfico o un tono específicos. Las imágenes que vayas solicitando se guardarán en la pestaña “History”.
Dentro de las palabras clave recomendadas encontramos:
- Digital Art (o arte digital), para generar imágenes con un acabado más profesional
- Illustration (o ilustración), para generar ilustraciones
- Expressive illustration (o ilustración expresiva), para un estilo explosivo y ochentero.
- Photorealist, para un estilo fotorealista.
- Cyberpunk illustration, para un estilo futurista.
- Painting, para que luzca como una pintura
- Y muchas más opciones. Revisa con atención las sugerencias de la plataforma.
Si quieres que las imágenes tengan un estilo similar al de un artista específico, solo lo debes indicar en la descripción.
Limitaciones
- Si le pides incluir un texto dentro la imagen casi nunca va a incluir la palabra exacta. A cambio, incluirá un texto que luce similar. Lo mismo ocurre con los números. Por ejemplo, si le pides incluir el número 2023, obtendrás una imagen con cualquier número parecido, menos el 2023. No sé por qué ocurre esto, pero así funciona.
- No reproduce logos de empresas reconocidas. No le puedes pedir, por ejemplo, crear una modificación del logo de WhatsApp.
- Es mejor cuando le brindas una descripción muy detallada y específica de la imagen que requieres.
- Todas las imágenes que genera son en formato 1024 x 1024.
- Los 50 créditos gratuitos se esfumarán pronto. Si quieres comprar más créditos, son un poco costosos: 15 dólares por cada 115 créditos.
- No recomiendo el uso de la herramienta “Variaciones”. Rara vez, estas modificaciones superan la imagen original.
- Por cada solicitud genera un máximo de 4 imágenes.
Prueba: dibuja un logo de WhatsApp tomando café
Dall-E produce una aproximación a lo requerido sin reproducir de forma evidente el logo de WhatsApp. Ninguna de las imágenes es llamativa, pero logró hacer una interpretación aproximada de lo requerido uniendo los dos conceptos principales, “WhatsApp” y “café”. Las imágenes generadas parecen ser originales.
Stable Diffusion
Stable Diffusion fue lanzado, de forma oficial, en agosto de 2022. Esta herramienta es gratuita. Esto deriva en que, como ocurre con ChatGPT en la actualidad, a veces no esté disponible o que existe una fila de espera para procesar tu solicitud.
Stable Diffusion afirma que la plataforma será gratuita por siempre. Manejan una licencia CreativeML Open RAIL-M. “Los autores no reclaman ningún derecho sobre los productos que genera la plataforma”, indica el sitio. “Eres libre de usarlos y eres responsable de su uso, que no debe ir en contra de las disposiciones establecidas en esta licencia”.
Stable Diffusion entiende textos tanto en inglés como en español y también es capaz de generar imágenes con el estilo que defina el usuario. La plataforma, en principio, se asemeja a Dall-E 2, con una gran salvedad: hay que tener cuidado con los productos que genera porque pueden ser copiados, sin autorización, de otros artistas.
En el caso de Dall-E, la plataforma nunca reproduce logos de marcas reconocidas. Stable Diffusion no parece tener problema con ello. Al parecer la plataforma funciona bajo parámetros de originalidad menos restrictivos. Las imágenes se producen en, más o menos, 12 segundos.
El método de financiación de este plataforma son los anuncios de Google Adsense. Por cada solicitud genera 4 imágenes.
Resultados de la prueba
Stable diffusion genera una mezcla de imágenes de poco valor. Parece hacer una modificación del logo de WhatsApp. El resultado tiene mucho menos sentido, y menor atractivo estético, que aquellos ofrecidos por Dall-E 2.
Craiyon
Craiyon antes era conocido como Dall-E mini. Resulta evidente que se trata de una plataforma que usa una versión menos avanzada de Dall-E. Las imágenes que arroja suelen ser de muy baja calidad y se demora entre un minuto y dos generando cualquier solicitud. Este proyecto también se financia con Google Adsense y, en consecuencia, es gratuito.
El sitio fue fundado por dos exintegrantes del proyecto Dall-E mini. Aseguran que las imágenes están libres de derechos aunque se deben revisar los términos de uso si se quiere hacer uso comercial de las mismas. Por cada solicitud genera un máximo de 9 imágenes.
Resultados de la prueba
Resulta claro que Craiyon es un servicio con un modelo de inteligencia artificial menos avanzado que el de Dall-E 2 y Stable Diffusion.
El sistema no fue capaz de interpretar correctamente la instrucción. Lo más llamativo es que copió el logo de WhatsApp de forma integra y le adicionó unas semillas de café.
Este resultado invita a evitar su uso. Si reprodujo el logo, también cabe esperar que haga reproducciones exactas de imágenes con derechos de autor.
Lee también: Wikipedia: la odisea para que tu empresa sea incluida
Jasper Art
Jasper es uno de los servicios de generación de contenidos por inteligencia artificial más maduros. Ofrece un periodo de prueba por 5 días. La compañía soporta varios servicios, uno de ellos es para generar contenidos escritos como ChatGPT. En este artículo nos centramos en su división Jasper Art, enfocada en generación de imágenes por inteligencia artificial.
¿Cuánto cuesta? 20 dólares mensuales o 200 dólares anuales.
Con la suscripción, se ofrece lo siguiente:
- Generación ilimitada de imágenes
- Escalamiento de imágenes
- Soporte para 27 idiomas
- Se guarda tu histórico de imágenes.
- Prometen mejoras continuas en el sistema de inteligencia artificial
Para empezar el periodo de prueba debes añadir una tarjeta de crédito. Si dejas pasar 5 días y no cancelas tu suscripción, se te cobrará un mes de forma automática. Esto ya pasa en otras plataformas con un modelo similar, tenlo en cuenta. Jasper dispone de una extensión de Chrome, otro punto a favor.
Resultados de la prueba
El resultado de la prueba demuestra que este modelo de inteligencia artificial es mejor que el que Craiyon o el de Stable Diffusion. La última imagen generada resulta ser una aproximación mucho más certera de lo solicitado. La plataforma también evita replicar logos de marcas reconocidas. Esto nos lleva a pensar que no incurren en la copia flagrante de arte original.
La interfaz de Jasper Art es superior a la de Dall-E 2. Me gustó que incluyan una seria de menús desplegables con opciones para el tono, el formato, la inspiración, el estilo, las palabras clave y el idioma deseado.
Además, Jasper incorpora un servicio que no vemos en otras plataformas: puedes subir una imagen y agregarle elementos gráficos mediante una instrucción en texto. Sin embargo, parece ser que este modelo aún se encuentra en ciernes porque nunca nos arrojó un resultado coherente.
Este mismo fenómeno ocurre cuando solicitamos imágenes a partir de texto. El sistema logra bonitas imágenes pero rara vez cumple con lo que le solicitamos con precisión.
Neural.love
Neural.love ofrece una modalidad de servicio gratuito que arroja imágenes de baja resolución (no superan los 100 kb de peso). Si se quiere mejorar los resultados e incrementar su tamaño y resolución, debes gastar créditos. La plataforma te ofrece 5 créditos gratis para pruebas. 300 créditos tienen un valor de 30 dólares y los créditos no usados se transfieren al mes siguiente.
Esta plataforma es más demoraba que Dall-E para generar imágenes. El proceso toma alrededor de 60 segundos.
Neural.love permite generar imágenes en diferentes formatos: vertical, horizontal y cuadradas. Si queremos imágenes en alta definición, el costo es de 2 créditos. La interfaz plasma un menú desplegable con diferentes categorías artísticas -es decir, una serie de estilos que podemos preseleccionar para que la imagen de ajuste a una corriente gráfica definida- como:
- Painting
- Fantasy
- Anime
- Sci-Fi
- Cyberpunk
- Entre otros
Lee también: SEO para TikTok: el experimento de la bebida de Barbie en Starbucks
Resultados de la prueba
Neural.love ofrece resultados erráticos y sin sentido cuando se le hacen solicitudes en español. Como aspecto positivo, no reproduce el logo de WhatsApp de forma reconocible. Esto lleva a inducir que trata de elaborar gráficos sin robar contenido original de otras fuentes.
Este otro resultado tampoco tiene sentido en absoluto.
Sin embargo, al pedirle la imagen con instrucciones en inglés, sorprende que logró este resultado, mucho más cercano a lo que se pidió.
Esta es otra interpretación de la instrucción otorgada. Parece ser un café con una versión alterada del logo de WhatsApp en la parte superior.