Descubre los 4 trucos para crear imágenes increíbles con IA

Sergi Rodríguez  
19-08-2024 12:13  
13 minutos de lectura  
Cuando le das a una IA generadora de imágenes una instrucción poco precisa, el resultado puede ser sorprendentemente alejado de lo que esperabas. En este artículo, te comparto cuatro consejos clave para lograr que la IA entienda y ejecute exactamente lo que tienes en mente.
 
Desde cómo describir los elementos de la imagen, hasta la importancia de usar inglés en las instrucciones, pasando por el apoyo que puedes obtener de las IAs generadoras de texto, aquí encontrarás todo lo que necesitas saber para mejorar drásticamente los resultados de tus creaciones.

Esta imagen es lo que obtienes cuando le das una mala instrucción a una IA generadora de imágenes: "Anuncio cartel neumáticos de ocasión para coches, furgonetas y camiones". Claramente la imagen producida no es lo que el usuario esperaba.

🔸Primer consejo: DESCRIBIR

A las IAs generadoras de imágenes le has de dar una descripción de los elementos de la imagen. En este caso, algo como: "Una fila de neumáticos ordenados de menor a mayor sobre una carretera vacía en el desierto." (por poner un ejemplo). No le hagas preguntas o esperes que le ponga creatividad para decidir qué incluir o no en la imagen.

Los detalles de más que coloque la IA de imágenes serán para "rellenar" o "adornar" e irán en consonancia con los elementos que le hayas pedido. Pero si le pides algo como "Haz un anuncio para neumáticos de coches y camiones", puede salir cualquier cosa, y posiblemente muy alejado de lo que esperabas.

🔸 Segundo consejo: USAr IA DE TEXTO

Si lo que quieres es algo de ayuda por parte de una IA para posibles ideas de COMPOSICIÓN de esa imagen, entonces debes ir a una IA generadora de texto (chatGPT, Claude, Llama, Mistral, etc.) y tener una CONVERSACIÓN explicándole acerca de la intención y función de tu imagen. Y pidiéndole que te de varias ideas alternativas.

Finalmente, incluso es muy útil cerrar esa conversación pidiéndole algo como: "Redacta una descripción de esta idea de imagen con todo detalle, para que una IA generadora de imágenes pueda crearla.". Y verás que te dará una descripción que te va a funcionar muy bien. Abajo te muestro unos cuantos ejemplos prácticos.

🔸 Tercer consejo: USAR INGLÉS

Las IAs generadoras de imágenes trabajan 10 veces mejor si les das la descripción de la imagen en inglés!! Usa una IA de texto para traducir del español al inglés. No trates de hacerlo tú mism@!!! digo, a menos que tengas nivel nativo. En este tipo de composiciones, escoger la palabra correcta determina demasiado el resultado.

🔸 Cuarto consejo: REDUCIR TEXTOS

De momento las IAs generadoras de texto tienen bastantes problemas para agregar texto a las imágenes que producen. Estoy usando FLUX que es la más avanzada en este sentido (hasta donde sé, y a día de hoy Agosto 2024), y se sigue confundiendo muchísimo.

Si el texto que quieres poner es de una sola palabra aumenta por mucho las probabilidades de que lo escriba bien. Y si es en inglés, incluso frases completas sin problema. Lo malo es en otros idiomas, como el español. 🙁

Por tanto, mi consejo es que 1) uses poco texto, 2) tal vez el texto lo agregas después con una herramienta de edición gráfica clásica.
 

😎 Procedimiento recomendado

1. IA GENERADORA DE TEXTO

En mi caso he ido a chatGPT, pero puedes usar ClaudeAI, Llama (de Meta), Mistral, Perplexity, o cualquier otra plataforma donde puedas interactuar con un chatbot conversacional tipo LLM.

Le he hecho esta petición:

"Ayúdame a generar un baner gráfico que sirva como Anuncio cartel neumáticos de ocasión para coches, furgonetas y camiones. Dame 3 alternativas interesantes."

y me ha respondido esto:

Aquí tienes tres ideas diferentes para un banner gráfico sobre la venta de neumáticos de ocasión:

1. Opción 1: Estilo moderno y profesional
   - Fondo: Un fondo oscuro con un patrón sutil de textura de neumático.
   - Texto principal: "¡Neumáticos de Ocasión para Cualquier Vehículo!"
     - Subtexto: "Coches, Furgonetas y Camiones"
   - Elementos gráficos: Imágenes de neumáticos de diferentes tamaños colocados estratégicamente, como si estuvieran alineados en una fila, resaltando la variedad disponible.
   - Llamada a la acción: Un botón prominente que diga "Ver Ofertas" en color rojo o amarillo para captar la atención.

2. Opción 2: Estilo llamativo y dinámico
   - Fondo: Colores vibrantes, como rojo y negro, con un efecto de velocidad o movimiento.
   - Texto principal: "¡Las Mejores Ofertas en Neumáticos de Ocasión!"
     - Subtexto: "Desde coches compactos hasta camiones pesados"
   - Elementos gráficos: Un coche deportivo, una furgoneta y un camión en diferentes ángulos, con neumáticos destacados en primer plano. Podrías incluir un medidor de ahorro en una esquina.
   - Llamada a la acción: Un banner inferior con "Compra Ahora y Ahorra".

3. Opción 3: Estilo limpio y minimalista
   - Fondo: Blanco o gris claro con sombras suaves.
   - Texto principal: "Neumáticos de Ocasión para Cada Necesidad"
     - Subtexto: "Calidad a Precios Imbatibles para Coches, Furgonetas y Camiones"
   - Elementos gráficos: Una sola imagen central de un neumático de alta calidad con reflejos, acompañado por pequeños íconos de coche, furgoneta y camión.
   - Llamada a la acción: Un botón en azul que diga "Descubre Más".

Estas opciones te dan variedad en cuanto a estilo y enfoque, para que puedas elegir la que mejor se ajuste a la imagen que quieres proyectar. ¿Te gustaría que generara una de estas alternativas como imagen?

Entonces el siguiente paso es pedirle que no los ponga más fácil para trabajar con la IA generadora de imágenes, y le pedí esto:

Ok, me encantó la primera. Redacta por favor un párrafo descriptivo para una IA generadora de imágenes, dando todos los detalles que puedan ayudar.

A lo que respondió:

Create a modern and professional banner advertising second-hand tires for cars, vans, and trucks. The background should be dark with a subtle tire texture, giving a sleek and industrial feel. The main text reads "¡Neumáticos de Ocasión para Cualquier Vehículo!" in bold, metallic silver letters, with a smaller subtext below: "Coches, Furgonetas y Camiones" in a lighter shade of silver or white. Arrange images of tires in different sizes, aligned horizontally, to showcase the variety available. Each tire should be realistically detailed, with highlights and shadows to emphasize their texture and quality. Include a prominent call-to-action button in the lower right corner that says "Ver Ofertas" in bold red or yellow, contrasting sharply with the dark background. Ensure the overall layout is balanced, with the text and images well-distributed, giving the banner a professional and eye-catching look.

2. IA GENERADORA DE IMÁGENES: FLUX

Entonces me fui a la plataforma fal.ai donde puedes darte de alta gratuitamente y te regalan $12 USD de saldo para usar cualquiera de las IAs generadoras de imágenes que tienen, y usé el modelo FLUX-PRO (de Black Forest Labs, en Alemania) que es el más avanzado a día de hoy, apenas hace un mes que fue su estreno mundial y ha sido todo un exitazo.

Veamos la imagen que me generó con el prompt anterior:

No está nada mal! mucho mejor!! ahora si parece un banner gráfico publicitario. Aunque tal como puedes ver, ¡¡el texto está nefasto!!

De hecho, me fui de nuevo a chatGPT y le pedí un prompt para generar la segunda idea que me había propuesto y me dió esto:

Create a vibrant and dynamic banner for second-hand tires, targeting cars, vans, and trucks. The background should feature bold colors like red and black, with a motion effect to convey speed and energy. The main text reads "¡Las Mejores Ofertas en Neumáticos de Ocasión!" in large, bold white letters, with a subtext underneath: "Desde coches compactos hasta camiones pesados" in a smaller, italicized font. Include dynamic images of a sports car, a van, and a truck, positioned at different angles to create a sense of motion. Highlight the tires prominently in the foreground, ensuring they appear glossy and new. In one corner, add a small savings meter to emphasize affordability. At the bottom of the banner, include a bright, eye-catching call-to-action bar with the text "Compra Ahora y Ahorra" in bold letters. The overall design should be energetic and attention-grabbing, perfect for attracting customers looking for a great deal.

y al darle ese prompt a FLUX-PRO generó esto otro:

¡es mucho más espectacular! y también sigue teniendo ese aspecto de anuncio publicitario que andamos persiguiendo. Aunque de nuevo, el texto en español quedó ilegible.

Repetí el proceso para la última idea de chatGPT y me dió este prompt:

Design a clean and minimalist banner for second-hand tires suitable for cars, vans, and trucks. Use a light background in white or soft grey, with gentle shadows to add depth. The main text reads "Neumáticos de Ocasión para Cada Necesidad" in sleek, modern black or dark grey letters, centered on the banner. Below, in smaller, lighter text, add the subtext "Calidad a Precios Imbatibles para Coches, Furgonetas y Camiones." Place a single, high-quality tire image in the center of the banner, with detailed reflections and textures to showcase its quality. Surround the tire with small, subtle icons representing a car, a van, and a truck, evenly spaced around it. In the bottom center, include a simple blue call-to-action button that reads "Descubre Más" in a clean, readable font. The overall aesthetic should be refined, with a focus on simplicity and elegance, appealing to a discerning audience.

y al dárselo a FLUX me generó esto:

¡también está estupenda! y de nuevo el texto es lo que está mal 😞

No te confundas, esta IA sabe dibujar texto "estupendamente" mientras sea en INGLÉS. Déjame mostrarte la imagen que generó al reemplazar en el prompt anterior los textos a incluir en el banner al español:

Design a clean and minimalist banner for second-hand tires suitable for cars, vans, and trucks. Use a light background in white or soft grey, with gentle shadows to add depth. The main text reads "Used Tires for Every Need" in sleek, modern black or dark grey letters, centered on the banner. Below, in smaller, lighter text, add the subtext "Quality at Unbeatable Prices for Cars, Vans, and Trucks." Place a single, high-quality tire image in the center of the banner, with detailed reflections and textures to showcase its quality. Surround the tire with small, subtle icons representing a car, a van, and a truck, evenly spaced around it. In the bottom center, include a simple blue call-to-action button that reads "Discover More" in a clean, readable font. The overall aesthetic should be refined, with a focus on simplicity and elegance, appealing to a discerning audience.

así quedó la imagen: ... impecable! 🤗

Etiquetas : flux | chatgpt | ia

Comentarios 0   Visitas 18  

  Comentarios


Añada su comentario:

Comentario:
Nombre:
(pregunta anti-robots)

Enviar

DÍGANOS QUÉ NECESITA

¡¡ Le respondemos antes de 24h !!
Puede dejarnos su teléfono.

Puede rellenar el formulario (pulsar botón derecha) o bien aquí tiene nuestros datos de contacto.

(pregunta anti-robots)

  Enviar

Revisar consentimientos a cookies