search
IATutorial5 min lectura

ComfyUI para principiantes: tu primera imagen con SDXL paso a paso

Pablo IB

TL;DR: La interfaz de nodos de ComfyUI abruma al principio. Pero el workflow por defecto es más simple de lo que parece: cargas un modelo → escribes un prompt → generas. Te explico cada nodo y cada conexión para que no te pierdas.


La interfaz de ComfyUI explicada

Cuando abres http://127.0.0.1:8188 por primera vez, ves un montón de cajas conectadas con flechas. Cada caja es un nodo (un paso del proceso), y cada flecha es un cable (datos que pasan de un paso al siguiente).

Piensa en ello como una cadena de montaje:

[Checkpoint] → [Prompt positivo] → [Sampler] → [VAE Decode] → [Guardar imagen]
             → [Prompt negativo] ↗

No es más complicado que eso.


Paso 1: Cargar el workflow por defecto

Si ves un workflow extraño (como uno de Qwen Image Edit), carga el correcto:

  1. MenúWorkflowNew (o “Default”)
  2. Aparece el workflow básico con 5-6 nodos conectados

Paso 2: Entender los nodos

Nodo: Load Checkpoint

Es el modelo de IA. Aquí seleccionas qué modelo usar.

  • ckpt_name: Despliega y selecciona sd_xl_base_1.0.safetensors
  • Esto carga ~6.5 GB en VRAM (tarjeta gráfica)

Salidas del nodo:

  • MODEL → va al KSampler (el motor de generación)
  • CLIP → va a los nodos de texto (interpreta tu prompt)
  • VAE → va al decodificador (convierte latentes en imagen)

Nodo: CLIP Text Encode (Positive)

Aquí escribes lo que QUIERES ver. Tu prompt.

A red bicycle on a rainy street, cinematic photo, natural lighting, 4k

Consejos para prompts con SDXL:

  • Describir la escena completa, no solo el sujeto
  • Añadir estilo: “cinematic photo”, “digital art”, “oil painting”
  • SDXL entiende inglés natural, no necesitas tags separados por comas (pero funcionan)

Ponderación de palabras clave

Puedes dar más o menos peso a una palabra con paréntesis:

(red:1.3) bicycle on a rainy street   → más rojo
(blurry:0.5)                         → menos blurry

(palabra:1.0) = peso normal. Valores >1.0 refuerzan, <1.0 suavizan. Rango seguro: 0.5–1.5.

Nodo: CLIP Text Encode (Negative)

Aquí escribes lo que NO QUIERES ver.

blurry, low quality, deformed, ugly, watermark, text

Nodo: KSampler

El motor de generación. Los parámetros clave:

ParámetroQué haceValor recomendado
stepsIteraciones del proceso. Más = más calidad pero más lento20-30 para SDXL
cfgCuánto sigue el prompt. Alto = más fiel, bajo = más creativoDepende del modelo (ver abajo)

️ CFG: el error #1 de principiantes

El valor de CFG no es universal. Depende del modelo que uses:

ModeloCFG correctoCFG incorrecto (rompe la imagen)
SDXL7.0–8.0< 4 (ignora el prompt)
SD 1.56.0–8.0> 12 (saturación extrema)
Flux1.0–1.5> 3 (destruye la imagen)

Si usas CFG 7.0 con Flux, la imagen sale frita, sobresaturada, rota. Si usas CFG 1.0 con SDXL, ignora tu prompt. Siempre verifica el CFG al cargar un workflow nuevo. | sampler_name | Algoritmo de muestreo | euler o dpmpp_2m | | scheduler | Cómo maneja el ruido | normal o karras | | denoise | Cuánto “pinta” desde cero (1.0) vs modifica (0.0) | 1.0 para generación nueva | | seed | Número aleatorio. Cambialo para variaciones | Cualquier número, o “randomize” |

Para tu primera imagen, deja todo como está y solo cambia el seed si quieres variaciones.

Nodo: VAE Decode

Convierte los datos internos (latentes) en una imagen visible. No tienes que tocar nada aquí.

Nodo: Save Image

Guarda la imagen generada. Puedes cambiar el prefijo del nombre del archivo.


Paso 3: Generar

  1. Selecciona sd_xl_base_1.0.safetensors en Load Checkpoint
  2. Escribe tu prompt en el nodo CLIP Text Encode (positive)
  3. Haz clic en Queue Prompt (botón verde, arriba a la izquierda)
  4. Espera 10-30 segundos (depende de steps y tu GPU)
  5. La imagen aparece en el nodo Save Image o Preview Image

¡Listo! Ya generaste tu primera imagen con IA local, sin enviar nada a la nube.


Atajos de teclado esenciales

AtajoAcción
Ctrl+EnterQueue Prompt (generar)
Click en canvasDeseleccionar todo
Click en nodoSeleccionar nodo
Click en entrada/salidaVer tooltip del tipo de dato
Arrastrar de salida a entradaConectar nodos
Doble click en canvasBuscar nodo
BackspaceBorrar nodo seleccionado
Ctrl+ZDeshacer

Resolución y aspecto

SDXL está entrenado en ~1 megapixel total, no solo en 1024×1024 cuadrado. Puedes cambiar la resolución en los nodos Empty Latent Image:

ResoluciónMegapixelsAspectoUso
1024×10241.05 MP1:1 CuadradoRetratos, objetos
1152×8961.03 MP4:3 HorizontalEscenas generales
896×11521.03 MP3:4 VerticalRetratos, posters
1216×8321.01 MP~16:9 PanorámicaPaisajes anchos
832×12161.01 MP~9:16 VerticalStories, mobile

La regla: mantente cerca de 1 millón de píxeles totales. No bajes de 768×768 (0.59 MP) ni subas de 1536×1536 (2.36 MP) sin upscaler.

ModeloResolución baseRango seguro
SDXL~1 MP (no solo 1024×1024)768×768 a 1344×768
SD 1.5512×512 (0.26 MP)512×512 a 768×512
Flux1024×1024+1024×1024 a 2048×2048

Guarda tu trabajo (en serio)

ComfyUI no tiene auto-save. Si se cierra el navegador o se cuelga, pierdes el workflow.

  • Ctrl+S (o Cmd+S en Mac) para guardar el workflow como .json
  • Guárdalo con nombre descriptivo: mi-retrato-v1.json
  • Si haces un cambio que funciona, guarda inmediatamente
  • Puedes activar auto-save en Settings → Auto-Save Workflows

Los workflows son archivos JSON pequeños que puedes compartir, versionar, y reutilizar.


No te preocupes por los cables

Al principio, los cables entre nodos parecen un spaguetti. Pero cada cable tiene un color según el tipo de dato:

  • Magenta = MODEL (el modelo de difusión)
  • Amarillo = CLIP (el codificador de texto)
  • Rosa = CONDITIONING (el prompt procesado)
  • Verde = LATENT (la imagen en formato interno)
  • Azul = IMAGE (la imagen visible)

Si un cable no encaja, ComfyUI no te deja conectarlo. No puedes romper nada cableando mal.


Próximos pasos

Ahora que sabes generar imágenes, en el siguiente post te explico cómo instalar ComfyUI-Manager para añadir nodos adicionales: ControlNet, upscalers, Flux, y mucho más.


Serie: IA de imagen local en RTX 5080

  1. Instalar ComfyUI en RTX 5080: setup, lecciones y por qué Fooocus ya no sirve
  2. ComfyUI para principiantes: tu primera imagen con SDXL paso a paso ← estás aquí
  3. ComfyUI-Manager y custom nodes: ControlNet, upscalers y más
  4. InvokeAI: la alternativa con UI simple para generación casual