Z-Image: 연말 주목할 만한 생성형 AI 이미지 모델
연말을 앞두고 다양한 생성형 AI들이 쏟아져 나오고 있습니다. 최근 오픈소스로 공개된 Flux 2에 이어, Hugging Face 모델 트렌드에서 눈에 띄는 이미지 모델이 있습니다. 바로 Z-Image Turbo입니다.
Z-Image는 알리바바 그룹 Tongyi-MAI에서 개발한 Text-To-Image AI 모델입니다.
- 6B 파라미터
- 빠른 속도, 높은 효율
특히 16GB VRAM에서도 원활히 작동하도록 최적화되어 있어, 비교적 제한된 환경에서도 충분히 활용할 수 있습니다.
다만 아쉬운 점은, 현재 Turbo 버전에서는 Image-to-Image 기능이 포함되어 있지 않다는 것인데요.
하지만 개발팀에서 향후 Z-Image Edit 버전을 공개할 예정이라고 하니, 기다려볼 만합니다.
설명은 여기까지이고, 모델이 좋다고 평가받는 데는 이유가 있습니다. 이제 직접 테스트해보며 확인해보겠습니다.
설정
ComfyUI 설치
https://github.com/comfyanonymous/ComfyUI/releases
Releases · comfyanonymous/ComfyUI
The most powerful and modular diffusion model GUI, api and backend with a graph/nodes interface. - comfyanonymous/ComfyUI
github.com
워크플로우 다운 및 적용
ComfyUI 를 설치 후, 아래 z-image turbo용 workflow를 다운로드합니다.
ComfyUI.org 제공 JSON : 공식 템플릿 다운로드
또는 아래 파일을 받습니다.
ComfyUI에 드래그 엔 드롭을 통해 workflow를 로드하면 아래와 같은 다이얼로그가 보이게 됩니다.

오랜만에 ComfyUI를 해보니 더욱더 편해졌음을 느끼는 다이얼로그입니다.
각 파일들을 받아줍니다.
혹시나 따로 받고 싶으신 분은 아래 링크를 통해 설치하실 수 있습니다.
관련 파일 다운로드
Text encoder - qwen_3_4b.safetensors
split_files/text_encoders/qwen_3_4b.safetensors · Comfy-Org/z_image_turbo at main
split_files/text_encoders/qwen_3_4b.safetensors · Comfy-Org/z_image_turbo at main
SHA256: 6c671498573ac2f7a5501502ccce8d2b08ea6ca2f661c458e708f36b36edfc5a Pointer size: 135 Bytes · Size of remote file: 8.04 GB · Xet hash: f459cd74b7868799ea82f97601a650afcedc399596dc262f302e3505761c9995 Xet efficiently stores Large Files inside Git, in
huggingface.co
diffusion model file - z_image_turbo_bf16.safetensors
split_files/diffusion_models/z_image_turbo_bf16.safetensors · Comfy-Org/z_image_turbo at main
split_files/diffusion_models/z_image_turbo_bf16.safetensors · Comfy-Org/z_image_turbo at main
SHA256: 2407613050b809ffdff18a4ac99af83ea6b95443ecebdf80e064a79c825574a6 Pointer size: 136 Bytes · Size of remote file: 12.3 GB · Xet hash: 108e591ea419cb178f4c5c8c08d6c53c44ea3d787733b2b82738cbbd1d7a39be Xet efficiently stores Large Files inside Git, in
huggingface.co
VAE: ae.safetensors
split_files/vae/ae.safetensors · Comfy-Org/z_image_turbo at main
split_files/vae/ae.safetensors · Comfy-Org/z_image_turbo at main
SHA256: afc8e28272cd15db3919bacdb6918ce9c1ed22e96cb12c4d5ed0fba823529e38 Pointer size: 134 Bytes · Size of remote file: 335 MB · Xet hash: f744f169fc8c7d1c8fcfdfdbd86251d518c801084880373c77e1cf31bcff827e Xet efficiently stores Large Files inside Git, int
huggingface.co
저장 경로는 아래와 같습니다.
| qwen_3_4b.safetensors | ComfyUI/models/text_encoders/ |
| z_image_turbo_bf16.safetensors | ComfyUI/models/diffusion_models/ |
| ae.safetensors | ComfyUI/models/vae/ |
| qinglong_detailedeye_z-imageV2(comfy) | ComfyUI/models/loras/ |
실행
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
5070Ti 기준 스텝 8 최초 25~30초 사이, 이후 15초~19초 사이로 이미지가 생성됨을 확인했습니다.
애니메이션 Lora 적용 시 최초 26초, 이후 8~15초 이내로 이미지가 생성되었네요.

프롬프트는 아래와 같습니다.
anime style. 자동차에 기대고 있는 여성. 티셔츠에는 "Z Image 애니메이션 Lora"라고 적혀 있습니다. 배경은 상점과 사람들로 가득한 도심 거리입니다.

퀄리티는 너무 좋지만 한국어 표현이 완벽하진 않지만 이 정도면 이외이긴 합니다.
저사양을 위한 양자화 모델
Civitai
https://civitai.com/models/2169712/z-image-turbo-quantized-for-low-vram?modelVersionId=2445746
Z-Image Turbo - Quantized for low VRAM - fp8_scaled_e4m3fn_KJ | ZImageTurbo Checkpoint | Civitai
Z-Image Turbo is a distilled version of Z-Image, a 6B image model based on the Lumina architecture, developed by the Tongyi Lab team at Alibaba Gro...
civitai.com
Hugging Face
https://huggingface.co/drbaph/Z-Image-Turbo-FP8/tree/main
drbaph/Z-Image-Turbo-FP8 at main
huggingface.co
양자화 모델 실행

civitai에 있는 양자화을 실행해보았습니다.
같은 옵션에서 모델만 바꿨을 때, 시간은 초기 시간 20.27초, 이후 7초~8초안에 나오는 확인할 수 있었습니다.
프롬프트에 따라 20초가 넘는 경우도 있네요.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
확실한건 발자국 처리는 안되네요. 양자화를 한 모델이나 안한 모델 둘다 마찬가지입니다.
동일 프롬프트로 chatGPT나 Gemini nano banana로 돌렸을때도 보여드리면 아래와 같습니다.
| ChatGpt Sora | Nano Banana |
![]() |
![]() |
퀄리티 측면에선 확실히 Z-image가 더 좋지만 세밀한 표현 차이에선 아쉬움이 많습니다.
Lora Tool Kit
Ostris의 AI 툴킷
https://github.com/ostris/ai-toolkit
GitHub - ostris/ai-toolkit: The ultimate training toolkit for finetuning diffusion models
The ultimate training toolkit for finetuning diffusion models - ostris/ai-toolkit
github.com
Z-image 지원된다고 합니다.
'AI 인공지능' 카테고리의 다른 글
| 이미지 생성 유명 모델 Flux.1 dev ( 또는 schnell ) 를 실행해보자. (1) | 2025.04.05 |
|---|---|
| Ollama와 RAG를 활용한 PDF 기반 로컬 챗봇 LLM 만들기 (3) | 2025.03.27 |
| [로컬 LLM 설치 가이드] 내 PC에 나만의 LLM AI 설치하기 (2) | 2025.03.22 |
| Chatbox vs Open-WebUI : 간편함과 UI 사이에서의 고민 (0) | 2025.03.11 |













