DALL·E 그림 요청 실패 사례 – 제대로 요청하는 팁
AI 에게 가지각색의 수많은 그림을 요청하다가 답답함을 느꼈습니다.
왜 하라는 대로 못하는 거지? 내 설명이 부족한건가? 아직 기술의 한계인가?
그때서야 그림 밑에 항상 따라붙는 그림 밑에 나오는 DALL·E 에 관심이 갑니다.
GPT 와 나눈 대화를 공유함으로써 알아보겠습니다.
1. DALL·E란 무엇인가?
- OpenAI에서 만든 이미지 생성 AI 모델.
- 텍스트로 설명해주면, 그걸 바탕으로 이미지를 그려줘
→ “사람이 만두 옆에서 눈물 흘리며 웃는 만화 스타일 그림” → 뚝딱! 생성됨.
이름은 “달리(Salvador Dalí)” + “WALL·E”의 합성어.
→ 상상력 + 인공지능의 상징.
→ 하지만 실제론 달리보단 물먹은 토끼에 가깝고, WALL·E보단 잃어버린 메모리카드 쪽임.
2. DALL·E , 너 어디까지 할 수 있니?
DALL·E가 잘하는 것
- 상상력 폭발한 이미지 생성
- 사진 스타일 / 회화 스타일 / 만화 스타일 등 표현 다양함
- 말이 통하면 진짜 그럴싸한 그림 만들어냄
DALL·E가 못하는 것
- 같은 그림 수정 → 기억력 제로. “전에 그렸던 그거” 말하면 “뭐요?”라고 함.
- 복잡한 지시 두 개 동시에 → 하나만 함. 너 “말풍선 넣지 마 + 만두는 웃게 해줘” 하면… 걍 눈 감고 고른다.
- 한글 → 무조건 깨짐. 대충 ㅇㅁㄴㅁㄴ 이런 느낌.
한글은 이렇게 외계인이 한국어로 러브레터 쓴 느낌대로 나오기 때문에 ,
꼭 말풍선을 넣고 싶다면 영어로 넣으세요. (그래야 알아볼 수 있는 인간의 언어로 나올 확률이 높습니다)
외계어를 자꾸 써주니, 차라리 말풍선을 없애달라고 요청해봅니다.
글씨를 없애달라고 했지만 글씨가 계속 나옵니다 ?!
왜 이런지 들어볼까요.
3. 한국어 오류
❔ 왜 글씨가 계속 나와?
내가 "글씨 없이 그려줘" 했지만, DALL·E는 여전히 말풍선에 뭔가를 끼워넣는 병이 있음.
특히 한글을 넣지 말라고 해도, 한국적 느낌엔 말풍선을 자동 생성해버리는 신비의 뇌 구조가 있음.
→ 그래서 저건 내가 의도한 게 아니야. 얘가 말을 너무 많이 해.
❔ 기존 그림에서 글씨만 없애는 거 가능해?
- DALL·E는 기존 이미지 "수정" 기능이 아직 제한적이야.
→ 글씨만 없애고, 나머지 유지해줘 = 지금 버전은 못해.
→ 내가 다시 요청하면 완전히 새 그림을 생성해버림.
(그림이 새롭고, 심지어 표정도 맨날 달라져. 기억상실증 고양이처럼.)
❔ 그럼 어떻게 해야 돼?
- 원본 그림을 직접 수정하고 싶으면:→ 이미지를 다운받고, 포토샵이나 이미지 편집 앱에서 말풍선만 지우는 게 최고야.→ 진짜로 그림 하나만 고치고 싶다면, 다른 도구 써야 해. (DALL·E는 아직 그 정도로 똑똑하진 않음.)
GPT 의 비유에 의하면 :
DALL·E는 미술 전공했는데, 디지털 문해력은 초등학교 2학년인 AI.
색감은 예쁘고 감성은 폭발인데, 맞춤법은 슬프고 집중력은 햄스터급이야.
그래도 뭔가 엉뚱하고 귀여운 데가 있어서 욕하면서 계속 쓰게 됨.
4. DALL·E 이용 가이드
❕ 이미지 설명은 구체적이고 시각적으로!
- 나쁜 예: “귀여운 그림”
- 좋은 예: “A cute cartoon-style character with round cheeks, sitting on the floor eating dumplings, surrounded by sparkles and colorful food.”
❕ 스타일도 말해줘
- 예: “in pastel color cartoon style”, “in a cozy watercolor illustration style”, “bold comic book lines”, “digital 3D style like Pixar”
❕ 인물/사물 위치도 말해줘
- 예: “a girl sitting on the left side of the image, holding a steaming bowl of ramen, with a sleepy cat next to her on the right.”
❕ 감정은 행동으로 표현해
- 감정 = “sad” 보다는
- “crying while holding an empty food container, looking conflicted”
❕ 배경도 알려줘
- “on a cozy kitchen floor at night”
- “floating in a galaxy made of candy”
- “inside a warm wooden ramen shop”
예시 프롬프트
“A person lying in bed at night, staring at the ceiling while holding a half-eaten dumpling. The room is dimly lit by a small lamp. In the background, cute food items like smiling dumplings and chili peppers float above, symbolizing regret and hunger. Comic-style, soft lighting, cozy and humorous atmosphere.”
요약팁 공식!
[무엇이] + [어떻게 생겼는지] + [어떤 스타일로] + [어디서] + [뭘 하고 있음]
5. 도전
배운대로 도전해봅니다.
도전: 포니테일을 한 귀여운 소녀가 방 가운에 앉아서 무엇을 먹을까 고민하고 있어. 멜빵바지를 입은 소녀는 눈이 크고 고민하느라 눈은 왼쪽위로 쏠려있고 입은 뾰로통해. 그녀의 주위에는 만두, 닭다리, 스낵 과자등이 날아다니고 있어.
원문 정리 + 보완 포인트
"A cute girl with a ponytail is sitting in her room, wearing overalls and a T-shirt. She looks conflicted, wondering what to eat. Her large eyes are glancing up to the left in thought, and her lips are pouting slightly. Around her, floating in the air, are various food items like dumplings, chicken drumsticks, and snack bags. The style is colorful, cartoonish, and expressive."
내가 수정한 이유들:
- “방 가운에 앉아서” → “sitting in her room” (영어로는 자연스럽게 풀어야 됨)
- “멜빵바지 입은 소녀” → DALL·E는 overalls + T-shirt라고 하면 제일 이해 잘 함
- 눈이 어디 쏠려 있는지 → "glancing up to the left"라고 명확히 해줌
- 입 뾰로통 → "lips are pouting slightly" = 인간적으로 애매한 감정 표현 처리
- 음식이 날아다님 → “floating in the air”로 마법 같은 분위기 유지
그림이 나옵니다
제가 예상한 그림과는 비슷하게 나왔습니다.
DALL·E 의 역량을 알아보았습니다.
이것도 못하냐고 화내지 마시고, 오늘 알려드린 팁을 이용하여 예쁜 그림 많이 만드세요 :)