생산성 도구

텍스트를 이미지(그림/사진)로 변환하는 AI 웹 프로그램

부추차 2022. 11. 4. 16:23
반응형

Hugging Face라는 기계 학습 모델과 데이터 세트를 공유할 수 있는 플랫폼이 있습니다. Hugging Face 웹사이트에 접속하면 AI 기술을 이용한 여러 가지 데모 버전의 애플리케이션을 실행해 볼 수 있습니다. 여기서 소개하고 있는 여러 애플리케이션 중 Stable Diffusion이라는 text to image 모델을 이용한 애플리케이션을 사용해 볼 수 있어 소개합니다.

 

모델명에서 알 수 있듯이 텍스트를 입력하면 관련된 이미지를 자동으로 만들어주는 프로그램입니다.


1. Stable Diffusion Demo 웹 애플리케이션 접속

우선 Hugging Face 웹페이지에서 Stable Diffusion Demo 웹 애플리케이션을 실행합니다. 하기 이미지에 링크를 걸어두었으니 클릭하면 접속할 수 있습니다.

웹 애플리케이션에 접속한 모습입니다.

 

2. Enter your prompt 창에 텍스트 입력하기

Stable Diffusion Demo 웹 애플리케이션을 실행한 후, 'Enter your prompt' 창에 생성하고 싶은 텍스트를 입력하고 'Generate image' 버튼을 누르기만 하면 됩니다.

 

예시로 Illustration of Einstein dancing in a spacesuit(우주복을 입고 춤추고 있는 아인슈타인 그림)을 입력해봤습니다.

 

참고로, 입력 텍스트는 영문만 지원합니다.

생성하고싶은 이미지와 관련된 텍스트를 입력하는 모습입니다.

 

3. 생성된 이미지 확인

텍스트를 입력하고 버튼만 누르면 5~10초 만에 입력한 텍스트와 관련된 이미지를 여러 장 생성해 줍니다.

우주복을 입은 아인슈타인 그림입니다.

그림에 대한 설명뿐만 아니라 특정한 화가의 스타일을 입력하면 화풍을 적용한 그림을 생성해주기도 합니다. 아래 그림은 Van Gogh style painting of Einstein dancing in a spacesuit(우주복을 입고 춤추는 아인슈타인을 반 고흐 스타일로 그린 그림)이라는 텍스트를 입력한 결과입니다.

고흐스타일로 그린 우주복을 입은 아인슈타인 그림입니다.

 


인공지능이, 그림을 그린다. 음악을 만든다. 글을 쓴다. 코딩을 한다. 등과 같이 인공지능 기술에 대한 놀라운 소식들이 하루가 멀다 하고 들려오는 것 같습니다. 비싼 장치나 프로그램을 가지고 있는 기업이나 학교와 같은 기관에서나 할 수 있는 일이겠거니 하며, 나와는 관계없는 일이라 생각했습니다. 하지만, 정말 바로 코앞에 있는 기술이었습니다. 한정된 기능을 가진 공개된 데모 프로그램이 입력하는 단어 하나하나를 모두 반영한 창의적인 그림을 생성하는 것을 직접 경험해보니, 가장 발전된 인공지능 기술은 도대체 어누 수준까지 가능할지 궁금해졌습니다. 한번 경험해보길 권합니다.

반응형