노이즈벡터 뽑아서 인풋이미지랑 대조해가면서 학습하는거는 직관적이니까 이해가됨. 근데 여기서 처음에 노이즈벡터라는게 인풋이미지에 노이즈를 추가해서 인풋이미지랑 비슷한 이미지를 말하는줄 알았는데 코드보니까 정규분포를 따르는 진짜 난수를 뽑음. 그럼 이 난수(픽셀값)이 나중에 인풋이미지랑 비슷해진다는건데 그럼 시간이 ㅈㄴ오래 걸리지 않음? 이해가안됨
- dc official App
댓글 5
원본이미지를 모르는데 난수값 말고 뭘로 시작함 그럼
익명(49.142)2024-08-17 13:28
노이즈 입력 (한번 생성 될 때마다 다른 결과 나오도록) + Condition 입력(사실상 얘가 본 입력, 특정 스타일이나 내용의 이미지를 생성하도록 유도)
왜 노이즈를 쓰나요? -> 사용자가 어떤 컨디션을 넣어서 컨텐츠를 생성했는데 불만족 스러울 때,
그냥 몇번 더 생성하다보면 조금씩 다른게 나와서 언젠간 맘에 드는 것을 생성할 수 도(?) 있게 됨
익명(211.236)2024-08-17 13:42
디퓨전이랑 섞었네 - dc App
focalors(pytorch)2024-08-17 13:42
시간이 ㅈㄴ 오래 걸리는 건 디퓨전처럼 노이즈를 U-Net에 1000번에서 2000번정도 통과시키니까 오래걸리는거 아님?
GAN은 걍 모델 한 번만 통과시키면 되니까 샘플링 속도는 디퓨전보다 빠르고 ㅇㅇ
원본이미지를 모르는데 난수값 말고 뭘로 시작함 그럼
노이즈 입력 (한번 생성 될 때마다 다른 결과 나오도록) + Condition 입력(사실상 얘가 본 입력, 특정 스타일이나 내용의 이미지를 생성하도록 유도) 왜 노이즈를 쓰나요? -> 사용자가 어떤 컨디션을 넣어서 컨텐츠를 생성했는데 불만족 스러울 때, 그냥 몇번 더 생성하다보면 조금씩 다른게 나와서 언젠간 맘에 드는 것을 생성할 수 도(?) 있게 됨
디퓨전이랑 섞었네 - dc App
시간이 ㅈㄴ 오래 걸리는 건 디퓨전처럼 노이즈를 U-Net에 1000번에서 2000번정도 통과시키니까 오래걸리는거 아님? GAN은 걍 모델 한 번만 통과시키면 되니까 샘플링 속도는 디퓨전보다 빠르고 ㅇㅇ
노이즈를 추가한다는거 보니 디퓨전 모델인데? - dc App