A5 Stabilizer - RLHF D3PO - A5稳定器
세부 정보
파일 다운로드
이 버전에 대해
모델 설명
sd-webui-additional-networks 를 사용하여 이 모델을 로드하세요!
请使用 sd-webui-additional-networks 来加载本模型!
Introduction 简介
Q0: What is this model? 这个模型是什么?
A0: 🎈 This is a stabilizer trained for Anything V5. 이는 Anything V5를 위해 훈련된 안정화 모델입니다.
Q1: What's the use of this model? 이 모델의 용도는 무엇인가요?
A1.1: 🎉 이 모델은 생성된 일러스트의 붕괴된 구조를一定程度 수정할 수 있습니다.
A1.2: 🎨 이 모델은 생성된 캐릭터의 동공을 수정할 수 있습니다.
A1.3: 😎 이 모델은 생성된 일러스트의 조명 효과를 조정하여 AI가 생성한 것처럼 보이지 않도록 하며(즉, 인간이 선호하는 스타일로 만듭니다).
A1.4: 🍡 이 모델은 생성된 이미지가 입력 프롬프트와 더 잘 일치하도록 보입니다.
Q2: How is this model Trained? 이 모델은 어떻게 훈련되었나요?
A2.1: 🥰 이 모델은 인간 피드백을 활용한 강화 학습(RLHF)으로 훈련되었으며, 이 기술은 LLM에서 널리 사용됩니다.
A2.2: 😏 구체적으로, 이 모델은 D3PO를 사용하여 훈련되었으며, 자세한 내용은 Using Human Feedback to Fine-tune Diffusion Models without Any Reward Model (arxiv 2311.13231)을 참조하세요.
A2.3: 🙄 이 모델은 훈련 과정에서 자체 훈련된 보상 모델에 의해 지도되었으며, 좋아요 수, 저장 수, AI 생성 확률, 조회수의 4가지 지표를 사용합니다. 이 보상 모델은 chikoto/ConvNeXtV2-IllustrationScorer에서 사용할 수 있습니다.
Some Nonsense Crap 一些无关紧要的东西
🧐 어떤 아이디어나 제안도 환영합니다!
🤗 NAI3에 인간의 몸으로 도전해보세요.






