Scavengers Reign Flux
详情
下载文件
模型描述
该模型使用来自MAX平台电视剧《猎食者统治》(2023年)的209张随机截图进行训练。我使用GPT-4o进行图像标注。
我保留了24GB LoRA配置的大部分默认设置,仅将训练步数调整为4,000步。
工作流程:
我使用了一个简短的Python脚本,从MP4文件中抽取了1,000张随机图像。
接着我使用czkawka(GitHub)删除了所有重复或相似的图像。
我列出了所有角色的出场情况,并移除了出现频率最高的角色,以避免模型产生偏差。
之后,我手动检查了所有图像,挑选出209张最具美感的画面。
我使用了一个自定义的GPT模型(Scavengers Reign GPT)进行标注。
最后,我使用ostris AI工具包(GitHub)训练了该模型。
代码:
import cv2
import random
mp4_directory = ''
output_directory = ''
frames_to_extract = 120
base_name = "Random_screenshot"
list_of_random_frames = []
frame_distance = 100
first_frame = 0
count = 0
vidcap = cv2.VideoCapture(mp4_directory)
totalFrames = vidcap.get(cv2.CAP_PROP_FRAME_COUNT)
while count < frames_to_extract:
count += 1
count_str = str(count)
frames_skipped = -1
while True:
randomFrameNumber = random.randint(0, totalFrames)
frames_skipped +=1
if frames_skipped > 0:
print(f"Frame Skipped {frames_skipped}")
if all(abs(randomFrameNumber - frame) > frame_distance and randomFrameNumber> first_frame for frame in list_of_random_frames):
break
list_of_random_frames.append(randomFrameNumber)
photo_output = output_directory + base_name + count_str + ".png"
vidcap.set(cv2.CAP_PROP_POS_FRAMES,randomFrameNumber)
success, image = vidcap.read()
if success:
cv2.imwrite(photo_output, image)
print(f"Saving image to: {photo_output}")
PS:如果你需要该数据集,请联系我。我只是不想让CivitAI陷入版权纠纷。












