Scavengers Reign Flux

详情

模型描述

该模型使用来自MAX平台电视剧《猎食者统治》(2023年)的209张随机截图进行训练。我使用GPT-4o进行图像标注。

我保留了24GB LoRA配置的大部分默认设置,仅将训练步数调整为4,000步。

工作流程:

  1. 我使用了一个简短的Python脚本,从MP4文件中抽取了1,000张随机图像。

  2. 接着我使用czkawka(GitHub)删除了所有重复或相似的图像。

  3. 我列出了所有角色的出场情况,并移除了出现频率最高的角色,以避免模型产生偏差。

  4. 之后,我手动检查了所有图像,挑选出209张最具美感的画面。

  5. 我使用了一个自定义的GPT模型(Scavengers Reign GPT)进行标注。

  6. 最后,我使用ostris AI工具包(GitHub)训练了该模型。

代码:

import cv2
import random

mp4_directory = ''
output_directory = ''
frames_to_extract = 120
base_name = "Random_screenshot"
list_of_random_frames = []
frame_distance = 100
first_frame = 0 

count = 0

vidcap = cv2.VideoCapture(mp4_directory)
totalFrames = vidcap.get(cv2.CAP_PROP_FRAME_COUNT)
while count < frames_to_extract:
    count += 1
    count_str = str(count)
    frames_skipped = -1
    while True:
        randomFrameNumber = random.randint(0, totalFrames)
        frames_skipped +=1
        if frames_skipped > 0:
            print(f"Frame Skipped {frames_skipped}")
        if all(abs(randomFrameNumber - frame) > frame_distance and randomFrameNumber> first_frame for frame in list_of_random_frames):
            break
    list_of_random_frames.append(randomFrameNumber)
    photo_output = output_directory + base_name + count_str + ".png"
    vidcap.set(cv2.CAP_PROP_POS_FRAMES,randomFrameNumber)
    success, image = vidcap.read()
    if success:
        cv2.imwrite(photo_output, image)
    print(f"Saving image to: {photo_output}")

PS:如果你需要该数据集,请联系我。我只是不想让CivitAI陷入版权纠纷。

此模型生成的图像

未找到图像。