Skip to content

数据集构建

准备工作

数据收集

图片类型数据

后续直接用于标注

视频类型数据

使用opencv 进行视频抽帧
python
import cv2
import matplotlib.pyplot as plt
# 打开视频文件
video = cv2.VideoCapture('./demo.mp4')

# 读取1 帧
ret, frame = video.read()
plt.imshow(frame)
plt.imshow(cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)) # OpenCV 读取的图片是 BGR 格式,需要转换成 RGB 格式才能正常显示
多帧采取
python
video = cv2.VideoCapture('./demo.mp4')  
num = 0   # 计数 
save_step = 30 # 帧间隔
while True:
    ret, frame = video.read()
    if not ret:
        break
    num += 1
    if num % save_step == 0:
        cv2.imwrite("./images/"+str(num)+".jpg", frame)

标注工具

labelimg

安装命令 pip install labelimg

image-20240912213037333

txt中的五个值,分别对应类、x,y的中心点、长、宽

image-20240912213138328image-20240912213240674

Released under the MIT License.