python 使用openCv做图片识别

2021-07-07 727 0 admin 所属分类:Python

OpenCV是一个基于BSD许可（开源）发行的跨平台计算机视觉库

安装

pip install opencv-python  # 基础库
pip install opencv-contrib-python  # 扩展库
pip install opencv-python-headless

导入模块

import cv2 as cv

基本操作

读取图片注:路径不能含有中文名，否则图片读取不出来

image = cv.imread('bg.jpg')

显示图片

cv.imshow('image', image)

等待键盘输入单位是毫秒 0表示无限等待

cv.waitKey(0)

释放内存最终调用的是C++对象，所以记得释放

cv.destroyAllWindows()

图片转灰度图

# cv2读取图片的通道是BGR，
# PIL读取图片的通道是RGB
# code选择COLOR_BGR2GRAY，就是BGR to GRAY
gray_image = cv.cvtColor(image, code=cv.COLOR_BGR2GRAY)

绘制矩阵

x, y, w, h = 50, 50, 80, 80
# 绘制矩形
cv.rectangle(image, (x, y, x+w, y+h), color=(0, 255, 0), thickness=2)
# 绘制圆形
cv.circle(image, center=(x + w//2, y + h//2), radius=w//2, color=(0, 0, 255), thickness=2)

人脸检测对图片提取特征如Haar特征，用于实现人脸实时跟踪特征每个Haar特征都描述了相邻图像区域的对比模式。比如边、定点和细线都能生成具有判别性的特征。

def face_detect_demo(image):
    # 将图片转换为灰度图
    gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)

    # 加载特征数据
    face_detector = cv.CascadeClassifier(os.path.join(cv.data.haarcascades, 'haarcascade_frontalface_default.xml'))
    faces = face_detector.detectMultiScale(gray)
    for x, y, w, h in faces:
        cv.rectangle(image, (x, y), (x + w, y + h), color=(0, 255, 0), thickness=2)

在cv2/data目录下存在detectMultiScale定义

def detectMultiScale(self, image, scaleFactor=None, minNeighbors=None, flags=None, minSize=None, maxSize=None)

scaleFactor 指定每个图像比例缩小多少图像

minNeighbors 每个候选矩形必须保留多少个邻居值越大说明精度要求越高

minSize 检测到的最小矩形大小

maxSize 检测到的最大矩形大小

如果检测后有脏数据需要调整参数不断优化

视频人脸检测视频就是一张一张的图片组成的，在视频的帧上面重复这个过程就能完成视频中的人脸检测了

# 人脸检测
def face_detect_demo(image):
    try:
        # 将图片转换为灰度图
        gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)

        # 加载特征数据
        face_detector = cv.CascadeClassifier(os.path.join(cv.data.haarcascades, 'haarcascade_frontalface_default.xml'))
        faces = face_detector.detectMultiScale(gray)
        for x, y, w, h in faces:
            print(x, y, w, h)
            cv.rectangle(image, (x, y), (x + w, y + h), color=(0, 255, 0), thickness=2)
    except Exception as e:
        pass

传入视频信息

cap = cv.VideoCapture('人脸识别.mp4') #参数可以是视频文件或者0（表示调用摄像头）
while cap.isOpened():
    flag, frame = cap.read()

    face_detect_demo(frame)
    cv.imshow('result', frame)
    if ord('q') == cv.waitKey(5):
        break

cap.realse()

机器学习训练数据

OpenCV为我们提供了一个机器学习的小模块，我们可以训练它，让它只识别我们需要的部分

训练的数据一般我们可以从网上搜索：人脸识别数据库，或者从视频中保存美帧的数据作为训练集。

获取训练集从视频中每隔5帧截取一个图片，保存成图片

while cap.isOpened() and number > 0:
    flag, frame = cap.read()
    if not flag:
        break

    if count % 5 == 0:
        # 按照视频图像中人脸的大体位置进行裁剪，只取人脸部分
        img = frame[70:280, 520:730]
        cv2.imwrite('data/{}.png'.format(number), img)
        number -= 1
    count += 1

使用LBPH训练模型

LBPH将检测到的人脸分为小单元，并将其与模型中的对应单元进行比较，对每个区域的匹配值产生一个直方图。调整后的区域中调用predict函数，该函数返回两个元素的数组，第一个元素是所识别的个体标签，第二个元素是置信度评分。所有的算法都有一个置信度评分阈值，置信度评分用来衡量图像与模型中的差距，0表示完全匹配。LBPH有一个好的识别参考值要低于50

def getImageAndLabels(path_list):
    faces = []
    ids = []
    image_paths = [os.path.join(path_list, f) for f in os.listdir(path_list) if f.endswith('.png')]
    face_detector = cv.CascadeClassifier(os.path.join(cv.data.haarcascades, 'haarcascade_frontalface_default.xml'))
    for image in image_paths:
        img = cv.imread(image)
        gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
        faces = face_detector.detectMultiScale(gray)
        _id = int(os.path.split(image)[1].split('.')[0])
        for x, y, w, h in faces:
            faces.append(gray[y:y+h, x:x+w])
            ids.append(_id)
    return faces, ids

faces, ids = getImageAndLabels('data')

# 训练
recognizer = cv.face.LBPHFaceRecognizer_create()
recognizer.train(faces, np.array(ids))

# 保存训练特征
recognizer.write('trains/trains.yml')

基本步骤为

cv.VideoCapture读取视频

Haar算法检测人脸数据

基于LBPH训练集得到准确人脸数据，并输出标记此人是谁

按置信度取准确度高的人脸标记出来

def face_detect_demo(image):
    try:
        global number
        # 将图片转换为灰度图
        gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)

        # 加载特征数据
        faces = face_detector.detectMultiScale(gray, scaleFactor=1.02, minNeighbors=3)
        for x, y, w, h in faces:
            # 获取置信度，大于80表示取值错误
            _id, confidence = recognizer.predict(gray[y:y + h, x:x + w])
            if confidence < 80:
                cv.rectangle(image, (x, y), (x + w, y + h), color=(0, 255, 0), thickness=2)
    except Exception as e:
        pass


def check_face():
    cap = cv.VideoCapture('人脸识别.mp4')
    while cap.isOpened():
        flag, frame = cap.read()
        if not flag:
            break
        face_detect_demo(frame)
        cv.imshow('img', frame)
        cv.waitKey(2)

    cv.destroyAllWindows()

if __name__ == '__main__':
    # 加载训练数据文件
    recognizer = cv.face.LBPHFaceRecognizer_create()
    recognizer.read('trains/trains.yml')

    face_detector = cv.CascadeClassifier(os.path.join(cv.data.haarcascades, 'haarcascade_frontalface_default.xml'))
    check_face()

如果执行报错,请更新到最新包

python 使用openCv做图片识别

基本操作

获取训练集 从视频中每隔5帧截取一个图片，保存成图片

获取训练集从视频中每隔5帧截取一个图片，保存成图片