OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库
安装
pip install opencv-python # 基础库
pip install opencv-contrib-python # 扩展库
pip install opencv-python-headless
导入模块
import cv2 as cv
基本操作
读取图片 注:路径不能含有中文名,否则图片读取不出来
image = cv.imread('bg.jpg')
显示图片
cv.imshow('image', image)
等待键盘输入 单位是毫秒 0表示无限等待
cv.waitKey(0)
释放内存 最终调用的是C++对象,所以记得释放
cv.destroyAllWindows()
图片转灰度图
# cv2读取图片的通道是BGR,
# PIL读取图片的通道是RGB
# code选择COLOR_BGR2GRAY,就是BGR to GRAY
gray_image = cv.cvtColor(image, code=cv.COLOR_BGR2GRAY)
绘制矩阵
x, y, w, h = 50, 50, 80, 80
# 绘制矩形
cv.rectangle(image, (x, y, x+w, y+h), color=(0, 255, 0), thickness=2)
# 绘制圆形
cv.circle(image, center=(x + w//2, y + h//2), radius=w//2, color=(0, 0, 255), thickness=2)
人脸检测 对图片提取特征 如Haar特征,用于实现人脸实时跟踪特征 每个Haar特征都描述了相邻图像区域的对比模式。比如边、定点和细线都能生成具有判别性的特征。
def face_detect_demo(image):
# 将图片转换为灰度图
gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)
# 加载特征数据
face_detector = cv.CascadeClassifier(os.path.join(cv.data.haarcascades, 'haarcascade_frontalface_default.xml'))
faces = face_detector.detectMultiScale(gray)
for x, y, w, h in faces:
cv.rectangle(image, (x, y), (x + w, y + h), color=(0, 255, 0), thickness=2)
在cv2/data目录下 存在detectMultiScale定义
def detectMultiScale(self, image, scaleFactor=None, minNeighbors=None, flags=None, minSize=None, maxSize=None)
scaleFactor 指定每个图像比例缩小多少图像
minNeighbors 每个候选矩形必须保留多少个邻居 值越大说明精度要求越高
minSize 检测到的最小矩形大小
maxSize 检测到的最大矩形大小
如果检测后有脏数据 需要调整参数不断优化
视频人脸检测 视频就是一张一张的图片组成的,在视频的帧上面重复这个过程就能完成视频中的人脸检测了
# 人脸检测
def face_detect_demo(image):
try:
# 将图片转换为灰度图
gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)
# 加载特征数据
face_detector = cv.CascadeClassifier(os.path.join(cv.data.haarcascades, 'haarcascade_frontalface_default.xml'))
faces = face_detector.detectMultiScale(gray)
for x, y, w, h in faces:
print(x, y, w, h)
cv.rectangle(image, (x, y), (x + w, y + h), color=(0, 255, 0), thickness=2)
except Exception as e:
pass
传入视频信息
cap = cv.VideoCapture('人脸识别.mp4') #参数可以是视频文件或者0(表示调用摄像头)
while cap.isOpened():
flag, frame = cap.read()
face_detect_demo(frame)
cv.imshow('result', frame)
if ord('q') == cv.waitKey(5):
break
cap.realse()
机器学习 训练数据
OpenCV为我们提供了一个机器学习的小模块,我们可以训练它,让它只识别我们需要的部分
训练的数据一般我们可以从网上搜索:人脸识别数据库,或者从视频中保存美帧的数据作为训练集。
获取训练集 从视频中每隔5帧截取一个图片,保存成图片
while cap.isOpened() and number > 0:
flag, frame = cap.read()
if not flag:
break
if count % 5 == 0:
# 按照视频图像中人脸的大体位置进行裁剪,只取人脸部分
img = frame[70:280, 520:730]
cv2.imwrite('data/{}.png'.format(number), img)
number -= 1
count += 1
使用LBPH训练模型
LBPH将检测到的人脸分为小单元,并将其与模型中的对应单元进行比较,对每个区域的匹配值产生一个直方图。调整后的区域中调用predict函数,该函数返回两个元素的数组,第一个元素是所识别的个体标签,第二个元素是置信度评分。所有的算法都有一个置信度评分阈值,置信度评分用来衡量图像与模型中的差距,0表示完全匹配。LBPH有一个好的识别参考值要低于50
def getImageAndLabels(path_list):
faces = []
ids = []
image_paths = [os.path.join(path_list, f) for f in os.listdir(path_list) if f.endswith('.png')]
face_detector = cv.CascadeClassifier(os.path.join(cv.data.haarcascades, 'haarcascade_frontalface_default.xml'))
for image in image_paths:
img = cv.imread(image)
gray = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
faces = face_detector.detectMultiScale(gray)
_id = int(os.path.split(image)[1].split('.')[0])
for x, y, w, h in faces:
faces.append(gray[y:y+h, x:x+w])
ids.append(_id)
return faces, ids
faces, ids = getImageAndLabels('data')
# 训练
recognizer = cv.face.LBPHFaceRecognizer_create()
recognizer.train(faces, np.array(ids))
# 保存训练特征
recognizer.write('trains/trains.yml')
基本步骤为
cv.VideoCapture读取视频
Haar算法检测人脸数据
基于LBPH训练集得到准确人脸数据,并输出标记此人是谁
按置信度取准确度高的人脸标记出来
def face_detect_demo(image):
try:
global number
# 将图片转换为灰度图
gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)
# 加载特征数据
faces = face_detector.detectMultiScale(gray, scaleFactor=1.02, minNeighbors=3)
for x, y, w, h in faces:
# 获取置信度,大于80表示取值错误
_id, confidence = recognizer.predict(gray[y:y + h, x:x + w])
if confidence < 80:
cv.rectangle(image, (x, y), (x + w, y + h), color=(0, 255, 0), thickness=2)
except Exception as e:
pass
def check_face():
cap = cv.VideoCapture('人脸识别.mp4')
while cap.isOpened():
flag, frame = cap.read()
if not flag:
break
face_detect_demo(frame)
cv.imshow('img', frame)
cv.waitKey(2)
cv.destroyAllWindows()
if __name__ == '__main__':
# 加载训练数据文件
recognizer = cv.face.LBPHFaceRecognizer_create()
recognizer.read('trains/trains.yml')
face_detector = cv.CascadeClassifier(os.path.join(cv.data.haarcascades, 'haarcascade_frontalface_default.xml'))
check_face()
如果执行报错,请更新到最新包