JobPlus知识库 IT 工业智能4.0 文章
OpenCv之人脸识别

准备:

1、导入库

编写训练程序首先需要做的是导入相关的库

1、导入OpenCv库 
2、导入os库,用于文件处理 
3、导入numpy库,用于计算 
4、导入pillow库,用于图像处理(好像没有用到) 

其实就是这样:

import cv2 

import os 

import numpy as np 

from PIL import Image


现在我们初始化人脸检测器和人脸识别器(初始化,尚不具备人脸识别功能):

detector = cv2.CascadeClassifier("haarcascade_frontalface_default.xml") 

recognizer = cv2.face.LBPHFaceRecognizer_create()

# 有可能是 recognizer = cv2.createLBPHFaceRecognizer()


注意: 
自己使用cv2.face.LBPHFaceRecognizer_create()的时候,出现了问题,找不到对应的库,此时需要安装一个库 
代码如下:pip install opencv_contrib_python 
但是但是还是有问题 
经过百度,需要以管理员身份打开cmd 
然后通过pip install --user opencv_contrib_python的方式才能安装成功

2、载入训练数据

现在我们来创建一个函数,用于从数据集文件夹中获取训练图片,然后从图片的文件名中获取到这个素材相应的id。需要remind的是,根据前文,图片的格式是id.samplenumber 
比如有一张图片的id是6,id为6的图片有3个,那么这三张图片命名就是6.1.jpg,6.2.jpg,6.3.jpg。当然这个图片格式不一定是jpg,也可能是png。 
定义一个函数:

(1) 导入所有图片及对应的id:

获取所有图片路径 
如果图片都在path文件夹下 
image_paths=[os.path.join(path, f) for f in os.listdir(path)] 
新建两个list用于存放:

face_samples = []

 ids = []


遍历图片路径,导入图片和id,添加到list:

   for image_path in image_paths:

        image = Image.open(image_path).convert('L')

        image_np = np.array(image, 'uint8')

        # if os.path.split(image_path)[-1].split(".")[-1] != 'pgm':

        #     continue

        image_id = int(os.path.split(image_path)[-1].split(".")[0])

        faces = detector.detectMultiScale(image_np)

        for (x, y, w, h) in faces:

            face_samples.append(image_np[y:y + h, x:x + w])

            ids.append(image_id)


以上代码,使用了Image.open(image_path).convert(‘L’)通过图片路径并将其转换为灰度图片。 
接下来我们通过image_np = np.array(image, 'uint8')将图片转换成了Numpy数组,Numpy数组的逻辑结构和普通的数组无异,但是是经过优化的。 
为了获取到id,我们将图片的路径分裂一下并获取相关信息,即image_id = int(os.path.split(image_path)[-1].split(".")[0]) 
接下来的一个循环for (x, y, w, h) in faces则是将图片和id都添加在list中。 
再return一下即可。

3、训练

差不多完成了,现在我们调用一下这个函数,然后将我们的数据喂给识别器去训练吧。

faces, Ids = get_images_and_labels('dataSet') 

recognizer.train(faces, np.array(Ids)) 

recognizer.save('trainner/trainner.yml')


这个yml文件,存着我们的训练好的数据,以后识别会用到的。

4、测试(进行人脸识别)

加载人脸检测器(分类器)

cascade_path = "haarcascade_frontalface_default.xml"

face_cascade = cv2.CascadeClassifier(cascade_path)


加载人脸识别器

recognizer = cv2.face.LBPHFaceRecognizer_create() 

recognizer.read('trainner/trainner.yml')

获取摄像头的控制对象

cam = cv2.VideoCapture(0)

# 这里的参数可能是-1  0  1


加载一个字体,用于在识别后,在图片上标注出识别对象的名字:

font = cv2.FONT_HERSHEY_SIMPLEX


人脸识别主程序:

在程序的主循环中,我们需要做的是:

1. 从摄像头中获取图像 
2. 将图像转换为灰度图片 
3. 在图片中检测人脸 
4. 用识别器识别该人的id 
5. 将识别出人脸的id或名称用矩形在图片中标出来

程序如下:

import cv2

import os

import numpy as np

from PIL import Image 


detector = cv2.CascadeClassifier("haarcascade_frontalface_default.xml") 

recognizer = cv2.face.LBPHFaceRecognizer_create()

def get_images_and_labels(path):

    image_paths = [os.path.join(path, f) for f in os.listdir(path)]

    face_samples = []

    ids = []

    for image_path in image_paths:

        image = Image.open(image_path).convert('L')

        image_np = np.array(image, 'uint8')

        # if os.path.split(image_path)[-1].split(".")[-1] != 'pgm':

        #     continue

        image_id = int(os.path.split(image_path)[-1].split(".")[0])

        faces = detector.detectMultiScale(image_np)

        for (x, y, w, h) in faces:

            face_samples.append(image_np[y:y + h, x:x + w])

            ids.append(image_id)

    return face_samples, ids


filepath = r'C:\Users\Administrator\Desktop\machine_learning\new_project\orl_faces1/'

faces, Ids = get_images_and_labels(filepath) 

recognizer.train(faces, np.array(Ids)) 

recognizer.save('trainner/trainner.yml') 

cam = cv2.VideoCapture(0)   # 获取摄像头

font = cv2.FONT_HERSHEY_SIMPLEX  # 加载一个字体  用于识别后  在图片上标注名字

while True:

    ret, im = cam.read()

    gray = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY)

    faces = detector.detectMultiScale(gray, 1.2, 5)

    for (x, y, w, h) in faces:

        cv2.rectangle(im, (x, y), (x + w, y + h), (225, 0, 0), 2)

        img_id, conf = recognizer.predict(gray[y:y + h, x:x + w])

        cv2.putText(im, str(img_id), (x, y + h), font, 0.55, (0, 255, 0), 1)

    cv2.imshow('im', im)

    if cv2.waitKey(10) & 0xFF == ord('q'):

        break

cam.release()

cv2.destroyAllWindows()


如有疏漏,再完善!


如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!

¥ 打赏支持
97人赞 举报
分享到
用户评价(0)

暂无评价,你也可以发布评价哦:)

扫码APP

扫描使用APP

扫码使用

扫描使用小程序