准备:
1、导入库
编写训练程序首先需要做的是导入相关的库
1、导入OpenCv库
2、导入os库,用于文件处理
3、导入numpy库,用于计算
4、导入pillow库,用于图像处理(好像没有用到)
其实就是这样:
import cv2
import os
import numpy as np
from PIL import Image
现在我们初始化人脸检测器和人脸识别器(初始化,尚不具备人脸识别功能):
detector = cv2.CascadeClassifier("haarcascade_frontalface_default.xml")
recognizer = cv2.face.LBPHFaceRecognizer_create()
# 有可能是 recognizer = cv2.createLBPHFaceRecognizer()
注意:
自己使用cv2.face.LBPHFaceRecognizer_create()的时候,出现了问题,找不到对应的库,此时需要安装一个库
代码如下:pip install opencv_contrib_python
但是但是还是有问题
经过百度,需要以管理员身份打开cmd
然后通过pip install --user opencv_contrib_python的方式才能安装成功
2、载入训练数据
现在我们来创建一个函数,用于从数据集文件夹中获取训练图片,然后从图片的文件名中获取到这个素材相应的id。需要remind的是,根据前文,图片的格式是id.samplenumber
比如有一张图片的id是6,id为6的图片有3个,那么这三张图片命名就是6.1.jpg,6.2.jpg,6.3.jpg。当然这个图片格式不一定是jpg,也可能是png。
定义一个函数:
(1) 导入所有图片及对应的id:
获取所有图片路径
如果图片都在path文件夹下
image_paths=[os.path.join(path, f) for f in os.listdir(path)]
新建两个list用于存放:
face_samples = []
ids = []
遍历图片路径,导入图片和id,添加到list:
for image_path in image_paths:
image = Image.open(image_path).convert('L')
image_np = np.array(image, 'uint8')
# if os.path.split(image_path)[-1].split(".")[-1] != 'pgm':
# continue
image_id = int(os.path.split(image_path)[-1].split(".")[0])
faces = detector.detectMultiScale(image_np)
for (x, y, w, h) in faces:
face_samples.append(image_np[y:y + h, x:x + w])
ids.append(image_id)
以上代码,使用了Image.open(image_path).convert(‘L’)通过图片路径并将其转换为灰度图片。
接下来我们通过image_np = np.array(image, 'uint8')将图片转换成了Numpy数组,Numpy数组的逻辑结构和普通的数组无异,但是是经过优化的。
为了获取到id,我们将图片的路径分裂一下并获取相关信息,即image_id = int(os.path.split(image_path)[-1].split(".")[0])
接下来的一个循环for (x, y, w, h) in faces则是将图片和id都添加在list中。
再return一下即可。
3、训练
差不多完成了,现在我们调用一下这个函数,然后将我们的数据喂给识别器去训练吧。
faces, Ids = get_images_and_labels('dataSet')
recognizer.train(faces, np.array(Ids))
recognizer.save('trainner/trainner.yml')
这个yml文件,存着我们的训练好的数据,以后识别会用到的。
4、测试(进行人脸识别)
加载人脸检测器(分类器)
cascade_path = "haarcascade_frontalface_default.xml"
face_cascade = cv2.CascadeClassifier(cascade_path)
加载人脸识别器
recognizer = cv2.face.LBPHFaceRecognizer_create()
recognizer.read('trainner/trainner.yml')
获取摄像头的控制对象
cam = cv2.VideoCapture(0)
# 这里的参数可能是-1 0 1
加载一个字体,用于在识别后,在图片上标注出识别对象的名字:
font = cv2.FONT_HERSHEY_SIMPLEX
人脸识别主程序:
在程序的主循环中,我们需要做的是:
1. 从摄像头中获取图像
2. 将图像转换为灰度图片
3. 在图片中检测人脸
4. 用识别器识别该人的id
5. 将识别出人脸的id或名称用矩形在图片中标出来
程序如下:
import cv2
import os
import numpy as np
from PIL import Image
detector = cv2.CascadeClassifier("haarcascade_frontalface_default.xml")
recognizer = cv2.face.LBPHFaceRecognizer_create()
def get_images_and_labels(path):
image_paths = [os.path.join(path, f) for f in os.listdir(path)]
face_samples = []
ids = []
for image_path in image_paths:
image = Image.open(image_path).convert('L')
image_np = np.array(image, 'uint8')
# if os.path.split(image_path)[-1].split(".")[-1] != 'pgm':
# continue
image_id = int(os.path.split(image_path)[-1].split(".")[0])
faces = detector.detectMultiScale(image_np)
for (x, y, w, h) in faces:
face_samples.append(image_np[y:y + h, x:x + w])
ids.append(image_id)
return face_samples, ids
filepath = r'C:\Users\Administrator\Desktop\machine_learning\new_project\orl_faces1/'
faces, Ids = get_images_and_labels(filepath)
recognizer.train(faces, np.array(Ids))
recognizer.save('trainner/trainner.yml')
cam = cv2.VideoCapture(0) # 获取摄像头
font = cv2.FONT_HERSHEY_SIMPLEX # 加载一个字体 用于识别后 在图片上标注名字
while True:
ret, im = cam.read()
gray = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY)
faces = detector.detectMultiScale(gray, 1.2, 5)
for (x, y, w, h) in faces:
cv2.rectangle(im, (x, y), (x + w, y + h), (225, 0, 0), 2)
img_id, conf = recognizer.predict(gray[y:y + h, x:x + w])
cv2.putText(im, str(img_id), (x, y + h), font, 0.55, (0, 255, 0), 1)
cv2.imshow('im', im)
if cv2.waitKey(10) & 0xFF == ord('q'):
break
cam.release()
cv2.destroyAllWindows()
如有疏漏,再完善!
登录 | 立即注册