CK+数据集实战：用Python+OpenCV快速上手面部表情识别（附完整代码）-程序员充电站

CK+数据集实战：用Python+OpenCV快速上手面部表情识别

面部表情识别作为计算机视觉领域的重要分支，正在人机交互、心理健康评估、智能驾驶等多个场景中发挥越来越大的作用。对于想要快速入门这一技术的开发者而言，选择合适的开源数据集和工具链尤为关键。本文将手把手带你使用经典的CK+数据集，从数据获取到模型训练，构建一个完整的面部表情识别系统。

1. 环境准备与数据获取

在开始之前，我们需要准备好Python环境和必要的库。推荐使用Python 3.7+版本，并创建独立的虚拟环境：

python -m venv emotion_env source emotion_env/bin/activate # Linux/Mac # 或 emotion_env\Scripts\activate # Windows

安装核心依赖库：

pip install opencv-python numpy scikit-learn matplotlib

CK+数据集可以从官网申请下载，包含123名受试者的593个面部表情序列。每个序列从中性表情开始，到表情峰值结束，并标注了对应的面部动作单元(AU)和七种基本情绪：

愤怒(Anger)
蔑视(Contempt)
厌恶(Disgust)
恐惧(Fear)
快乐(Happiness)
悲伤(Sadness)
惊讶(Surprise)

数据集目录结构通常如下：

CK+/ ├── Emotions/ │ ├── S005_001_00000011_emotion.txt │ └── ... ├── FACS/ │ ├── S005_001_00000011_facs.txt │ └── ... └── cohn-kanade-images/ ├── S005/ │ ├── S005_001/ │ │ ├── S005_001_00000001.png │ │ └── ... │ └── ... └── ...

2. 数据预处理与特征提取

2.1 图像预处理流程

原始图像需要经过以下几个关键预处理步骤：

人脸检测与对齐：使用OpenCV的Haar级联分类器或DNN模块检测人脸区域
灰度转换：将彩色图像转为灰度，减少计算量
尺寸归一化：将所有图像调整为统一尺寸(如64x64像素)
直方图均衡化：增强图像对比度

import cv2 def preprocess_image(img_path): # 加载图像 img = cv2.imread(img_path) gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 人脸检测 face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml') faces = face_cascade.detectMultiScale(gray, 1.3, 5) if len(faces) == 0: return None (x,y,w,h) = faces[0] face_roi = gray[y:y+h, x:x+w] # 调整尺寸并均衡化 face_roi = cv2.resize(face_roi, (64, 64)) face_roi = cv2.equalizeHist(face_roi) return face_roi

2.2 HOG特征提取

方向梯度直方图(HOG)是一种有效的纹理特征描述方法，特别适合面部表情识别：

from skimage.feature import hog def extract_hog_features(img): # 计算HOG特征 features, hog_image = hog(img, orientations=8, pixels_per_cell=(16,16), cells_per_block=(1,1), visualize=True) return features

HOG参数选择建议：

参数	推荐值	说明
orientations	8-9	梯度方向分箱数
pixels_per_cell	(16,16)	每个cell的像素大小
cells_per_block	(1,1)	归一化块大小
block_norm	'L2-Hys'	归一化方法

2.3 LBP特征提取

局部二值模式(LBP)是另一种轻量级但有效的特征：

from skimage.feature import local_binary_pattern def extract_lbp_features(img, radius=3, n_points=24): lbp = local_binary_pattern(img, n_points, radius, method='uniform') hist, _ = np.histogram(lbp.ravel(), bins=np.arange(0, n_points+3), range=(0, n_points+2)) hist = hist.astype("float") hist /= (hist.sum() + 1e-7) # 归一化 return hist

3. 构建表情分类模型

3.1 数据准备与划分

首先需要将CK+数据集整理为适合机器学习的形式：

import os import numpy as np from sklearn.model_selection import train_test_split def load_ck_dataset(data_path): images = [] labels = [] # 遍历所有受试者目录 for subject_dir in os.listdir(os.path.join(data_path, 'cohn-kanade-images')): subject_path = os.path.join(data_path, 'cohn-kanade-images', subject_dir) for sequence_dir in os.listdir(subject_path): sequence_path = os.path.join(subject_path, sequence_dir) image_files = sorted([f for f in os.listdir(sequence_path) if f.endswith('.png')]) if not image_files: continue # 只使用峰值表情帧 peak_image = os.path.join(sequence_path, image_files[-1]) preprocessed = preprocess_image(peak_image) if preprocessed is not None: images.append(preprocessed) # 这里需要根据实际情况获取标签 labels.append(get_label(subject_dir, sequence_dir)) return np.array(images), np.array(labels) # 划分训练集和测试集 X, y = load_ck_dataset('CK+') X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y)

3.2 SVM分类器训练

使用scikit-learn训练支持向量机(SVM)分类器：

from sklearn.svm import SVC from sklearn.pipeline import make_pipeline from sklearn.preprocessing import StandardScaler # 提取HOG特征 X_train_hog = np.array([extract_hog_features(img) for img in X_train]) X_test_hog = np.array([extract_hog_features(img) for img in X_test]) # 构建并训练SVM模型 svm_model = make_pipeline( StandardScaler(), SVC(kernel='linear', C=1.0, probability=True) ) svm_model.fit(X_train_hog, y_train)

3.3 模型评估

评估模型在测试集上的表现：

from sklearn.metrics import classification_report, confusion_matrix y_pred = svm_model.predict(X_test_hog) print("分类报告:") print(classification_report(y_test, y_pred)) print("\n混淆矩阵:") print(confusion_matrix(y_test, y_pred))

典型评估指标参考值：

指标	期望值	说明
准确率	>75%	整体分类正确率
精确率	>70%	正类预测准确度
召回率	>65%	正类识别完整度
F1分数	>70%	精确率和召回率调和平均

4. 实时表情识别实现

将训练好的模型应用于实时视频流：

def realtime_emotion_detection(model, feature_extractor): cap = cv2.VideoCapture(0) face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml') while True: ret, frame = cap.read() if not ret: break gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) faces = face_cascade.detectMultiScale(gray, 1.3, 5) for (x,y,w,h) in faces: face_roi = gray[y:y+h, x:x+w] face_roi = cv2.resize(face_roi, (64, 64)) face_roi = cv2.equalizeHist(face_roi) features = feature_extractor(face_roi) pred = model.predict([features])[0] proba = model.predict_proba([features])[0] cv2.rectangle(frame, (x,y), (x+w,y+h), (255,0,0), 2) cv2.putText(frame, f"{pred}: {max(proba):.2f}", (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (36,255,12), 2) cv2.imshow('Real-time Emotion Detection', frame) if cv2.waitKey(1) & 0xFF == ord('q'): break cap.release() cv2.destroyAllWindows() # 使用训练好的模型 realtime_emotion_detection(svm_model, extract_hog_features)

5. 性能优化与进阶技巧

5.1 数据增强策略

提高模型泛化能力的关键技术：

from skimage.transform import rotate from skimage.util import random_noise def augment_image(img): # 随机旋转 if np.random.rand() > 0.5: angle = np.random.uniform(-15, 15) img = rotate(img, angle, mode='edge') # 随机噪声 if np.random.rand() > 0.7: img = random_noise(img, var=0.01) # 随机亮度调整 img = np.clip(img * np.random.uniform(0.9, 1.1), 0, 255) return img

5.2 模型融合技术

结合HOG和LBP特征的集成方法：

from sklearn.ensemble import VotingClassifier from sklearn.linear_model import LogisticRegression # 提取两种特征 X_train_hog = np.array([extract_hog_features(img) for img in X_train]) X_train_lbp = np.array([extract_lbp_features(img) for img in X_train]) X_train_combined = np.hstack([X_train_hog, X_train_lbp]) # 构建多个基分类器 clf1 = SVC(kernel='linear', probability=True) clf2 = LogisticRegression(max_iter=1000) clf3 = make_pipeline(StandardScaler(), SVC(kernel='rbf', probability=True)) # 集成模型 ensemble = VotingClassifier( estimators=[('svm_linear', clf1), ('lr', clf2), ('svm_rbf', clf3)], voting='soft' ) ensemble.fit(X_train_combined, y_train)

5.3 深度学习对比方案

与传统方法对比的CNN实现：

from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout def build_cnn_model(input_shape=(64,64,1), num_classes=7): model = Sequential([ Conv2D(32, (3,3), activation='relu', input_shape=input_shape), MaxPooling2D((2,2)), Conv2D(64, (3,3), activation='relu'), MaxPooling2D((2,2)), Conv2D(128, (3,3), activation='relu'), MaxPooling2D((2,2)), Flatten(), Dense(128, activation='relu'), Dropout(0.5), Dense(num_classes, activation='softmax') ]) model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) return model # 数据准备 X_train_cnn = X_train[..., np.newaxis] / 255.0 X_test_cnn = X_test[..., np.newaxis] / 255.0 # 训练CNN cnn_model = build_cnn_model() history = cnn_model.fit(X_train_cnn, y_train, epochs=30, validation_data=(X_test_cnn, y_test))

6. 实际应用中的挑战与解决方案

6.1 光照条件变化

不同光照条件下的应对策略：

自适应直方图均衡化(CLAHE)：

clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8,8)) img_clahe = clahe.apply(img)

伽马校正：

gamma = 1.5 # 可调整参数 inv_gamma = 1.0 / gamma table = np.array([((i / 255.0) ** inv_gamma) * 255 for i in np.arange(0, 256)]).astype("uint8") img_gamma = cv2.LUT(img, table)

6.2 头部姿态变化

处理非正面人脸的技巧：

使用更鲁棒的人脸检测器(Dlib或MTCNN)
添加头部姿态估计模块，过滤角度过大的样本
在训练数据中加入多样化的头部姿态样本

6.3 实时性优化

提升实时性能的关键点：

模型量化：将浮点模型转为8位整型
多线程处理：分离图像采集和处理的线程
ROI缓存：对连续帧中同一人脸区域复用特征
模型剪枝：移除对精度影响小的网络参数

# 示例：使用OpenCV的DNN模块加速推理 net = cv2.dnn.readNetFromTensorflow('emotion_model.pb') blob = cv2.dnn.blobFromImage(face_roi, scalefactor=1/255.0, size=(64,64)) net.setInput(blob) preds = net.forward()

CK+数据集实战：用Python+OpenCV快速上手面部表情识别（附完整代码）