一般的图像预处理过程
一般的图像预处理过程
灰度化:将彩色图像转换为灰度图像,降低处理复杂度。
二值化:将灰度图像转换为二值图像,即只包含黑色和白色,以突出字符。
去噪:使用滤波器去除图像中的噪声,如高斯模糊或中值滤波。
归一化:调整图像的尺寸,使其大小统一,通常为28x28像素,与MNIST数据集中的图像大小一致。
图像分割:将验证码中的每个字符分割开来。这可能涉及到使用图像处理技术来检测和分离字符。
特征提取:将图像转换为特征向量。在MNIST数据集中,每个图像已经被转换为一个784维的向量(28x28像素,每个像素的灰度值作为特征)。
数据增强:为了提高模型的泛化能力,可以通过旋转、缩放、剪切等方法增加数据集的多样性。
标签分配:每个验证码图像都有一个对应的标签,通常是表示图像中字符的序列。
划分数据集:将数据集划分为训练集、验证集和测试集,用于模型训练和评估。
模型训练:使用训练集数据训练模型,如逻辑回归、卷积神经网络(CNN)等。
模型评估:在验证集和测试集上评估模型的性能,使用准确率、召回率等指标。
后处理:对模型的预测结果进行后处理,如根据置信度阈值进行筛选,或者使用语言模型进行进一步的校正。
https://blog.csdn.net/qq_44289607/article/details/122853933
https://blog.csdn.net/weixin_38739735/article/details/135331804






