KNN实现手写字体的识别-JobPlus

1、KNN思想

KNN就是K最近邻，是一种分类算法，意思是选k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。在k个样本中，比重最大的那一类即可把目标归为这一类。

优点：不用训练

缺点：该算法在分类时有个主要的不足是，当样本不平衡时，K临近占比概率影响结果、计算量大

2、KNN如何实现手写字体的识别

①数据处理（图片处理为数字文本）

②待测图片与训练集每一张图片的向量做欧氏距离

③排序，选取最优K，使得结果最好

3、数据处理

①01文本转换图像

[python]

#coding:utf-8
import os
from PIL import Image
'''''
①两个文件夹，一个存储数字文件、一个存储图像文件
②读取src文件夹下的文件名，统计个数
③src+文件名=每个数字txt的路径，读取其内容
④写入图片，保存图片
注意：
①目标文件夹只能是最后一层不存在，才能创建
②python于java/c的区别，路径分割/刚好相反
③数字文件为01序列
④putpixel((列，行))
'''
def fun(src,dst):
#判断源文件夹是否存在,不存在结束
if not os.path.exists(src):
return
# 判断目标文件夹是否存在，不存在创建一个
if not os.path.exists(dst):
os.mkdir(dst)
#读取src文件中的文件名
list=os.listdir(src)
length=len(list)
for i in range(length):
#文件路径
path=src+"/"+list[i];
#读取文件内容
read=open(path)
#保存路径
SavePath=dst+"/"+list[i][:-4]+".png"
#写入图片，并保存,图片是32*32
image =Image.new("L",(32,32))
for j in range(32):
line=read.readline()
for k in range(32):
bit=int(line[k])
if bit ==1:
bit=255
image.putpixel((k,j),bit)
image.save(SavePath)
srcPath="C:/Users/Administrator/Desktop/src"
dstPath="C:/Users/Administrator/Desktop/dst"
fun(srcPath,dstPath)

②图片转换成01文本

[python]

#coding:utf-8
import os
from PIL import Image
import numpy as np
'''''
Python图像处理库PIL的基本概念介绍”，我们知道PIL中有九种不同模式。
分别为1，L，P，RGB，RGBA，CMYK，YCbCr，I，F。
模式“1”为二值图像，非黑即白。但是它每个像素用8个bit表示，0表示黑，255表示白
模式“L”为灰色图像，它的每个像素用8个bit表示，0表示黑，255表示白，其他数字表示不同的灰度。
模式“P”为8位彩色图像，它的每个像素用8个bit表示，其对应的彩色值是按照调色板查询出来的。
'''
def fun(src,dst):
if not os.path.exists(src):
return
if not os.path.exists(dst):
os.mkdir(dst)
list=os.listdir(src)
length=len(list)
for i in range(length):
path=src+'/'+list[i]
SavePath=dst+'/'+list[i][:-4]+".txt"
read=Image.open(path).convert("1")
arr=np.asarray(read)
np.savetxt(SavePath,arr,fmt="%d",delimiter='') #保存格式为整数,没有间隔
#np.savetxt(SavePath, arr,fmt="%d")
src="C:/Users/Administrator/Desktop/src"
dst="C:/Users/Administrator/Desktop/dst"
fun(src,dst)

4、具体实现

数据已经由图片处理为文本，且文本中像素点之间没有间隔。把每张图片处理为一个向量，32*32=1024。计算欧氏距离的时候也有技巧，不用遍历训练集一个一个与待测图片计算，可以利用np.title()，复制待测图片达到和训练集个数，直接矩阵相减。排序也有技巧，为了是每张图片和标签一一对应，排序的时候使用argsort()，统计众数的时候使用了字典，排序时候用sorted().

[python]

#coding:utf-8
import os
import numpy as np
import operator
'''''
①难点：计算欧氏距离并排序，确定k值，这里k=3最优
②图片都处理为数字文本,文本中没有空格
③字典排序，排序后变为[(),()]形式
'''
#价值数据
def Load(src):
if not os.path.exists(src):
return
list=os.listdir(src)
length=len(list)
label=[]
train=[]
for i in range(length):
path=src+"/"+list[i]
read=open(path)
temp = []
for j in range(32):
line=read.readline()
for k in range(32):
bit=int(line[k])
temp.append(bit)
train.append(temp)
label.append(int(list[i][0]))
train=np.array(train)
return train,label
def Classifier(train,laber,testPath,KK):
list=os.listdir(testPath)
length=len(list)
errorCount=0
for i in range(length):
#数据处理
path=testPath+"/"+list[i]
#实际值
ok=int(list[i][0])
read=open(path)
test=[]
for j in range(32):
line=read.readline()
for k in range(32):
bit=int(line[k])
test.append(bit)
#计算欧氏距离,不需要遍历，技巧
m=train.shape[0]
test=np.tile(test,(m,1))
sum=train-test #对应相减
sum=sum**2 #平方
sum=np.sum(sum,axis=1) #行求和
sum=sum**0.5 #开方
# 排序,返回下标
sum=np.argsort(sum)
#前k个，取最大类
ans={}
for j in range(KK):
lab=label[sum[j]] #下标对应的标签
if lab in ans.keys():
ans[lab]=ans[lab]+1
else:
ans[lab] = 1
ans=sorted(ans.items(),key=operator.itemgetter(1),reverse=True)
print ("实际值=",ok,"预测值=",ans[0][0])
if ok != ans[0][0]:
errorCount += 1.0
print("错误总数：%d" % errorCount)
print("错误率：%f" % (errorCount / length))
trainPath="C:/Users/Administrator/Desktop/src"
testPath="C:/Users/Administrator/Desktop/dst"
#训练集处理
train,label=Load(trainPath)
#测试集处理
Classifier(train,label,testPath,3)

总结：

①文件夹判断是否存在？文件夹创建？文件夹下所有文件名的读取？文本读取？

②图像的创建？图像像素点的填充？图像的保存？图像读取？文本的写入？

③欧氏距离的计算？title()的使用？argsort()的使用？字典的排序sorted()?

④如何确定最优K？遍历K，针对每个k计算错误率。

[python]

def selectK():
x = list()
y = list()
for i in range(1, 5):
x.append(int(i))
y.append(错误数)
plt.plot(x, y)
plt.show()

1、KNN思想KNN就是K最近邻，是一种分类算法，意思是选k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。在k个样本中，比重最大的那一类即可把目标归为这一类。优点：不用训练缺点：该算法在分类时有个主要的不足是，当样本不平衡时，K临近占比概率影响结果、计算量大2、KNN如何实现手写字体的识别①数据处理（图片处理为数字文本）②待测图片与训练集每一张图片的向量做欧氏距离③排序，选取最优K，使得结果最好3、数据处理①01文本转换图像 [python] <ol><li>#coding:utf-8  </li><li>import os  </li><li>from PIL import Image  </li><li>''''' </li><li>①两个文件夹，一个存储数字文件、一个存储图像文件 </li><li>②读取src文件夹下的文件名，统计个数 </li><li>③src+文件名=每个数字txt的路径，读取其内容 </li><li>④写入图片，保存图片 </li><li>注意： </li><li>①目标文件夹只能是最后一层不存在，才能创建 </li><li>②python于java/c的区别，路径分割/刚好相反 </li><li>③数字文件为01序列 </li><li>④putpixel((列，行)) </li><li>'''  </li><li>def fun(src,dst):  </li><li>    #判断源文件夹是否存在,不存在结束  </li><li>    if not os.path.exists(src):  </li><li>        return  </li><li>    # 判断目标文件夹是否存在，不存在创建一个  </li><li>    if not os.path.exists(dst):  </li><li>        os.mkdir(dst)  </li><li>    #读取src文件中的文件名  </li><li>    list=os.listdir(src)  </li><li>    length=len(list)  </li><li>    for i in range(length):  </li><li>        #文件路径  </li><li>        path=src+"/"+list[i];  </li><li>        #读取文件内容  </li><li>        read=open(path)  </li><li>        #保存路径  </li><li>        SavePath=dst+"/"+list[i][:-4]+".png"  </li><li>        #写入图片，并保存,图片是32*32  </li><li>        image =Image.new("L",(32,32))  </li><li>        for j in range(32):  </li><li>            line=read.readline()  </li><li>            for k in range(32):  </li><li>                bit=int(line[k])  </li><li>                if bit ==1:  </li><li>                    bit=255  </li><li>                image.putpixel((k,j),bit)  </li><li>        image.save(SavePath)  </li><li>srcPath="C:/Users/Administrator/Desktop/src"  </li><li>dstPath="C:/Users/Administrator/Desktop/dst"  </li><li>fun(srcPath,dstPath)  </li></ol>②图片转换成01文本 [python]<ol><li>#coding:utf-8  </li><li>import os  </li><li>from PIL import Image  </li><li>import numpy as np  </li><li>''''' </li><li>Python图像处理库PIL的基本概念介绍”，我们知道PIL中有九种不同模式。 </li><li>分别为1，L，P，RGB，RGBA，CMYK，YCbCr，I，F。 </li><li>模式“1”为二值图像，非黑即白。但是它每个像素用8个bit表示，0表示黑，255表示白 </li><li>模式“L”为灰色图像，它的每个像素用8个bit表示，0表示黑，255表示白，其他数字表示不同的灰度。 </li><li>模式“P”为8位彩色图像，它的每个像素用8个bit表示，其对应的彩色值是按照调色板查询出来的。 </li><li>'''  </li><li>def fun(src,dst):  </li><li>    if not os.path.exists(src):  </li><li>        return  </li><li>    if not os.path.exists(dst):  </li><li>        os.mkdir(dst)  </li><li>    list=os.listdir(src)  </li><li>    length=len(list)  </li><li>    for i in range(length):  </li><li>        path=src+'/'+list[i]  </li><li>        SavePath=dst+'/'+list[i][:-4]+".txt"  </li><li>        read=Image.open(path).convert("1")            </li><li>        arr=np.asarray(read)  </li><li>        np.savetxt(SavePath,arr,fmt="%d",delimiter='')    #保存格式为整数,没有间隔  </li><li>        #np.savetxt(SavePath, arr,fmt="%d")  </li><li>src="C:/Users/Administrator/Desktop/src"  </li><li>dst="C:/Users/Administrator/Desktop/dst"  </li><li>fun(src,dst)  </li></ol>4、具体实现数据已经由图片处理为文本，且文本中像素点之间没有间隔。把每张图片处理为一个向量，32*32=1024。计算欧氏距离的时候也有技巧，不用遍历训练集一个一个与待测图片计算，可以利用np.title()，复制待测图片达到和训练集个数，直接矩阵相减。排序也有技巧，为了是每张图片和标签一一对应，排序的时候使用argsort()，统计众数的时候使用了字典，排序时候用sorted(). [python]<ol><li>#coding:utf-8  </li><li>import os  </li><li>import numpy as np  </li><li>import operator  </li><li>''''' </li><li>①难点：计算欧氏距离并排序，确定k值，这里k=3最优 </li><li>②图片都处理为数字文本,文本中没有空格 </li><li>③字典排序，排序后变为[(),()]形式 </li><li>'''  </li><li>#价值数据  </li><li>def Load(src):  </li><li>    if not os.path.exists(src):  </li><li>        return  </li><li>    list=os.listdir(src)  </li><li>    length=len(list)  </li><li>    label=[]  </li><li>    train=[]  </li><li>    for i in range(length):  </li><li>        path=src+"/"+list[i]  </li><li>        read=open(path)  </li><li>        temp = []  </li><li>        for j in range(32):  </li><li>            line=read.readline()  </li><li>            for k in range(32):  </li><li>                bit=int(line[k])  </li><li>                temp.append(bit)  </li><li>        train.append(temp)  </li><li>        label.append(int(list[i][0]))  </li><li>    train=np.array(train)  </li><li>    return train,label  </li><li>def Classifier(train,laber,testPath,KK):  </li><li>    list=os.listdir(testPath)  </li><li>    length=len(list)  </li><li>    errorCount=0  </li><li>    for i in range(length):  </li><li>        #数据处理  </li><li>        path=testPath+"/"+list[i]  </li><li>        #实际值  </li><li>        ok=int(list[i][0])  </li><li>        read=open(path)  </li><li>        test=[]  </li><li>        for j in range(32):  </li><li>            line=read.readline()  </li><li>            for k in range(32):  </li><li>                bit=int(line[k])  </li><li>                test.append(bit)  </li><li>        #计算欧氏距离,不需要遍历，技巧  </li><li>        m=train.shape[0]  </li><li>        test=np.tile(test,(m,1))  </li><li>        sum=train-test    #对应相减  </li><li>        sum=sum**2       #平方  </li><li>        sum=np.sum(sum,axis=1)  #行求和  </li><li>        sum=sum**0.5     #开方  </li><li>        # 排序,返回下标  </li><li>        sum=np.argsort(sum)  </li><li>        #前k个，取最大类  </li><li>        ans={}  </li><li>        for j in range(KK):  </li><li>            lab=label[sum[j]]    #下标对应的标签  </li><li>            if lab in ans.keys():  </li><li>                ans[lab]=ans[lab]+1  </li><li>            else:  </li><li>                ans[lab] = 1  </li><li>        ans=sorted(ans.items(),key=operator.itemgetter(1),reverse=True)  </li><li>        print ("实际值=",ok,"预测值=",ans[0][0])  </li><li>        if ok != ans[0][0]:  </li><li>            errorCount += 1.0  </li><li>    print("错误总数：%d" % errorCount)  </li><li>    print("错误率：%f" % (errorCount / length))  </li><li>trainPath="C:/Users/Administrator/Desktop/src"  </li><li>testPath="C:/Users/Administrator/Desktop/dst"  </li><li>#训练集处理  </li><li>train,label=Load(trainPath)  </li><li>#测试集处理  </li><li>Classifier(train,label,testPath,3)  </li></ol>总结：①文件夹判断是否存在？文件夹创建？文件夹下所有文件名的读取？文本读取？②图像的创建？图像像素点的填充？图像的保存？图像读取？文本的写入？③欧氏距离的计算？title()的使用？argsort()的使用？字典的排序sorted()?④如何确定最优K？遍历K，针对每个k计算错误率。 [python]<ol><li>def selectK():  </li><li>    x = list()  </li><li>    y = list()  </li><li>    for i in range(1, 5):  </li><li>        x.append(int(i))  </li><li>        y.append(错误数)  </li><li>    plt.plot(x, y)  </li><li>    plt.show()  </li></ol>

关于我们

法律声明

帮助中心

商务合作

相关文章

关于我们

法律声明

帮助中心

商务合作