AlexNet模型python实现与应用-JobPlus

AlexNet模型实现流程

该模型总共应用五个卷积层和3个完全连接层进行卷积模型构建，其中第一和第二卷积层后有局部相应归一化处理（LRN），第一二五层后进行了最大池化处理，后三个完全连接层均进行了dropout防过拟合处理。以下为网络模型的参数维度、经过处理后训练集样本维度和参数数量等相关信息。另外在第二第四第五层分成了两个GPU进行模型训练，此时参数中的channel(第三个维度)要对半分，标红部分需要除以2。

参数相关信息表

AlexNet模型的python实现

1.定义卷积层函数

本人定义的函数没有将参数划分成两部分，若划分成两部分，可用以下代码：

2.定义LRN函数（进行局部相应归一化处理）

3.定义最大池化函数

4.定义dropout函数（可定义也可不定义，区别不大）

5.定义完全连接层

用Alexnet模型训练淘宝商品分类1000张图片

[python] view plain copy

import cv2
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
import os
import random
def convinit(w,h,channel,featurenum):
W = tf.Variable(tf.truncated_normal([w,h,channel,featurenum],stddev = 0.01))#首先需要创建W和b变量
b = tf.Variable(tf.constant(0.01,shape = [featurenum]))
return W,b
def fcinit(inputD,outputD):
W = tf.Variable(tf.truncated_normal([inputD,outputD],stddev =0.01),dtype = tf.float32)
b = tf.Variable(tf.constant(0.01,shape = [outputD]),dtype = tf.float32)
return W,b
def convLayer(x,W,b,stride_x,stride_y,Flagure,padding = 'SAME'):
conv = tf.nn.conv2d(x,W,strides = [1,stride_x,stride_y,1],padding = padding)#进行卷积处理
out = tf.add(conv,b)
if Flagure:
return tf.nn.relu(out)
else:
return out #在最后一个卷积时不需要用relu
def LRN(x,alpha,beta,R,bias):
y = tf.nn.local_response_normalization(x,depth_radius = R,alpha = alpha,beta = beta,bias = bias)
return y
def max_poolLayer(x,w,h,stride_x,stride_y,padding = 'SAME'):
y = tf.nn.max_pool(x,ksize = [1,w,h,1],strides = [1,stride_x,stride_y,1],padding = padding)
return y
def dropout(x,keeppro):
y = tf.nn.dropout(x,keeppro)
return y
def fcLayer(x,W,b,Flagure):
out = tf.add(tf.matmul(x,W),b)
if Flagure:
return tf.nn.relu(out)
else:
return out
def model(x,keeppro):
#conv1
W1,b1 = convinit(10,10,3,64)
conv1 = convLayer(x,W1,b1,4,4,True,'VALID')
LRN1 = LRN(conv1,2e-05,0.75,2,1)
maxpool1 = max_poolLayer(LRN1,3,3,2,2,'VALID')
#conv2
W2,b2 = convinit(5,5,64,96)
conv2 = convLayer(maxpool1,W2,b2,2,2,True,'VALID')
LRN2 = LRN(conv2,2e-05,0.75,2,1)
maxpool2 = max_poolLayer(LRN2,3,3,2,2,'VALID')
#conv3
W3,b3 = convinit(3,3,96,128)
conv3 = convLayer(maxpool2,W3,b3,1,1,True,'SAME')
#conv4
W4,b4 = convinit(3,3,128,256)
conv4 = convLayer(conv3,W4,b4,1,1,True,'SAME')
#conv5
W5,b5 = convinit(3,3,256,256)
conv5 = convLayer(conv4,W5,b5,1,1,True,'SAME')
maxpool5 = max_poolLayer(conv5,2,2,2,2,'SAME')
#fclayer1
fcIn = tf.reshape(maxpool5,[-1,4*4*256])
W_1,b_1 = fcinit(4*4*256,512)
fcout1 = fcLayer(fcIn,W_1,b_1,True)
dropout1 = dropout(fcout1,keeppro)
#fclayer2
W_2,b_2 = fcinit(512,256)
fcout2 = fcLayer(dropout1,W_2,b_2,True)
dropout2 = dropout(fcout2,keeppro)
#fclayer3
W_3,b_3 = fcinit(256,10)
fcout3 = fcLayer(dropout2,W_3,b_3,False)
out_1 = tf.nn.softmax(fcout3)
out = dropout(out_1,keeppro)
return out
def accuracy(x,y):
global out
predict = sess.run(out,feed_dict = {x:test_x,keeppro:0.5})
correct_predict = tf.equal(tf.argmax(predict,1),tf.argmax(y,1))
accuracy = tf.reduce_mean(tf.cast(correct_predict,tf.float32))
result = sess.run(accuracy,feed_dict = {x:test_x,y:test_y,keeppro:0.5})
return predict,result
#make data
#read file
file = 'D:\\CNN paper\\Alex_net\\image1000test200\\train.txt'
os.chdir('D:\\CNN paper\\Alex_net\\image1000test200\\train')
with open(file,'rb') as f:
dirdata = []
for line in f.readlines():
lines = bytes.decode(line).strip().split('\t')
dirdata.append(lines)
dirdata = np.array(dirdata)
#read imgdata
imgdir,label_1 = zip(*dirdata)
alldata_x = []
for dirname in imgdir:
img = cv2.imread(dirname.strip(),cv2.IMREAD_COLOR)
imgdata = cv2.resize(img,(320,320),cv2.INTER_LINEAR)
alldata_x.append(imgdata)
#random shuffle
alldata = zip(alldata_x,label_1)
temp = list(alldata)
random.shuffle(temp)
data_xs,data_label = zip(*temp)
data_x = np.array(data_xs)
label = [int(i) for i in data_label]
#label one hot
tf_label_onehot = tf.one_hot(label,10)
with tf.Session() as sess:
data_y = sess.run(tf_label_onehot)
#data increase
train_x = data_x[:500]
train_y = data_y[:500]
test_x = data_x[500:800]
test_y = data_y[500:800]
x = tf.placeholder(tf.float32,[None,320,320,3])
y = tf.placeholder(tf.float32,[None,10])
keeppro = tf.placeholder(tf.float32)
out = model(x,keeppro)
out = tf.clip_by_value(out,1e-10,1.0)
loss = tf.reduce_mean(-tf.reduce_sum(y*tf.log(out),reduction_indices = [1]))
Optimizer = tf.train.GradientDescentOptimizer(0.01).minimize(loss)
init = tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(init)
for i in range(100):
sess.run(Optimizer,feed_dict = {x:train_x,y:train_y,keeppro:0.5})
if i%10 == 0:
cost = sess.run(loss,feed_dict = {x:train_x,y:train_y,keeppro:0.5})
print('after %d iteration,cost is %f'%(i,cost))
predict = sess.run(out,feed_dict = {x:test_x,keeppro:0.5})
correct_predict = tf.equal(tf.argmax(predict,1),tf.argmax(y,1))

[python] view plain copy

accuracy = tf.reduce_mean(tf.cast(correct_predict,tf.float32))
result = sess.run(accuracy,feed_dict = {x:test_x,y:test_y,keeppro:0.5})
print('after %d iteration,accuracy is %f'%(i,result))

AlexNet模型实现流程该模型总共应用五个卷积层和3个完全连接层进行卷积模型构建，其中第一和第二卷积层后有局部相应归一化处理（LRN），第一二五层后进行了最大池化处理，后三个完全连接层均进行了dropout防过拟合处理。以下为网络模型的参数维度、经过处理后训练集样本维度和参数数量等相关信息。另外在第二第四第五层分成了两个GPU进行模型训练，此时参数中的channel(第三个维度)要对半分，标红部分需要除以2。参数相关信息表<img src="https://file.jobplus.com.cn/2018/05/07/9d9f5a3a82d849909dc643346616272c.png" _src="https://file.jobplus.com.cn/2018/05/07/9d9f5a3a82d849909dc643346616272c.png"/>AlexNet模型的python实现1.定义卷积层函数本人定义的函数没有将参数划分成两部分，若划分成两部分，可用以下代码：2.定义LRN函数（进行局部相应归一化处理）3.定义最大池化函数4.定义dropout函数（可定义也可不定义，区别不大）5.定义完全连接层用Alexnet模型训练淘宝商品分类1000张图片[python] view plain copy<ol><li>  </li></ol>[python] view plain copy<ol><li>import cv2  </li><li>import numpy as np  </li><li>import matplotlib.pyplot as plt  </li><li>import tensorflow as tf  </li><li>import os  </li><li>import random  </li><li>  </li><li>def convinit(w,h,channel,featurenum):  </li><li>    W = tf.Variable(tf.truncated_normal([w,h,channel,featurenum],stddev = 0.01))#首先需要创建W和b变量  </li><li>    b = tf.Variable(tf.constant(0.01,shape = [featurenum]))  </li><li>    return W,b  </li><li>def fcinit(inputD,outputD):  </li><li>    W = tf.Variable(tf.truncated_normal([inputD,outputD],stddev =0.01),dtype = tf.float32)  </li><li>    b = tf.Variable(tf.constant(0.01,shape = [outputD]),dtype = tf.float32)  </li><li>    return W,b  </li><li>def convLayer(x,W,b,stride_x,stride_y,Flagure,padding = 'SAME'):  </li><li>    conv = tf.nn.conv2d(x,W,strides = [1,stride_x,stride_y,1],padding = padding)#进行卷积处理  </li><li>    out = tf.add(conv,b)  </li><li>    if Flagure:  </li><li>        return tf.nn.relu(out)  </li><li>    else:  </li><li>        return out #在最后一个卷积时不需要用relu  </li><li>def LRN(x,alpha,beta,R,bias):  </li><li>    y = tf.nn.local_response_normalization(x,depth_radius = R,alpha = alpha,beta = beta,bias = bias)  </li><li>    return y   </li><li>def max_poolLayer(x,w,h,stride_x,stride_y,padding = 'SAME'):  </li><li>    y = tf.nn.max_pool(x,ksize = [1,w,h,1],strides = [1,stride_x,stride_y,1],padding = padding)  </li><li>    return y  </li><li>def dropout(x,keeppro):  </li><li>    y = tf.nn.dropout(x,keeppro)  </li><li>    return y  </li><li>def fcLayer(x,W,b,Flagure):  </li><li>    out = tf.add(tf.matmul(x,W),b)  </li><li>    if Flagure:  </li><li>        return tf.nn.relu(out)  </li><li>    else:  </li><li>        return out  </li><li>def model(x,keeppro):  </li><li>    #conv1  </li><li>    W1,b1 = convinit(10,10,3,64)  </li><li>    conv1 = convLayer(x,W1,b1,4,4,True,'VALID')  </li><li>    LRN1 = LRN(conv1,2e-05,0.75,2,1)  </li><li>    maxpool1 = max_poolLayer(LRN1,3,3,2,2,'VALID')  </li><li>    #conv2  </li><li>    W2,b2 = convinit(5,5,64,96)  </li><li>    conv2 = convLayer(maxpool1,W2,b2,2,2,True,'VALID')  </li><li>    LRN2 = LRN(conv2,2e-05,0.75,2,1)  </li><li>    maxpool2 = max_poolLayer(LRN2,3,3,2,2,'VALID')  </li><li>    #conv3  </li><li>    W3,b3 = convinit(3,3,96,128)  </li><li>    conv3 = convLayer(maxpool2,W3,b3,1,1,True,'SAME')  </li><li>    #conv4  </li><li>    W4,b4 = convinit(3,3,128,256)  </li><li>    conv4 = convLayer(conv3,W4,b4,1,1,True,'SAME')  </li><li>    #conv5  </li><li>    W5,b5 = convinit(3,3,256,256)  </li><li>    conv5 = convLayer(conv4,W5,b5,1,1,True,'SAME')  </li><li>    maxpool5 = max_poolLayer(conv5,2,2,2,2,'SAME')  </li><li>    #fclayer1  </li><li>    fcIn = tf.reshape(maxpool5,[-1,4*4*256])  </li><li>    W_1,b_1 = fcinit(4*4*256,512)  </li><li>    fcout1 = fcLayer(fcIn,W_1,b_1,True)  </li><li>    dropout1 = dropout(fcout1,keeppro)  </li><li>    #fclayer2  </li><li>    W_2,b_2 = fcinit(512,256)  </li><li>    fcout2 = fcLayer(dropout1,W_2,b_2,True)  </li><li>    dropout2 = dropout(fcout2,keeppro)  </li><li>    #fclayer3  </li><li>    W_3,b_3 = fcinit(256,10)  </li><li>    fcout3 = fcLayer(dropout2,W_3,b_3,False)      </li><li>    out_1 = tf.nn.softmax(fcout3)  </li><li>    out = dropout(out_1,keeppro)  </li><li>    return out   </li><li>def accuracy(x,y):  </li><li>    global out  </li><li>    predict = sess.run(out,feed_dict = {x:test_x,keeppro:0.5})  </li><li>    correct_predict = tf.equal(tf.argmax(predict,1),tf.argmax(y,1))  </li><li>    accuracy = tf.reduce_mean(tf.cast(correct_predict,tf.float32))  </li><li>    result = sess.run(accuracy,feed_dict = {x:test_x,y:test_y,keeppro:0.5})  </li><li>    return predict,result   </li><li>  </li><li>#make data  </li><li>#read file  </li><li>file = 'D:\\CNN paper\\Alex_net\\image1000test200\\train.txt'  </li><li>os.chdir('D:\\CNN paper\\Alex_net\\image1000test200\\train')  </li><li>with open(file,'rb') as f:  </li><li>    dirdata = []  </li><li>    for line in f.readlines():  </li><li>        lines = bytes.decode(line).strip().split('\t')  </li><li>        dirdata.append(lines)  </li><li>dirdata = np.array(dirdata)  </li><li>  </li><li>#read imgdata  </li><li>imgdir,label_1 = zip(*dirdata)  </li><li>alldata_x = []  </li><li>for dirname in imgdir:  </li><li>    img = cv2.imread(dirname.strip(),cv2.IMREAD_COLOR)  </li><li>    imgdata = cv2.resize(img,(320,320),cv2.INTER_LINEAR)  </li><li>    alldata_x.append(imgdata)  </li><li>#random shuffle  </li><li>alldata = zip(alldata_x,label_1)  </li><li>temp = list(alldata)  </li><li>random.shuffle(temp)  </li><li>data_xs,data_label = zip(*temp)  </li><li>data_x = np.array(data_xs)  </li><li>label = [int(i) for i in data_label]  </li><li>#label one hot  </li><li>tf_label_onehot = tf.one_hot(label,10)  </li><li>with tf.Session() as sess:  </li><li>    data_y = sess.run(tf_label_onehot)  </li><li>#data increase  </li><li>train_x = data_x[:500]  </li><li>train_y = data_y[:500]  </li><li>test_x = data_x[500:800]  </li><li>test_y = data_y[500:800]  </li><li>  </li><li>x = tf.placeholder(tf.float32,[None,320,320,3])  </li><li>y = tf.placeholder(tf.float32,[None,10])  </li><li>keeppro = tf.placeholder(tf.float32)  </li><li>out = model(x,keeppro)  </li><li>out = tf.clip_by_value(out,1e-10,1.0)  </li><li>loss = tf.reduce_mean(-tf.reduce_sum(y*tf.log(out),reduction_indices = [1]))  </li><li>Optimizer = tf.train.GradientDescentOptimizer(0.01).minimize(loss)  </li><li>init = tf.global_variables_initializer()  </li><li>with tf.Session() as sess:  </li><li>    sess.run(init)  </li><li>    for i in range(100):  </li><li>        sess.run(Optimizer,feed_dict = {x:train_x,y:train_y,keeppro:0.5})  </li><li>        if i%10 == 0:  </li><li>            cost = sess.run(loss,feed_dict = {x:train_x,y:train_y,keeppro:0.5})  </li><li>            print('after %d iteration,cost is %f'%(i,cost))  </li><li>            predict = sess.run(out,feed_dict = {x:test_x,keeppro:0.5})  </li><li>            correct_predict = tf.equal(tf.argmax(predict,1),tf.argmax(y,1))  </li></ol>[python] view plain copy<ol><li>accuracy = tf.reduce_mean(tf.cast(correct_predict,tf.float32))  </li><li>result = sess.run(accuracy,feed_dict = {x:test_x,y:test_y,keeppro:0.5})  </li><li>print('after %d iteration,accuracy is %f'%(i,result))  </li></ol>