Tensorflow CNN с пользовательскими изображениями со значениями RGB

Я следил за учебными пособиями по созданию CNN с набором данных MNIST и понимаю большую часть этого. Затем я попытался преобразовать его в свои собственные изображения со значениями RGB. Но есть проблемы в некоторых частях кода, так как я не до конца понимаю, что происходит и как действовать дальше. Я знаю, что мне нужно изменить каналы на 3, но не знаю, правильно ли работают остальные вспомогательные функции? Я также не понимаю, когда я все инициализировал, как это тренировать. Из-за batch_x, batch_y = iterator.get_next() я не могу использовать feed_dict, и не знаю, как это обучить? На данных MNIST можно было установить отсев, но как я могу указать это сейчас? И насколько я понимаю, я его не тренирую на реальных данных знаете? Как я могу также рассчитать результат так же, как с данными MNIST, когда я создаю и тестирую данные проверки?

Код выглядит следующим образом:

import tensorflow as tf
import process_images as image_util
from tensorflow.contrib.data import Dataset, Iterator

# With MNIST
#from tensorflow.examples.tutorials.mnist import input_data
#mnist = input_data.read_data_sets("MNISt_data/", one_hot=True)

filenames_dummy, labels_dummy = image_util.run_it()

#The filenames_dummy and labels_dummy are two lists looking like this, respectively:
#["data/image_1.png", "data/image_2.png", ..., "data/image_n.png"]
# The values of the labels are 0-3, since I have 4 classes. 
#[0, 1, ..., 3]   

filenames = tf.constant(filenames_dummy)
labels = tf.constant(labels_dummy)


def _parse_function(filename, label):
  image_string = tf.read_file(filename)
  image_decoded = tf.image.decode_png(image_string, channels=3)
  # The image size is 425x425.
  image_resized = tf.image.resize_images(image_decoded, [425,425])
  return image_resized, label

dataset = tf.contrib.data.Dataset.from_tensor_slices((filenames, labels))
dataset = dataset.map(_parse_function)

dataset = dataset.batch(30)
dataset = dataset.repeat()

iterator = dataset.make_one_shot_iterator()

# Helper functions

# INIT weights
def init_weights(shape):
    init_random_dist = tf.truncated_normal(shape, stddev=0.1)
    return(tf.Variable(init_random_dist))

# INIT Bias
def init_bias(shape):
    init_bias_vals = tf.constant(0.1, shape=shape)
    return tf.Variable(init_bias_vals)

# CONV2D
def conv2d(x, W):
    # x --> input tensor [batch, H, W, Channels]
    # W --> [filter H, filter W, Channels IN, Channels OUT] 
    return tf.nn.conv2d(x, W, strides=[1,1,1,1], padding='SAME')

# Pooling
def max_pooling_2by2(x):
    # x --> [batch, h, w, c]
    return tf.nn.max_pool(x, ksize=[1,2,2,1], strides=[1,2,2,1],    padding='SAME')

#Convolutional layer 

def convolutional_layer(input_x, shape):
    W =init_weights(shape)
    b = init_bias([shape[3]])

    return tf.nn.relu(conv2d(input_x, W)+b)

# Normal (FULLY CONNTCTED)

def normal_full_layer(input_layer, size):
    input_size = int(input_layer.get_shape()[1])
    W = init_weights([input_size, size])
    b = init_bias([size])
    return tf.matmul(input_layer, W) + b

# PLACEHOLDERS

x = tf.placeholder(tf.float32, shape=[None, 180625])
y_true = tf.placeholder(tf.float32, shape=[None, 4])

# With MNIST
#x = tf.placeholder(tf.float32, shape=[None, 784])
#y_true = tf.placeholder(tf.float32, shape=[None, 10])

# Layers
x_image = tf.reshape(x, [-1, 425,425, 1]) 
# With MNIST
#x_image = tf.reshape(x, [-1, 28,28, 1]) 

convo_1 = convolutional_layer(x_image, shape=[5,5,1,32]) 
convo_1_pooling = max_pooling_2by2(convo_1)

convo_2 = convolutional_layer(convo_1_pooling, shape=[5,5,32, 64])
convo_2_pooling = max_pooling_2by2(convo_2)
convo_2_flat = tf.reshape(convo_2_pooling, [-1, 7*7*64])

full_layer_one = tf.nn.relu(normal_full_layer(convo_2_flat, 1024))

# Dropout
hold_prob = tf.placeholder(tf.float32)
full_one_dropout = tf.nn.dropout(full_layer_one, keep_prob=hold_prob)

y_pred = normal_full_layer(full_one_dropout, 4)
# With MNIST
#y_pred = normal_full_layer(full_one_dropout, 10)

# LOSS function
cross_entropy =         
tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_true, logits=y_pred))

# Optimizer
optimizer = tf.train.AdamOptimizer(learning_rate=0.001)
train = optimizer.minimize(cross_entropy)

init = tf.global_variables_initializer()

steps = 5000

with tf.Session() as sess:
    sess.run(init)

    for i in range(steps):

        batch_x, batch_y = iterator.get_next()
        test1, test2 = sess.run([batch_x, batch_y])

        # With MNIST
        #sess.run(train, feed_dict={x:batch_x, y_true:batch_y, hold_prob:0.5})

        if i%100 == 0:
            print("ON STEP {}".format(i))
            print("Accuracy: ")
            matches = tf.equal(tf.argmax(y_pred, 1), tf.argmax(y_true, 1))
            accuracy = tf.reduce_mean(tf.cast(matches, tf.float32))

            # With MNIST
            #print(sess.run(accuracy, feed_dict={x:mnist.test.images, y_true:mnist.test.labels, hold_prob:1.0}))

Einar Johnsen 07.12.2017 источник

comment

Вы можете (и должны по соображениям производительности) передавать тензоры, возвращенные из iterator.get_next(), непосредственно на вход сети вместо использования заполнителей. Для этого вам потребуется немного изменить структуру кода... см. этот ответ (в частности, пункт 4). - mrry 08.12.2017

comment

Благодарю вас! Я понимаю, что это не так эффективно, как напрямую в сеть, но мне трудно понять, как это должно работать.

value_x, value_y = iterator.get_next()          batch_x, batch_y = sess.run([value_x, value_y])          sess.run(optimizer, feed_dict={x:batch_x, y_true: batch_y, hold_prob: 0.5})

Это то, что я сделал для проверки. Если я выложу значения из батча прямо в сеть, без запуска sess. Как я могу получить значения и должны ли они быть помещены в dict? Потому что я все еще хочу иметь вероятность выпадения случайных нейронов. - Einar Johnsen 09.12.2017

Tensorflow CNN с пользовательскими изображениями со значениями RGB

Вопросы по теме