Я использую реализацию GoogleNet в Caffe, доступную по адресу https://github.com/BVLC/caffe/tree/master/models/bvlc_googlenet в процессе обнаружения и локализации. Я добился больших успехов, используя эту сеть для передачи обучения в моей собственной задаче мелкозернистой классификации, но мне было гораздо труднее использовать готовую реализацию. Используя слегка измененную версию deploy.prototxt с уменьшенным размером пакета с 10 до 1, я прогнозирование классов для изображений, содержащихся в этом каталоге.
{
'bikini1': {
'445': 0.44777653,
'459': 0.42523962,
'543': 0.0014282113,
'638': 0.083084606,
'639': 0.03712019},
'bikini2': {
'445': 0.34988937,
'459': 0.56838924,
'638': 0.053508826,
'639': 0.0262988,
'775': 0.00064279145},
'cheeseburger1': {
'923': 0.00077056035,
'924': 0.00074912253,
'931': 0.0040806201,
'933': 0.98862922,
'964': 0.0012325585},
'cheeseburger2': {
'923': 5.947132e-05,
'928': 0.00013152717,
'931': 0.00084521802,
'933': 0.99827468,
'934': 0.00013743658},
'ipod1': {
'487': 0.0010906343,
'605': 0.99825007,
'632': 9.7395357e-05,
'662': 0.00010778452,
'754': 0.00011993563},
'ipod2': {
'487': 1.3061179e-05,
'592': 2.9665862e-05,
'605': 0.99993002,
'681': 9.4235074e-06,
'761': 3.5998178e-06}
}
Эти изображения взяты непосредственно из обучающего набора ImageNet. Что интересно, сеть присваивает одной и той же метке каждой паре с высокой степенью достоверности, но эти метки кажутся полностью расходящимися с метки, предоставленные ImageNet. Сеть, кажется, работает, но, может быть, я ссылаюсь на неправильное сопоставление метки класса? Любая помощь от всех специалистов Caffe/ImageNet будет принята с благодарностью!