python/html/layer__model__helper_8py_source.html

 from __future__ import absolute_import
 from __future__ import division
 from __future__ import print_function
 from __future__ import unicode_literals

 from caffe2.python import core, model_helper, schema
 from caffe2.python.layers import layers

 import logging
 import numpy as np
 logger = logging.getLogger(__name__)


 class LayerModelHelper(model_helper.ModelHelperBase):
     """
     Model helper for building models on top of layers abstractions.

     Each layer is the abstraction that is higher level than Operator. Layer
     is responsible for ownership of it's own parameters and can easily be
     instantiated in multiple nets possible with different sets of ops.
     As an example: one can easily instantiate predict and train nets from
     the same set of layers, where predict net will have subset of the
     operators from train net.
     """

     def __init__(self, name, input_feature_schema, trainer_extra_schema):
         super(LayerModelHelper, self).__init__(name=name)
         self._layer_names = set()
         self._layers = []

         # optimizer bookkeeping
         self.param_to_optim = {}

         self._default_optimizer = None
         self._loss = None
         self._output_schema = None

         # Connect Schema to self.net. That particular instance of schmea will be
         # use for generation of the Layers accross the network and would be used
         # for connection with Readers.
         self._input_feature_schema = schema.NewRecord(
             self.net,
             input_feature_schema
         )
         self._trainer_extra_schema = schema.NewRecord(
             self.net,
             trainer_extra_schema
         )
         self._metrics_schema = schema.Struct()

         self._init_global_constants()
         self.param_init_net = self.create_init_net('param_init_net')

     def add_metric_field(self, name, value):
         assert name not in self._metrics_schema.fields, (
             "Try to add metric field twice: {}".format(name))
         self._metrics_schema = self._metrics_schema + schema.Struct(
             (name, value)
         )

     def add_global_constant(self, name, array=None, dtype=None,
                             initializer=None):
         # This is global namescope for constants. They will be created in all
         # init_nets and there should be very few of them.
         assert name not in self.global_constants
         self.global_constants[name] = self.net.NextBlob(name)

         if array is not None:
             assert initializer is None,\
                 "Only one from array and initializer should be specified"
             if dtype is None:
                 array = np.array(array)
             else:
                 array = np.array(array, dtype=dtype)

             # TODO: make GivenTensor generic
             op_name = None
             if array.dtype == np.int32:
                 op_name = 'GivenTensorIntFill'
             elif array.dtype == np.int64:
                 op_name = 'GivenTensorInt64Fill'
             elif array.dtype == np.str:
                 op_name = 'GivenTensorStringFill'
             else:
                 op_name = 'GivenTensorFill'

             def initializer(blob_name):
                 return core.CreateOperator(op_name,
                                            [],
                                            blob_name,
                                            shape=array.shape,
                                            values=array.flatten().tolist()
                                            )
         else:
             assert initializer is not None

         self.global_constant_initializers.append(
             initializer(self.global_constants[name]))
         return self.global_constants[name]

     def _init_global_constants(self):
         self.global_constants = {}
         self.global_constant_initializers = []
         self.add_global_constant('ONE', 1.0)
         self.add_global_constant('ZERO', 0.0)
         self.add_global_constant('ZERO_RANGE', [0, 0], dtype='int32')

     def _add_global_constants(self, init_net):
         for initializer_op in self.global_constant_initializers:
             init_net._net.op.extend([initializer_op])

     def create_init_net(self, name):
         init_net = core.Net(name)
         self._add_global_constants(init_net)
         return init_net

     def next_layer_name(self, prefix):
         base_name = core.ScopedName(prefix)
         name = base_name
         index = 0
         while name in self._layer_names:
             name = base_name + '_auto_' + str(index)
             index += 1

         self._layer_names.add(name)
         return name

     def add_layer(self, layer):
         self._layers.append(layer)
         for param in layer.get_parameters():
             assert isinstance(param.parameter, core.BlobReference)
             self.param_to_optim[str(param.parameter)] = param.optimizer

         # The primary value of adding everything to self.net - generation of the
         # operators right away, i.e. if error happens it'll be detected
         # immediately. Other then this - create_x_net should be called.
         layer.add_operators(self.net, self.param_init_net)
         return layer.output_schema

     def get_parameter_blobs(self):
         param_blobs = []
         for layer in self._layers:
             for param in layer.get_parameters():
                 param_blobs.append(param.parameter)

         return param_blobs

     @property
     def default_optimizer(self):
         return self._default_optimizer

     @default_optimizer.setter
     def default_optimizer(self, optimizer):
         self._default_optimizer = optimizer

     @property
     def input_feature_schema(self):
         return self._input_feature_schema

     @property
     def trainer_extra_schema(self):
         return self._trainer_extra_schema

     @property
     def metrics_schema(self):
         """
         Returns the schema that represents model output that should be used for
         metric reporting.

         During the training/evaluation this schema will be appended to the
         schema that represents model output.
         """
         return self._metrics_schema

     @property
     def output_schema(self):
         assert self._output_schema is not None
         return self._output_schema

     @output_schema.setter
     def output_schema(self, schema):
         assert self._output_schema is None
         self._output_schema = schema

     @property
     def loss(self):
         assert self._loss is not None
         return self._loss

     @loss.setter
     def loss(self, loss):
         assert self._loss is None
         self._loss = loss

     def __getattr__(self, layer):
         # TODO(amalevich): Add add support for ifbpy inline documentation
         if layers.layer_exists(layer):
             def wrapper(*args, **kwargs):
                 return self.add_layer(
                     layers.create_layer(layer, self, *args, **kwargs))
             return wrapper
         elif core.IsOperator(layer):
             def wrapper(*args, **kwargs):
                 def apply_operator(net, in_record, out_record):
                     # TODO(amalevich): Switch to net.operator as soon as it gets
                     # landed
                     net.__getattr__(layer)(in_record.field_blobs(),
                                            out_record.field_blobs(),
                                            **kwargs)
                 if 'name' not in kwargs:
                     kwargs['name'] = layer
                 return self.add_layer(
                     layers.create_layer('Functional',
                                         self, *args, function=apply_operator,
                                         **kwargs))
             return wrapper
         else:
             raise ValueError(
                 "Tring to create non-registered layer: {0}".format(layer))

     @property
     def layers(self):
         return self._layers

     def apply_optimizers(self, train_net, train_init_net, grad_map):
         for param, optimizer in self.param_to_optim.items():
             if not optimizer:
                 optimizer = self.default_optimizer
             # note that not all params has gradient and thus we sent None if
             # gradient does not exists
             optimizer(
                 train_net, train_init_net, param, grad_map.get(str(param)))

     def _GetOne(self):
         return self.global_constants['ONE']

     # An optimizer which allows us to do NO optimization
     def NoOptim(self, *args, **kwargs):
         pass
layer_model_helper.LayerModelHelper._loss
_loss
Definition: layer_model_helper.py:37

core.IsOperator
def IsOperator(op_type)
Definition: core.py:95

optimizer
Module caffe2.python.optimizer.
Definition: optimizer.py:1

core.BlobReference
Definition: core.py:115

model_helper.ModelHelperBase.net
net
Definition: model_helper.py:65

schema.NewRecord
def NewRecord(net, schema)
Definition: schema.py:908

layer_model_helper.LayerModelHelper.create_init_net
def create_init_net(self, name)
Definition: layer_model_helper.py:114

layer_model_helper.LayerModelHelper._output_schema
_output_schema
Definition: layer_model_helper.py:38

layer_model_helper.LayerModelHelper.default_optimizer
def default_optimizer(self)
Definition: layer_model_helper.py:151

layer_model_helper.LayerModelHelper._default_optimizer
_default_optimizer
Definition: layer_model_helper.py:36

layer_model_helper.LayerModelHelper._input_feature_schema
_input_feature_schema
Definition: layer_model_helper.py:43

layer_model_helper.LayerModelHelper.param_init_net
param_init_net
Definition: layer_model_helper.py:54

layer_model_helper.LayerModelHelper._layer_names
_layer_names
Definition: layer_model_helper.py:30

layer_model_helper.LayerModelHelper.param_to_optim
param_to_optim
Definition: layer_model_helper.py:34

layer_model_helper.LayerModelHelper.add_layer
def add_layer(self, layer)
Definition: layer_model_helper.py:130

layer_model_helper.LayerModelHelper.metrics_schema
def metrics_schema(self)
Definition: layer_model_helper.py:167

layer_model_helper.LayerModelHelper._add_global_constants
def _add_global_constants(self, init_net)
Definition: layer_model_helper.py:110

layer_model_helper.LayerModelHelper.global_constants
global_constants
Definition: layer_model_helper.py:104

layers
Module caffe2.python.layers.layers.
Definition: __init__.py:1

core.Net
Definition: core.py:1119

layer_model_helper.LayerModelHelper._layers
_layers
Definition: layer_model_helper.py:31

core.ScopedName
def ScopedName(name)
Definition: core.py:207

model_helper.ModelHelperBase
Definition: model_helper.py:54

layer_model_helper.LayerModelHelper.global_constant_initializers
global_constant_initializers
Definition: layer_model_helper.py:105

core.CreateOperator
def CreateOperator(operator_type, inputs, outputs, name='', control_input=None, device_option=None, arg=None, engine=None, kwargs)
Definition: core.py:259

layer_model_helper.LayerModelHelper.add_global_constant
def add_global_constant(self, name, array=None, dtype=None, initializer=None)
Definition: layer_model_helper.py:64

layer_model_helper.LayerModelHelper._trainer_extra_schema
_trainer_extra_schema
Definition: layer_model_helper.py:47

layer_model_helper.LayerModelHelper._metrics_schema
_metrics_schema
Definition: layer_model_helper.py:51

layer_model_helper.LayerModelHelper
Definition: layer_model_helper.py:16

layer_model_helper.LayerModelHelper._init_global_constants
def _init_global_constants(self)
Definition: layer_model_helper.py:103

schema.Struct
Definition: schema.py:246