onnxruntime/onnxruntime/core/optimizer/initializer.h

// Copyright (c) Microsoft Corporation. All rights reserved.
// Licensed under the MIT License.

#pragma once

#include <algorithm>
#include <vector>
#include <cmath>

#include "core/common/common.h"
#include "core/common/path.h"
#include "core/framework/tensorprotoutils.h"
#include "core/graph/onnx_protobuf.h"
#include "core/util/math.h"

namespace onnxruntime {

class Initializer final {
 public:
  // Construct an initializer with the provided name and data type, with all values initialized to 0
  Initializer(ONNX_NAMESPACE::TensorProto_DataType data_type,
              const std::string& name,
              const std::vector<int64_t>& dims) : dims_(dims), size_(0) {
    data_type_ = data_type;
    name_ = name;
    size_ = std::accumulate(dims_.begin(), dims_.end(), int64_t(1), std::multiplies<int64_t>{});

    switch (data_type_) {
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
        float16_data_.assign(static_cast<size_t>(size_), math::floatToHalf(0.f));
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
        float_data_.assign(static_cast<size_t>(size_), 0.0f);
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
        double_data_.assign(static_cast<size_t>(size_), 0.0);
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT32: {
        int32_data_.assign(static_cast<size_t>(size_), 0);
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT64: {
        int64_data_.assign(static_cast<size_t>(size_), 0);
        break;
      }
      default:
        ORT_THROW("data type ", data_type_, "is not supported.");
        break;
    }
  }

  Initializer(const ONNX_NAMESPACE::TensorProto& tensor_proto, const Path& model_path) {
    data_type_ = tensor_proto.data_type();
    if (utils::HasName(tensor_proto)) {
      name_ = tensor_proto.name();
    }
    dims_.reserve(tensor_proto.dims_size());
    for (int i = 0; i < tensor_proto.dims_size(); i++) {
      dims_.push_back(tensor_proto.dims(i));
    }

    size_ = std::accumulate(dims_.begin(), dims_.end(), static_cast<int64_t>(1), std::multiplies<int64_t>{});

    if (tensor_proto.data_location() != ONNX_NAMESPACE::TensorProto_DataLocation_EXTERNAL) {
      if (utils::HasRawData(tensor_proto)) {
        raw_data_.assign(tensor_proto.raw_data().begin(), tensor_proto.raw_data().end());
      } else {
        switch (data_type_) {
          case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
            int64_t size = tensor_proto.int32_data_size();
            ORT_ENFORCE(size_ == size, "size is different");
            for (int i = 0; i < size_; i++) {
              float16_data_.push_back(static_cast<uint16_t>(tensor_proto.int32_data(i)));
            }
            break;
          }
          case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
            int64_t size = tensor_proto.float_data_size();
            ORT_ENFORCE(size_ == size, "size is different");
            for (int i = 0; i < size_; i++) {
              float_data_.push_back(tensor_proto.float_data(i));
            }
            break;
          }
          case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
            int64_t size = tensor_proto.double_data_size();
            ORT_ENFORCE(size_ == size, "size is different");
            for (int i = 0; i < size_; i++) {
              double_data_.push_back(tensor_proto.double_data(i));
            }
            break;
          }
          case ONNX_NAMESPACE::TensorProto_DataType_INT32: {
            int64_t size = tensor_proto.int32_data_size();
            ORT_ENFORCE(size_ == size, "size is different");
            for (int i = 0; i < size_; i++) {
              int32_data_.push_back(tensor_proto.int32_data(i));
            }
            break;
          }
          case ONNX_NAMESPACE::TensorProto_DataType_INT64: {
            int64_t size = tensor_proto.int64_data_size();
            ORT_ENFORCE(size_ == size, "size is different");
            for (int i = 0; i < size_; i++) {
              int64_data_.push_back(tensor_proto.int64_data(i));
            }
            break;
          }
          default:
            ORT_NOT_IMPLEMENTED(__FUNCTION__, "unsupported data type: ", data_type_);
            break;
        }
      }
    } else {  // tensor_proto.data_location() == ONNX_NAMESPACE::TensorProto_DataLocation_EXTERNAL
      const auto status = ReadExternalRawData(tensor_proto, model_path, raw_data_);
      ORT_ENFORCE(status.IsOK(), "ReadExternalRawData() failed: ", status.ErrorMessage());
    }
  }

  ~Initializer() = default;

  void ToProto(ONNX_NAMESPACE::TensorProto& tensor_proto) {
    tensor_proto.clear_name();
    if (!name_.empty()) {
      tensor_proto.set_name(name_);
    }

    tensor_proto.clear_dims();
    for (auto d : dims_) {
      tensor_proto.add_dims(d);
    }

    tensor_proto.clear_data_type();
    tensor_proto.set_data_type(data_type_);

    if (!raw_data_.empty()) {
      tensor_proto.clear_raw_data();
      tensor_proto.set_raw_data(raw_data_.data(), raw_data_.size());
    } else {
      switch (data_type_) {
        case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
          tensor_proto.clear_int32_data();
          for (int i = 0; i < size_; i++) {
            tensor_proto.add_int32_data(float16_data_[i]);
          }
          break;
        }
        case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
          tensor_proto.clear_float_data();
          for (int i = 0; i < size_; i++) {
            tensor_proto.add_float_data(float_data_[i]);
          }
          break;
        }
        case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
          tensor_proto.clear_double_data();
          for (int i = 0; i < size_; i++) {
            tensor_proto.add_double_data(double_data_[i]);
          }
          break;
        }
        case ONNX_NAMESPACE::TensorProto_DataType_INT32: {
          tensor_proto.clear_int32_data();
          for (int i = 0; i < size_; i++) {
            tensor_proto.add_int32_data(int32_data_[i]);
          }
          break;
        }
        case ONNX_NAMESPACE::TensorProto_DataType_INT64: {
          tensor_proto.clear_int64_data();
          for (int i = 0; i < size_; i++) {
            tensor_proto.add_int64_data(int64_data_[i]);
          }
          break;
        }
        default:
          ORT_NOT_IMPLEMENTED(__FUNCTION__, "data type is not supported");
          break;
      }
    }
  }

  int data_type() const {
    return data_type_;
  }

  int& data_type() {
    return data_type_;
  }

  const std::string& name() {
    return name_;
  }

  template <typename T>
  T* data() {
    if (!raw_data_.empty()) {
      return reinterpret_cast<T*>(raw_data_.data());
    }
    switch (data_type_) {
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
        return reinterpret_cast<T*>(float16_data_.data());
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
        return reinterpret_cast<T*>(float_data_.data());
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
        return reinterpret_cast<T*>(double_data_.data());
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT32: {
        return reinterpret_cast<T*>(int32_data_.data());
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT64: {
        return reinterpret_cast<T*>(int64_data_.data());
        break;
      }
      default:
        break;
    }

    return nullptr;
  }

  template <typename T>
  const T* data() const {
    if (!raw_data_.empty()) {
      return reinterpret_cast<const T*>(raw_data_.data());
    }
    switch (data_type_) {
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
        return reinterpret_cast<const T*>(float16_data_.data());
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
        return reinterpret_cast<const T*>(float_data_.data());
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
        return reinterpret_cast<const T*>(double_data_.data());
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT32: {
        return reinterpret_cast<const T*>(int32_data_.data());
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT64: {
        return reinterpret_cast<const T*>(int64_data_.data());
        break;
      }
      default:
        break;
    }

    return nullptr;
  }

  const std::vector<int64_t>& dims() const {
    return dims_;
  }

  const std::vector<int64_t>& dims() {
    return dims_;
  }

  int64_t size() const { return size_; }

  Initializer& add(float value) {
    int64_t n = size();
    switch (data_type_) {
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
        uint16_t* dst = data<uint16_t>();
        for (int i = 0; i < n; i++) {
          dst[i] = math::floatToHalf(math::halfToFloat(dst[i]) + value);
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
        float* dst = data<float>();
        for (int i = 0; i < n; i++) {
          dst[i] += value;
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
        double* dst = data<double>();
        for (int i = 0; i < n; i++) {
          dst[i] += value;
        }
        break;
      }
      default:
        break;
    }
    return *this;
  }

  Initializer& add(const Initializer& other) {
    int64_t n = size();
    switch (data_type_) {
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
        uint16_t* dst = data<uint16_t>();
        const uint16_t* src = other.data<uint16_t>();
        for (int i = 0; i < n; i++) {
          dst[i] = math::floatToHalf(math::halfToFloat(dst[i]) + math::halfToFloat(src[i]));
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
        float* dst = data<float>();
        const float* src = other.data<float>();
        for (int i = 0; i < n; i++) {
          dst[i] += src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
        double* dst = data<double>();
        const double* src = other.data<double>();
        for (int i = 0; i < n; i++) {
          dst[i] += src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT32: {
        int32_t* dst = data<int32_t>();
        const int32_t* src = other.data<int32_t>();
        for (int i = 0; i < n; i++) {
          dst[i] += src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT64: {
        int64_t* dst = data<int64_t>();
        const int64_t* src = other.data<int64_t>();
        for (int i = 0; i < n; i++) {
          dst[i] += src[i];
        }
        break;
      }
      default:
        break;
    }
    return *this;
  }
  Initializer& sub(const Initializer& other) {
    int64_t n = size();
    switch (data_type_) {
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
        uint16_t* dst = data<uint16_t>();
        const uint16_t* src = other.data<uint16_t>();
        for (int i = 0; i < n; i++) {
          dst[i] = math::floatToHalf(math::halfToFloat(dst[i]) - math::halfToFloat(src[i]));
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
        float* dst = data<float>();
        const float* src = other.data<float>();
        for (int i = 0; i < n; i++) {
          dst[i] -= src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
        double* dst = data<double>();
        const double* src = other.data<double>();
        for (int i = 0; i < n; i++) {
          dst[i] -= src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT32: {
        int32_t* dst = data<int32_t>();
        const int32_t* src = other.data<int32_t>();
        for (int i = 0; i < n; i++) {
          dst[i] -= src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT64: {
        int64_t* dst = data<int64_t>();
        const int64_t* src = other.data<int64_t>();
        for (int i = 0; i < n; i++) {
          dst[i] -= src[i];
        }
        break;
      }
      default:
        break;
    }
    return *this;
  }

  Initializer& mul(const Initializer& other) {
    int64_t n = size();
    switch (data_type_) {
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
        uint16_t* dst = data<uint16_t>();
        const uint16_t* src = other.data<uint16_t>();
        for (int i = 0; i < n; i++) {
          dst[i] = math::floatToHalf(math::halfToFloat(dst[i]) * math::halfToFloat(src[i]));
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
        float* dst = data<float>();
        const float* src = other.data<float>();
        for (int i = 0; i < n; i++) {
          dst[i] *= src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
        double* dst = data<double>();
        const double* src = other.data<double>();
        for (int i = 0; i < n; i++) {
          dst[i] *= src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT32: {
        int32_t* dst = data<int32_t>();
        const int32_t* src = other.data<int32_t>();
        for (int i = 0; i < n; i++) {
          dst[i] *= src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT64: {
        int64_t* dst = data<int64_t>();
        const int64_t* src = other.data<int64_t>();
        for (int i = 0; i < n; i++) {
          dst[i] *= src[i];
        }
        break;
      }
      default:
        break;
    }
    return *this;
  }
  Initializer& div(const Initializer& other) {
    int64_t n = size();
    switch (data_type_) {
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
        uint16_t* dst = data<uint16_t>();
        const uint16_t* src = other.data<uint16_t>();
        for (int i = 0; i < n; i++) {
          dst[i] = math::floatToHalf(math::halfToFloat(dst[i]) / math::halfToFloat(src[i]));
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
        float* dst = data<float>();
        const float* src = other.data<float>();
        for (int i = 0; i < n; i++) {
          dst[i] /= src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
        double* dst = data<double>();
        const double* src = other.data<double>();
        for (int i = 0; i < n; i++) {
          dst[i] /= src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT32: {
        int32_t* dst = data<int32_t>();
        const int32_t* src = other.data<int32_t>();
        for (int i = 0; i < n; i++) {
          dst[i] /= src[i];
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT64: {
        int64_t* dst = data<int64_t>();
        const int64_t* src = other.data<int64_t>();
        for (int i = 0; i < n; i++) {
          dst[i] /= src[i];
        }
        break;
      }
      default:
        break;
    }
    return *this;
  }

  Initializer& sqrt() {
    int64_t n = size();
    switch (data_type_) {
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
        uint16_t* dst = data<uint16_t>();
        for (int i = 0; i < n; i++) {
          dst[i] = math::floatToHalf(std::sqrt(math::halfToFloat(dst[i])));
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
        float* dst = data<float>();
        for (int i = 0; i < n; i++) {
          dst[i] = std::sqrt(dst[i]);
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
        double* dst = data<double>();
        for (int i = 0; i < n; i++) {
          dst[i] = std::sqrt(dst[i]);
        }
        break;
      }
      default:
        break;
    }
    return *this;
  }

  inline void scale_by_axis(const Initializer& other, int axis) {
    int64_t num = 1;
    for (size_t k = axis; k < dims_.size(); k++) {
      num *= dims_[k];
    }

    int64_t n = size() / num;
    switch (data_type_) {
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT16: {
        uint16_t* dst = data<uint16_t>();
        const uint16_t* src = other.data<uint16_t>();
        for (int i = 0; i < n; i++) {
          int index = other.size() == 1 ? 0 : i;
          for (int64_t j = 0; j < num; j++) {
            auto k = i * num + j;
            dst[k] = math::floatToHalf(math::halfToFloat(dst[k]) * math::halfToFloat(src[index]));
          }
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: {
        float* dst = data<float>();
        const float* src = other.data<float>();
        for (int i = 0; i < n; i++) {
          int index = other.size() == 1 ? 0 : i;
          for (int64_t j = 0; j < num; j++) {
            dst[i * num + j] *= src[index];
          }
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: {
        double* dst = data<double>();
        const double* src = other.data<double>();
        for (int i = 0; i < n; i++) {
          int index = other.size() == 1 ? 0 : i;
          for (int64_t j = 0; j < num; j++) {
            dst[i * num + j] *= src[index];
          }
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT32: {
        int32_t* dst = data<int32_t>();
        const int32_t* src = other.data<int32_t>();
        for (int i = 0; i < n; i++) {
          int index = other.size() == 1 ? 0 : i;
          for (int64_t j = 0; j < num; j++) {
            dst[i * num + j] *= src[index];
          }
        }
        break;
      }
      case ONNX_NAMESPACE::TensorProto_DataType_INT64: {
        int64_t* dst = data<int64_t>();
        const int64_t* src = other.data<int64_t>();
        for (int i = 0; i < n; i++) {
          int index = other.size() == 1 ? 0 : i;
          for (int64_t j = 0; j < num; j++) {
            dst[i * num + j] *= src[index];
          }
        }
        break;
      }
      default:
        break;
    }
  }

 private:
  static Status ReadExternalRawData(
      const ONNX_NAMESPACE::TensorProto& tensor_proto, const Path& model_path, std::vector<char>& raw_data);

  int data_type_;
  std::string name_;
  std::vector<int64_t> dims_;
  int64_t size_;

  std::vector<char> raw_data_;
  std::vector<float> float_data_;
  std::vector<uint16_t> float16_data_;
  std::vector<double> double_data_;
  std::vector<int32_t> int32_data_;
  std::vector<int64_t> int64_data_;
};

}  // namespace onnxruntime