From d10d66cc84be67c2d7b4b2bd323e768560c4a390 Mon Sep 17 00:00:00 2001
From: Jian Chen <cjian@microsoft.com>
Date: Tue, 8 Nov 2022 23:58:05 -0500
Subject: [PATCH] Cjian/c4244 round 1a (#13483)

### Description
Redo the round using gsl:narrow and SafeInt



### Motivation and Context
<!-- - Why is this change required? What problem does it solve?
- If it fixes an open issue, please link to the issue here. -->
---
 onnxruntime/contrib_ops/cpu/activations.h     |   4 +-
 onnxruntime/contrib_ops/cpu/bert/attention.cc |  18 +-
 onnxruntime/contrib_ops/cpu/bert/bias_gelu.cc |   8 +-
 onnxruntime/contrib_ops/cpu/cdist.cc          |  23 +-
 .../core/providers/cpu/tensor/upsample.cc     | 251 +++++++++---------
 5 files changed, 153 insertions(+), 151 deletions(-)
diff --git a/onnxruntime/contrib_ops/cpu/activations.h b/onnxruntime/contrib_ops/cpu/activations.h
index 4a4f76c2ef..810ea5066a 100644
--- a/onnxruntime/contrib_ops/cpu/activations.h
+++ b/onnxruntime/contrib_ops/cpu/activations.h
@@ -10,7 +10,7 @@
 #include "core/platform/threadpool.h"
 #include <unsupported/Eigen/SpecialFunctions>
 #include "core/providers/cpu/element_wise_ranged_transform.h"
-
+using onnxruntime::narrow;
 namespace onnxruntime {
 namespace functors {
 
@@ -82,7 +82,7 @@ class Gelu : public OpKernel {
             p_output[i] = value * static_cast<T>(M_SQRT1_2);
           }
 
-          MlasComputeErf(p_output, p_output, gsl::narrow_cast<size_t>(count));
+          MlasComputeErf(p_output, p_output, narrow<size_t>(count));
 
           for (int64_t i = 0; i < count; i++) {
             p_output[i] = 0.5f * p_input[i] * (p_output[i] + 1.0f);
diff --git a/onnxruntime/contrib_ops/cpu/bert/attention.cc b/onnxruntime/contrib_ops/cpu/bert/attention.cc
index 85dec5b4c7..d60d7f64ee 100644
--- a/onnxruntime/contrib_ops/cpu/bert/attention.cc
+++ b/onnxruntime/contrib_ops/cpu/bert/attention.cc
@@ -11,7 +11,7 @@
 #include "core/platform/threadpool.h"
 
 using onnxruntime::concurrency::ThreadPool;
-
+using onnxruntime::narrow;
 namespace onnxruntime {
 namespace contrib {
 
@@ -75,7 +75,7 @@ bool Attention<T>::IsPackWeightsSuccessful(int qkv_index,
     return false;
   }
 
-  size_t loop_len = gsl::narrow_cast<size_t>(num_heads_);
+  size_t loop_len = narrow<size_t>(num_heads_);
   size_t packed_weights_data_size = packb_size * loop_len;  // The same size would be computed by AllocArray() below
   auto* packed_weights_data = static_cast<uint8_t*>(alloc->AllocArray(packb_size, loop_len));
 
@@ -124,13 +124,13 @@ Status Attention<T>::PrePack(const Tensor& weights, int input_idx, AllocatorPtr
   }
 
   const auto* weights_data = weights.Data<T>();
-  const size_t input_hidden_size = gsl::narrow_cast<size_t>(weights_dims[0]);
+  const size_t input_hidden_size = narrow<size_t>(weights_dims[0]);
   size_t q_hidden_size, k_hidden_size, v_hidden_size;
 
   if (qkv_hidden_sizes_.size() != 0) {
-    q_hidden_size = gsl::narrow_cast<size_t>(qkv_hidden_sizes_[0]);
-    k_hidden_size = gsl::narrow_cast<size_t>(qkv_hidden_sizes_[1]);
-    v_hidden_size = gsl::narrow_cast<size_t>(qkv_hidden_sizes_[2]);
+    q_hidden_size = narrow<size_t>(qkv_hidden_sizes_[0]);
+    k_hidden_size = narrow<size_t>(qkv_hidden_sizes_[1]);
+    v_hidden_size = narrow<size_t>(qkv_hidden_sizes_[2]);
 
     if (q_hidden_size == 0 || k_hidden_size == 0 || v_hidden_size == 0) {
       return Status::OK();
@@ -140,7 +140,7 @@ Status Attention<T>::PrePack(const Tensor& weights, int input_idx, AllocatorPtr
       return Status::OK();
     }
   } else {
-    const size_t hidden_size_x3 = gsl::narrow_cast<size_t>(weights_dims[1]);
+    const size_t hidden_size_x3 = narrow<size_t>(weights_dims[1]);
     const size_t hidden_size = hidden_size_x3 / 3;
 
     if (hidden_size % num_heads_ != 0) {
@@ -240,8 +240,8 @@ Status Attention<T>::Compute(OpKernelContext* context) const {
   BufferUniquePtr gemm_buffer(gemm_data, BufferDeleter(std::move(allocator)));
 
   auto Q = reinterpret_cast<T*>(gemm_data);
-  auto K = Q + gsl::narrow_cast<size_t>(batch_size) * sequence_length * parameters.hidden_size;
-  auto V = K + gsl::narrow_cast<size_t>(batch_size) * sequence_length * parameters.hidden_size;
+  auto K = Q + narrow<size_t>(batch_size) * sequence_length * parameters.hidden_size;
+  auto V = K + narrow<size_t>(batch_size) * sequence_length * parameters.hidden_size;
 
   T* QKV[3] = {Q, K, V};
   const int qkv_head_size[3] = {parameters.head_size, parameters.head_size, parameters.v_head_size};
diff --git a/onnxruntime/contrib_ops/cpu/bert/bias_gelu.cc b/onnxruntime/contrib_ops/cpu/bert/bias_gelu.cc
index b6050534c8..006298e648 100644
--- a/onnxruntime/contrib_ops/cpu/bert/bias_gelu.cc
+++ b/onnxruntime/contrib_ops/cpu/bert/bias_gelu.cc
@@ -11,7 +11,7 @@
 #include "core/providers/common.h"
 #include "core/util/math_cpuonly.h"
 #include "core/mlas/inc/mlas.h"
-
+using onnxruntime::narrow;
 namespace onnxruntime {
 namespace contrib {
 
@@ -60,7 +60,7 @@ Status BiasGelu<T, use_approximation>::Compute(OpKernelContext* context) const {
               p_output[i] = value * (static_cast<T>(C) * value * value + static_cast<T>(B));
             }
 
-            MlasComputeTanh(p_output, p_output,gsl::narrow_cast<size_t>(count));
+            MlasComputeTanh(p_output, p_output,narrow<size_t>(count));
 
             for (int64_t i = 0; i < count; i++) {
               p_output[i] = 0.5f * p_input[i] * (p_output[i] + 1.0f);
@@ -106,7 +106,7 @@ void BiasGelu<T, use_approximation>::AddBiasGelu(
       temp[i] = value * 0.5f;
     }
 
-    MlasComputeTanh(output, output,gsl::narrow_cast<size_t>(count));
+    MlasComputeTanh(output, output,narrow<size_t>(count));
 
     for (int64_t i = 0; i < count; i++) {
       output[i] = temp[i] * (output[i] + 1.0f);
@@ -118,7 +118,7 @@ void BiasGelu<T, use_approximation>::AddBiasGelu(
       temp[i] = value * 0.5f;
     }
 
-    MlasComputeErf(output, output,gsl::narrow_cast<size_t>(count));
+    MlasComputeErf(output, output,narrow<size_t>(count));
 
     for (int64_t i = 0; i < count; i++) {
       output[i] = temp[i] * (output[i] + 1.0f);
diff --git a/onnxruntime/contrib_ops/cpu/cdist.cc b/onnxruntime/contrib_ops/cpu/cdist.cc
index 5365537b0d..d0ed81a9a6 100644
--- a/onnxruntime/contrib_ops/cpu/cdist.cc
+++ b/onnxruntime/contrib_ops/cpu/cdist.cc
@@ -3,11 +3,12 @@
 
 #include "cdist.h"
 #include "core/common/common.h"
+#include "core/common/safeint.h"
 #include "core/framework/op_kernel.h"
 #include "core/util/math.h"
 #include "core/util/math_cpuonly.h"
 #include "core/mlas/inc/mlas.h"
-
+using onnxruntime::narrow;
 namespace onnxruntime {
 namespace contrib {
 #define DEFINE_KERNEL(data_type)                                                                                  \
@@ -35,19 +36,19 @@ static void CalculateSqeuclidean(const Tensor& a, const Tensor& b, Tensor& c, co
 
   // ReduceSumSquare for A
   std::vector<T> a_ss;
-  a_ss.resize(gsl::narrow_cast<size_t>(m));
+  a_ss.resize(narrow<size_t>(m));
   const auto* cur_a = a_data;
   for (int64_t i = 0; i < m; ++i) {
-    a_ss[gsl::narrow_cast<size_t>(i)] = ConstEigenVectorMap<T>(cur_a, gsl::narrow_cast<size_t>(k)).squaredNorm();
+    a_ss[narrow<size_t>(i)] = ConstEigenVectorMap<T>(cur_a, narrow<size_t>(k)).squaredNorm();
     cur_a += k;
   }
 
   // ReduceSumSquare for B
   std::vector<T> b_ss;
-  b_ss.resize(gsl::narrow_cast<size_t>(n));
+  b_ss.resize(narrow<size_t>(n));
   const auto* cur_b = b_data;
   for (int64_t i = 0; i < n; ++i) {
-    b_ss[gsl::narrow_cast<size_t>(i)] = ConstEigenVectorMap<T>(cur_b, gsl::narrow_cast<size_t>(k)).squaredNorm();
+    b_ss[narrow<size_t>(i)] = ConstEigenVectorMap<T>(cur_b, narrow<size_t>(k)).squaredNorm();
     cur_b += k;
   }
 
@@ -71,19 +72,19 @@ static void CalculateSqeuclidean(const Tensor& a, const Tensor& b, Tensor& c, co
   ORT_UNUSED_PARAMETER(threadpool);
 
   // https://eigen.tuxfamily.org/dox/TopicWritingEfficientProductExpression.html
-  auto out_map = EigenMatrixMapRowMajor<T>(c_data, gsl::narrow_cast<size_t>(m), gsl::narrow_cast<size_t>(n));
+  auto out_map = EigenMatrixMapRowMajor<T>(c_data, SafeInt<size_t>(m), SafeInt<size_t>(n));
   out_map.noalias() = static_cast<T>(-2.) *
-                      (ConstEigenMatrixMapRowMajor<T>(a_data, gsl::narrow_cast<size_t>(m), gsl::narrow_cast<size_t>(k)) *
-                       ConstEigenMatrixMapRowMajor<T>(b_data, gsl::narrow_cast<size_t>(n), gsl::narrow_cast<size_t>(k)).transpose());
+                      (ConstEigenMatrixMapRowMajor<T>(a_data, SafeInt<size_t>(m), SafeInt<size_t>(k)) *
+                       ConstEigenMatrixMapRowMajor<T>(b_data, SafeInt<size_t>(n), SafeInt<size_t>(k)).transpose());
 #endif
 
   // add a_ss and b_ss, with broadcast
   // output shape is {m, n}
   auto* cur_out = c_data;
   for (int64_t i = 0; i < m; ++i) {
-    T a_val = a_ss[gsl::narrow_cast<size_t>(i)];
+    T a_val = a_ss[narrow<size_t>(i)];
     for (int64_t j = 0; j < n; ++j) {
-      *cur_out = (*cur_out + a_val) + b_ss[gsl::narrow_cast<size_t>(j)];
+      *cur_out = (*cur_out + a_val) + b_ss[narrow<size_t>(j)];
       ++cur_out;
     }
   }
@@ -114,7 +115,7 @@ common::Status CDist<T>::Compute(OpKernelContext* context) const {
   T* output = C->MutableData<T>();
 
   CalculateSqeuclidean<T>(*A, *B, *C, tp);
-  auto map_out = EigenVectorArrayMap<T>(output, gsl::narrow_cast<size_t>(output_shape.Size()));
+  auto map_out = EigenVectorArrayMap<T>(output, narrow<size_t>(output_shape.Size()));
 
   // because we use GEMM in CalculateSqeuclidean there's a slight chance a number extremely close to zero
   // could be negative, so we need to run abs() to avoid NaN's in the results.
diff --git a/onnxruntime/core/providers/cpu/tensor/upsample.cc b/onnxruntime/core/providers/cpu/tensor/upsample.cc
index 9173efe04f..1d4cf65c60 100644
--- a/onnxruntime/core/providers/cpu/tensor/upsample.cc
+++ b/onnxruntime/core/providers/cpu/tensor/upsample.cc
@@ -7,6 +7,7 @@
 
 using namespace onnxruntime::common;
 using namespace std;
+using onnxruntime::narrow;
 namespace onnxruntime {
 
 #define REGISTER_VERSIONED_TYPED_KERNEL(T, start, end)                          \
@@ -82,7 +83,7 @@ static std::vector<int64_t> UpsampleNearestSetupRank1InputMapping(
       if (input_dim0_idx < 0) input_dim0_idx = 0;
     }
 
-    input_mapping[gsl::narrow_cast<size_t>(output_dim0_idx)]= input_dim0_idx;
+    input_mapping[narrow<size_t>(output_dim0_idx)]= input_dim0_idx;
   }
 
   return input_mapping;
@@ -98,37 +99,37 @@ UpsampleNearestSetupInputMappings(int64_t n_dim,
                                   bool extrapolation_enabled,
                                   const GetOriginalCoordinateFunc& get_original_coordinate,
                                   const GetNearestPixelFunc& get_nearest_pixel) {
-  std::vector<std::vector<int64_t>> input_mappings(gsl::narrow_cast<size_t>(n_dim));
+  std::vector<std::vector<int64_t>> input_mappings(narrow<size_t>(n_dim));
 
   for (int64_t axis = 0; axis < n_dim; ++axis) {
-    std::vector<int64_t>& input_mapping = input_mappings[gsl::narrow_cast<size_t>(axis)];
-    input_mapping.resize(gsl::narrow_cast<size_t>(output_shape[gsl::narrow_cast<size_t>(axis)]));
+    std::vector<int64_t>& input_mapping = input_mappings[narrow<size_t>(axis)];
+    input_mapping.resize(narrow<size_t>(output_shape[narrow<size_t>(axis)]));
 
     // When scale is 1.0, there is a one-to-one mapping between the dimension
     // in the input and the output and there is no need to apply the co-ordinate
     // transformation which should only be done when there is "resizing" required
-    if (scales[gsl::narrow_cast<size_t>(axis)] == 1.0f) {
-      for (int64_t dim = 0; dim < output_shape[gsl::narrow_cast<size_t>(axis)]; dim++) {
-        input_mapping[gsl::narrow_cast<size_t>(dim)] = dim * input_dim_factor[gsl::narrow_cast<size_t>(axis)];
+    if (scales[narrow<size_t>(axis)] == 1.0f) {
+      for (int64_t dim = 0; dim < output_shape[narrow<size_t>(axis)]; dim++) {
+        input_mapping[narrow<size_t>(dim)] = dim * input_dim_factor[narrow<size_t>(axis)];
       }
       continue;
     }
 
     // scale != 1.0
     const int64_t input_size = input_dim_factor[0] * input_shape[0];
-    for (int64_t dim = 0; dim < output_shape[gsl::narrow_cast<size_t>(axis)]; dim++) {
+    for (int64_t dim = 0; dim < output_shape[narrow<size_t>(axis)]; dim++) {
       float original_dim = get_original_coordinate(static_cast<float>(dim),
-                                                   scales[gsl::narrow_cast<size_t>(axis)],
-                                                   static_cast<float>(output_shape[gsl::narrow_cast<size_t>(axis)]),
-                                                   static_cast<float>(input_shape[gsl::narrow_cast<size_t>(axis)]),
-                                                   roi[gsl::narrow_cast<size_t>(axis)], roi[gsl::narrow_cast<size_t>(n_dim + axis)]);
+                                                   scales[narrow<size_t>(axis)],
+                                                   static_cast<float>(output_shape[narrow<size_t>(axis)]),
+                                                   static_cast<float>(input_shape[narrow<size_t>(axis)]),
+                                                   roi[narrow<size_t>(axis)], roi[SafeInt<size_t>(n_dim) + axis]);
 
-      bool need_extrapolation = (extrapolation_enabled && (original_dim < 0 || original_dim > input_shape[gsl::narrow_cast<size_t>(axis)] - 1));
-      int64_t input_dim = get_nearest_pixel(original_dim, scales[gsl::narrow_cast<size_t>(axis)] < 1);
-      if (input_dim >= input_shape[gsl::narrow_cast<size_t>(axis)]) input_dim = input_shape[gsl::narrow_cast<size_t>(axis)] - 1;
+      bool need_extrapolation = (extrapolation_enabled && (original_dim < 0 || original_dim > input_shape[narrow<size_t>(axis)] - 1));
+      int64_t input_dim = get_nearest_pixel(original_dim, scales[narrow<size_t>(axis)] < 1);
+      if (input_dim >= input_shape[narrow<size_t>(axis)]) input_dim = input_shape[narrow<size_t>(axis)] - 1;
       if (input_dim < 0) input_dim = 0;
 
-      input_mapping[gsl::narrow_cast<size_t>(dim)] = need_extrapolation ? (-input_size) : (input_dim * input_dim_factor[gsl::narrow_cast<size_t>(axis)]);
+      input_mapping[narrow<size_t>(dim)] = need_extrapolation ? (-input_size) : (input_dim * input_dim_factor[narrow<size_t>(axis)]);
     }
   }
 
@@ -148,11 +149,11 @@ static Status UpsampleNearestImpl(const T* input,
                                   const GetNearestPixelFunc& get_nearest_pixel) {
   int64_t n_dim = static_cast<int64_t>(input_shape.NumDimensions());
 
-  std::vector<int64_t> input_dim_counters(gsl::narrow_cast<size_t>(n_dim));
-  std::vector<int64_t> input_dim_factor(gsl::narrow_cast<size_t>(n_dim));
-  input_dim_factor[gsl::narrow_cast<size_t>(n_dim - 1)] = 1;  // initialize dimension factor
+  std::vector<int64_t> input_dim_counters(narrow<size_t>(n_dim));
+  std::vector<int64_t> input_dim_factor(narrow<size_t>(n_dim));
+  input_dim_factor[SafeInt<size_t>(n_dim) - 1] = 1;  // initialize dimension factor
   for (int64_t dim_idx = n_dim - 2; dim_idx >= 0; dim_idx--) {
-    input_dim_factor[gsl::narrow_cast<size_t>(dim_idx)] = input_dim_factor[gsl::narrow_cast<size_t>(dim_idx + 1)] * input_shape[gsl::narrow_cast<size_t>(dim_idx + 1)];
+    input_dim_factor[narrow<size_t>(dim_idx)] = input_dim_factor[SafeInt<size_t>(dim_idx) + 1] * input_shape[SafeInt<size_t>(dim_idx) + 1];
   }
 
   int64_t output_idx = 0;
@@ -162,14 +163,14 @@ static Status UpsampleNearestImpl(const T* input,
     std::vector<int64_t> input_mapping = UpsampleNearestSetupRank1InputMapping(input_shape[0],
                                                                                output_shape[0],
                                                                                scales[0],
-                                                                               roi[0], roi[gsl::narrow_cast<size_t>(n_dim + 0)],
+                                                                               roi[0], roi[narrow<size_t>(n_dim + 0)],
                                                                                extrapolation_enabled,
                                                                                get_original_coordinate,
                                                                                get_nearest_pixel);
 
     for (int64_t output_dim0_idx = 0; output_dim0_idx < output_shape[0]; output_dim0_idx++) {
-      int64_t input_dim0_idx = input_mapping[gsl::narrow_cast<size_t>(output_dim0_idx)];
-      output[gsl::narrow_cast<size_t>(output_dim0_idx)]= input_dim0_idx < 0 ? extrapolation_value : input[input_dim0_idx];
+      int64_t input_dim0_idx = input_mapping[narrow<size_t>(output_dim0_idx)];
+      output[narrow<size_t>(output_dim0_idx)]= input_dim0_idx < 0 ? extrapolation_value : input[input_dim0_idx];
     }
 
     return Status::OK();
@@ -184,9 +185,9 @@ static Status UpsampleNearestImpl(const T* input,
     const std::vector<int64_t>& input_mapping_1 = input_mappings[1];
 
     for (int64_t output_dim0_inx = 0; output_dim0_inx < output_shape[0]; output_dim0_inx++) {
-      int64_t input_idx_0 = input_mapping_0[gsl::narrow_cast<size_t>(output_dim0_inx)];
+      int64_t input_idx_0 = input_mapping_0[narrow<size_t>(output_dim0_inx)];
       for (int64_t output_dim1_inx = 0; output_dim1_inx < output_shape[1]; output_dim1_inx++) {
-        int64_t input_idx_1 = input_idx_0 + input_mapping_1[gsl::narrow_cast<size_t>(output_dim1_inx)];
+        int64_t input_idx_1 = input_idx_0 + input_mapping_1[narrow<size_t>(output_dim1_inx)];
         output[output_idx++] = (input_idx_1 < 0) ? extrapolation_value : input[input_idx_1];
       }
     }
@@ -199,11 +200,11 @@ static Status UpsampleNearestImpl(const T* input,
     const std::vector<int64_t>& input_mapping_2 = input_mappings[2];
 
     for (int64_t output_dim0_inx = 0; output_dim0_inx < output_shape[0]; output_dim0_inx++) {
-      int64_t input_idx_0 = input_mapping_0[gsl::narrow_cast<size_t>(output_dim0_inx)];
+      int64_t input_idx_0 = input_mapping_0[narrow<size_t>(output_dim0_inx)];
       for (int64_t output_dim1_inx = 0; output_dim1_inx < output_shape[1]; output_dim1_inx++) {
-        int64_t input_idx_1 = input_idx_0 + input_mapping_1[gsl::narrow_cast<size_t>(output_dim1_inx)];
+        int64_t input_idx_1 = input_idx_0 + input_mapping_1[narrow<size_t>(output_dim1_inx)];
         for (int64_t output_dim2_inx = 0; output_dim2_inx < output_shape[2]; output_dim2_inx++) {
-          int64_t input_idx_2 = input_idx_1 + input_mapping_2[gsl::narrow_cast<size_t>(output_dim2_inx)];
+          int64_t input_idx_2 = input_idx_1 + input_mapping_2[narrow<size_t>(output_dim2_inx)];
           output[output_idx++] = (input_idx_2 < 0) ? extrapolation_value : input[input_idx_2];
         }
       }
@@ -218,14 +219,14 @@ static Status UpsampleNearestImpl(const T* input,
     const std::vector<int64_t>& input_mapping_3 = input_mappings[3];
 
     for (int64_t output_dim0_inx = 0; output_dim0_inx < output_shape[0]; output_dim0_inx++) {
-      int64_t input_idx_0 = input_mapping_0[gsl::narrow_cast<size_t>(output_dim0_inx)];
+      int64_t input_idx_0 = input_mapping_0[narrow<size_t>(output_dim0_inx)];
       for (int64_t output_dim1_inx = 0; output_dim1_inx < output_shape[1]; output_dim1_inx++) {
-        int64_t input_idx_1 = input_idx_0 + input_mapping_1[gsl::narrow_cast<size_t>(output_dim1_inx)];
+        int64_t input_idx_1 = input_idx_0 + input_mapping_1[narrow<size_t>(output_dim1_inx)];
         for (int64_t output_dim2_inx = 0; output_dim2_inx < output_shape[2]; output_dim2_inx++) {
-          int64_t input_idx_2 = input_idx_1 + input_mapping_2[gsl::narrow_cast<size_t>(output_dim2_inx)];
+          int64_t input_idx_2 = input_idx_1 + input_mapping_2[narrow<size_t>(output_dim2_inx)];
           for (int64_t output_dim3_inx = 0; output_dim3_inx < output_shape[3]; output_dim3_inx++) {
-            int64_t input_idx_3 = input_idx_2 + input_mapping_3[gsl::narrow_cast<size_t>(output_dim3_inx)];
-            output[output_idx++] = (input_idx_3 < 0) ? static_cast<T>(extrapolation_value) : input[gsl::narrow_cast<size_t>(input_idx_3)];
+            int64_t input_idx_3 = input_idx_2 + input_mapping_3[narrow<size_t>(output_dim3_inx)];
+            output[output_idx++] = (input_idx_3 < 0) ? static_cast<T>(extrapolation_value) : input[narrow<size_t>(input_idx_3)];
           }
         }
       }
@@ -235,20 +236,20 @@ static Status UpsampleNearestImpl(const T* input,
 
   std::vector<int64_t> output_dim_counter(n_dim);
   for (int64_t dim_idx = 0; dim_idx < n_dim; dim_idx++) {
-    input_idx += input_mappings[gsl::narrow_cast<size_t>(dim_idx)][0 /* output_dim_counter[gsl::narrow_cast<size_t>(dim_idx)] */];
+    input_idx += input_mappings[narrow<size_t>(dim_idx)][0 /* output_dim_counter[narrow<size_t>(dim_idx)] */];
   }
 
   for (int64_t output_size = output_shape.Size(); output_idx < output_size; output_idx++) {
-    output[gsl::narrow_cast<size_t>(output_idx)] = (input_idx < 0) ? extrapolation_value : input[gsl::narrow_cast<size_t>(input_idx)];
+    output[narrow<size_t>(output_idx)] = (input_idx < 0) ? extrapolation_value : input[narrow<size_t>(input_idx)];
 
     for (int64_t dim_idx = n_dim - 1; dim_idx >= 0; dim_idx--) {
-      input_idx -= input_mappings[gsl::narrow_cast<size_t>(dim_idx)][gsl::narrow_cast<size_t>(output_dim_counter[gsl::narrow_cast<size_t>(dim_idx)])];
-      if (++output_dim_counter[gsl::narrow_cast<size_t>(dim_idx)] < output_shape[gsl::narrow_cast<size_t>(dim_idx)]) {
-        input_idx += input_mappings[gsl::narrow_cast<size_t>(dim_idx)][gsl::narrow_cast<size_t>(output_dim_counter[gsl::narrow_cast<size_t>(dim_idx)])];
+      input_idx -= input_mappings[narrow<size_t>(dim_idx)][narrow<size_t>(output_dim_counter[narrow<size_t>(dim_idx)])];
+      if (++output_dim_counter[narrow<size_t>(dim_idx)] < output_shape[narrow<size_t>(dim_idx)]) {
+        input_idx += input_mappings[narrow<size_t>(dim_idx)][narrow<size_t>(output_dim_counter[narrow<size_t>(dim_idx)])];
         break;
       }
-      output_dim_counter[gsl::narrow_cast<size_t>(dim_idx)] = 0;
-      input_idx += input_mappings[gsl::narrow_cast<size_t>(dim_idx)][0 /* output_dim_counter[gsl::narrow_cast<size_t>(dim_idx)] */];
+      output_dim_counter[narrow<size_t>(dim_idx)] = 0;
+      input_idx += input_mappings[narrow<size_t>(dim_idx)][0 /* output_dim_counter[narrow<size_t>(dim_idx)] */];
     }
   }
 
@@ -349,7 +350,7 @@ static Status UpsampleLinearImpl(const std::function<void(size_t, size_t, float)
       cur_idx /= output_shape[j];
     }
 
-    // output[gsl::narrow_cast<size_t>(i)] = 0;
+    // output[narrow<size_t>(i)] = 0;
 
     int64_t step = (1LL << n_dim) - 1;
     while (step >= 0) {
@@ -365,7 +366,7 @@ static Status UpsampleLinearImpl(const std::function<void(size_t, size_t, float)
         cur >>= 1;
       }
 
-      // output[gsl::narrow_cast<size_t>(i)] += input[old_idx] * w;
+      // output[narrow<size_t>(i)] += input[old_idx] * w;
       apply(old_idx, i, w);
 
       step--;
@@ -390,7 +391,7 @@ static Status UpsampleLinear(const T* input,
   std::fill_n(output, output_shape.Size(), T{});
 
   auto apply = [&input, &output](size_t input_idx, size_t output_idx, float w) {
-    output[gsl::narrow_cast<size_t>(output_idx)] += input[gsl::narrow_cast<size_t>(input_idx)] * w;
+    output[narrow<size_t>(output_idx)] += input[narrow<size_t>(input_idx)] * w;
   };
 
   return UpsampleLinearImpl(apply, input_shape, output_shape, scales, is_resize, roi, get_original_coordinate);
@@ -471,16 +472,16 @@ BilinearParams SetupUpsampleBilinear(const int32_t input_height,
 
     const int32_t in_y1 = std::min(static_cast<int32_t>(in_y), input_height - 1);
     const int32_t in_y2 = std::min(in_y1 + 1, input_height - 1);
-    p.dy1[gsl::narrow_cast<size_t>(y)] = std::fabs(in_y - in_y1);
-    p.dy2[gsl::narrow_cast<size_t>(y)] = std::fabs(in_y - in_y2);
+    p.dy1[narrow<size_t>(y)] = std::fabs(in_y - in_y1);
+    p.dy2[narrow<size_t>(y)] = std::fabs(in_y - in_y2);
 
     if (in_y1 == in_y2) {
-      p.dy1[gsl::narrow_cast<size_t>(y)] = 0.5f;
-      p.dy2[gsl::narrow_cast<size_t>(y)] = 0.5f;
+      p.dy1[narrow<size_t>(y)] = 0.5f;
+      p.dy2[narrow<size_t>(y)] = 0.5f;
     }
 
-    p.input_width_mul_y1[gsl::narrow_cast<size_t>(y)] = input_width * in_y1;
-    p.input_width_mul_y2[gsl::narrow_cast<size_t>(y)] = input_width * in_y2;
+    p.input_width_mul_y1[narrow<size_t>(y)] = input_width * in_y1;
+    p.input_width_mul_y2[narrow<size_t>(y)] = input_width * in_y2;
   }
 
   const size_t width_rindex = is_nchw ? 0 : 1;
@@ -496,14 +497,14 @@ BilinearParams SetupUpsampleBilinear(const int32_t input_height,
     p.x_original.emplace_back(in_x);
     in_x = std::max(0.0f, std::min(in_x, static_cast<float>(input_width - 1)));
 
-    p.in_x1[gsl::narrow_cast<size_t>(x)] = std::min(static_cast<int32_t>(in_x), input_width - 1);
-    p.in_x2[gsl::narrow_cast<size_t>(x)] = std::min(p.in_x1[gsl::narrow_cast<size_t>(x)] + 1, input_width - 1);
+    p.in_x1[narrow<size_t>(x)] = std::min(static_cast<int32_t>(in_x), input_width - 1);
+    p.in_x2[narrow<size_t>(x)] = std::min(p.in_x1[narrow<size_t>(x)] + 1, input_width - 1);
 
-    p.dx1[gsl::narrow_cast<size_t>(x)] = std::fabs(in_x - p.in_x1[gsl::narrow_cast<size_t>(x)]);
-    p.dx2[gsl::narrow_cast<size_t>(x)] = std::fabs(in_x - p.in_x2[gsl::narrow_cast<size_t>(x)]);
-    if (p.in_x1[gsl::narrow_cast<size_t>(x)] == p.in_x2[gsl::narrow_cast<size_t>(x)]) {
-      p.dx1[gsl::narrow_cast<size_t>(x)] = 0.5f;
-      p.dx2[gsl::narrow_cast<size_t>(x)] = 0.5f;
+    p.dx1[narrow<size_t>(x)] = std::fabs(in_x - p.in_x1[narrow<size_t>(x)]);
+    p.dx2[narrow<size_t>(x)] = std::fabs(in_x - p.in_x2[narrow<size_t>(x)]);
+    if (p.in_x1[narrow<size_t>(x)] == p.in_x2[narrow<size_t>(x)]) {
+      p.dx1[narrow<size_t>(x)] = 0.5f;
+      p.dx2[narrow<size_t>(x)] = 0.5f;
     }
   }
 
@@ -578,16 +579,16 @@ BilinearParamsInteger SetupUpsampleBilinearInteger(const int32_t input_height,
 
     const int32_t in_y1 = std::min(static_cast<int32_t>(in_y), input_height - 1);
     const int32_t in_y2 = std::min(in_y1 + 1, input_height - 1);
-    p.dy1_scale_10[gsl::narrow_cast<size_t>(y)] = std::abs(in_y_scale_10 - in_y1 * (1 << 10));
-    p.dy2_scale_10[gsl::narrow_cast<size_t>(y)] = std::abs(in_y_scale_10 - in_y2 * (1 << 10));
+    p.dy1_scale_10[narrow<size_t>(y)] = std::abs(in_y_scale_10 - in_y1 * (1 << 10));
+    p.dy2_scale_10[narrow<size_t>(y)] = std::abs(in_y_scale_10 - in_y2 * (1 << 10));
 
     if (in_y1 == in_y2) {
-      p.dy1_scale_10[gsl::narrow_cast<size_t>(y)] = static_cast<int32_t>(0.5f * (1 << 10));
-      p.dy2_scale_10[gsl::narrow_cast<size_t>(y)] = static_cast<int32_t>(0.5f * (1 << 10));
+      p.dy1_scale_10[narrow<size_t>(y)] = static_cast<int32_t>(0.5f * (1 << 10));
+      p.dy2_scale_10[narrow<size_t>(y)] = static_cast<int32_t>(0.5f * (1 << 10));
     }
 
-    p.input_width_mul_y1[gsl::narrow_cast<size_t>(y)] = input_width * in_y1;
-    p.input_width_mul_y2[gsl::narrow_cast<size_t>(y)] = input_width * in_y2;
+    p.input_width_mul_y1[narrow<size_t>(y)] = input_width * in_y1;
+    p.input_width_mul_y2[narrow<size_t>(y)] = input_width * in_y2;
   }
 
   const size_t width_rindex = is_nchw ? 0 : 1;
@@ -604,14 +605,14 @@ BilinearParamsInteger SetupUpsampleBilinearInteger(const int32_t input_height,
     in_x = std::max(0.0f, std::min(in_x, static_cast<float>(input_width - 1)));
     int32_t in_x_scale_10 = static_cast<int32_t>(in_x * (1 << 10));
 
-    p.in_x1[gsl::narrow_cast<size_t>(x)] = std::min(static_cast<int32_t>(in_x), input_width - 1);
-    p.in_x2[gsl::narrow_cast<size_t>(x)] = std::min(p.in_x1[gsl::narrow_cast<size_t>(x)] + 1, input_width - 1);
+    p.in_x1[narrow<size_t>(x)] = std::min(static_cast<int32_t>(in_x), input_width - 1);
+    p.in_x2[narrow<size_t>(x)] = std::min(p.in_x1[narrow<size_t>(x)] + 1, input_width - 1);
 
-    p.dx1_scale_10[gsl::narrow_cast<size_t>(x)] = std::abs(in_x_scale_10 - p.in_x1[gsl::narrow_cast<size_t>(x)] * (1 << 10));
-    p.dx2_scale_10[gsl::narrow_cast<size_t>(x)] = std::abs(in_x_scale_10 - p.in_x2[gsl::narrow_cast<size_t>(x)] * (1 << 10));
-    if (p.in_x1[gsl::narrow_cast<size_t>(x)] == p.in_x2[gsl::narrow_cast<size_t>(x)]) {
-      p.dx1_scale_10[gsl::narrow_cast<size_t>(x)] = static_cast<int32_t>(0.5f * (1 << 10));
-      p.dx2_scale_10[gsl::narrow_cast<size_t>(x)] = static_cast<int32_t>(0.5f * (1 << 10));
+    p.dx1_scale_10[narrow<size_t>(x)] = std::abs(in_x_scale_10 - p.in_x1[narrow<size_t>(x)] * (1 << 10));
+    p.dx2_scale_10[narrow<size_t>(x)] = std::abs(in_x_scale_10 - p.in_x2[narrow<size_t>(x)] * (1 << 10));
+    if (p.in_x1[narrow<size_t>(x)] == p.in_x2[narrow<size_t>(x)]) {
+      p.dx1_scale_10[narrow<size_t>(x)] = static_cast<int32_t>(0.5f * (1 << 10));
+      p.dx2_scale_10[narrow<size_t>(x)] = static_cast<int32_t>(0.5f * (1 << 10));
     }
   }
 
@@ -654,9 +655,9 @@ static TrilinearParams SetupUpsampleTrilinear(int64_t input_depth,
                                               const GetOriginalCoordinateFunc& get_original_coordinate) {
   TrilinearParams p;
 
-  p.z_original.reserve(gsl::narrow_cast<size_t>(output_depth));
-  p.y_original.reserve(gsl::narrow_cast<size_t>(output_height));
-  p.x_original.reserve(gsl::narrow_cast<size_t>(output_width));
+  p.z_original.reserve(narrow<size_t>(output_depth));
+  p.y_original.reserve(narrow<size_t>(output_height));
+  p.x_original.reserve(narrow<size_t>(output_width));
 
   // For each index in the output height and output width, cache its corresponding indices in the input
   // while multiplying it with the input stride for that dimension (cache because we don't have to re-compute
@@ -716,16 +717,16 @@ static TrilinearParams SetupUpsampleTrilinear(int64_t input_depth,
 
     const int64_t in_z1 = std::min(static_cast<int64_t>(in_z), input_depth - 1);
     const int64_t in_z2 = std::min(in_z1 + 1, input_depth - 1);
-    p.dz1[gsl::narrow_cast<size_t>(z)] = std::fabs(in_z - in_z1);
-    p.dz2[gsl::narrow_cast<size_t>(z)] = std::fabs(in_z - in_z2);
+    p.dz1[narrow<size_t>(z)] = std::fabs(in_z - in_z1);
+    p.dz2[narrow<size_t>(z)] = std::fabs(in_z - in_z2);
 
     if (in_z1 == in_z2) {
-      p.dz1[gsl::narrow_cast<size_t>(z)] = 0.5f;
-      p.dz2[gsl::narrow_cast<size_t>(z)] = 0.5f;
+      p.dz1[narrow<size_t>(z)] = 0.5f;
+      p.dz2[narrow<size_t>(z)] = 0.5f;
     }
 
-    p.input_height_width_mul_z1[gsl::narrow_cast<size_t>(z)] = input_height * input_width * in_z1;
-    p.input_height_width_mul_z2[gsl::narrow_cast<size_t>(z)] = input_height * input_width * in_z2;
+    p.input_height_width_mul_z1[narrow<size_t>(z)] = input_height * input_width * in_z1;
+    p.input_height_width_mul_z2[narrow<size_t>(z)] = input_height * input_width * in_z2;
   }
 
   auto roi_y_start = roi.size() / 2 - 2;
@@ -741,16 +742,16 @@ static TrilinearParams SetupUpsampleTrilinear(int64_t input_depth,
 
     const int64_t in_y1 = std::min(static_cast<int64_t>(in_y), input_height - 1);
     const int64_t in_y2 = std::min(in_y1 + 1, input_height - 1);
-    p.dy1[gsl::narrow_cast<size_t>(y)] = std::fabs(in_y - in_y1);
-    p.dy2[gsl::narrow_cast<size_t>(y)] = std::fabs(in_y - in_y2);
+    p.dy1[narrow<size_t>(y)] = std::fabs(in_y - in_y1);
+    p.dy2[narrow<size_t>(y)] = std::fabs(in_y - in_y2);
 
     if (in_y1 == in_y2) {
-      p.dy1[gsl::narrow_cast<size_t>(y)] = 0.5f;
-      p.dy2[gsl::narrow_cast<size_t>(y)] = 0.5f;
+      p.dy1[narrow<size_t>(y)] = 0.5f;
+      p.dy2[narrow<size_t>(y)] = 0.5f;
     }
 
-    p.input_width_mul_y1[gsl::narrow_cast<size_t>(y)] = input_width * in_y1;
-    p.input_width_mul_y2[gsl::narrow_cast<size_t>(y)] = input_width * in_y2;
+    p.input_width_mul_y1[narrow<size_t>(y)] = input_width * in_y1;
+    p.input_width_mul_y2[narrow<size_t>(y)] = input_width * in_y2;
   }
 
   auto roi_x_start = roi.size() / 2 - 1;
@@ -764,14 +765,14 @@ static TrilinearParams SetupUpsampleTrilinear(int64_t input_depth,
     p.x_original.emplace_back(in_x);
     in_x = std::max(0.0f, std::min(in_x, static_cast<float>(input_width - 1)));
 
-    p.in_x1[gsl::narrow_cast<size_t>(x)] = std::min(static_cast<int64_t>(in_x), input_width - 1);
-    p.in_x2[gsl::narrow_cast<size_t>(x)] = std::min(p.in_x1[gsl::narrow_cast<size_t>(x)] + 1, input_width - 1);
+    p.in_x1[narrow<size_t>(x)] = std::min(static_cast<int64_t>(in_x), input_width - 1);
+    p.in_x2[narrow<size_t>(x)] = std::min(p.in_x1[narrow<size_t>(x)] + 1, input_width - 1);
 
-    p.dx1[gsl::narrow_cast<size_t>(x)] = std::fabs(in_x - p.in_x1[gsl::narrow_cast<size_t>(x)]);
-    p.dx2[gsl::narrow_cast<size_t>(x)] = std::fabs(in_x - p.in_x2[gsl::narrow_cast<size_t>(x)]);
-    if (p.in_x1[gsl::narrow_cast<size_t>(x)] == p.in_x2[gsl::narrow_cast<size_t>(x)]) {
-      p.dx1[gsl::narrow_cast<size_t>(x)] = 0.5f;
-      p.dx2[gsl::narrow_cast<size_t>(x)] = 0.5f;
+    p.dx1[narrow<size_t>(x)] = std::fabs(in_x - p.in_x1[narrow<size_t>(x)]);
+    p.dx2[narrow<size_t>(x)] = std::fabs(in_x - p.in_x2[narrow<size_t>(x)]);
+    if (p.in_x1[narrow<size_t>(x)] == p.in_x2[narrow<size_t>(x)]) {
+      p.dx1[narrow<size_t>(x)] = 0.5f;
+      p.dx2[narrow<size_t>(x)] = 0.5f;
     }
   }
 
@@ -820,35 +821,35 @@ void UpsampleTrilinear(int64_t batch_size,
                 // when use_extrapolation is set and original index of x or y is out of the dim range
                 // then use extrapolation_value as the output value.
                 if (use_extrapolation &&
-                    ((p.z_original[gsl::narrow_cast<size_t>(z)] < 0 || p.z_original[gsl::narrow_cast<size_t>(z)] > static_cast<float>(input_depth - 1)) ||
-                     (p.y_original[gsl::narrow_cast<size_t>(y)] < 0 || p.y_original[gsl::narrow_cast<size_t>(y)] > static_cast<float>(input_height - 1)) ||
-                     (p.x_original[gsl::narrow_cast<size_t>(x)] < 0 || p.x_original[gsl::narrow_cast<size_t>(x)] > static_cast<float>(input_width - 1)))) {
+                    ((p.z_original[narrow<size_t>(z)] < 0 || p.z_original[narrow<size_t>(z)] > static_cast<float>(input_depth - 1)) ||
+                     (p.y_original[narrow<size_t>(y)] < 0 || p.y_original[narrow<size_t>(y)] > static_cast<float>(input_height - 1)) ||
+                     (p.x_original[narrow<size_t>(x)] < 0 || p.x_original[narrow<size_t>(x)] > static_cast<float>(input_width - 1)))) {
                   Ydata[output_width * output_height * z + output_width * y + x] =
                       static_cast<T>(extrapolation_value);
                   continue;
                 }
 
                 // subscript ordering in the variable - (xyz)
-                T X111 = Xdata[p.input_height_width_mul_z1[gsl::narrow_cast<size_t>(z)] + p.input_width_mul_y1[gsl::narrow_cast<size_t>(y)] + p.in_x1[gsl::narrow_cast<size_t>(x)]];
-                T X211 = Xdata[p.input_height_width_mul_z1[gsl::narrow_cast<size_t>(z)] + p.input_width_mul_y1[gsl::narrow_cast<size_t>(y)] + p.in_x2[gsl::narrow_cast<size_t>(x)]];
-                T X121 = Xdata[p.input_height_width_mul_z1[gsl::narrow_cast<size_t>(z)] + p.input_width_mul_y2[gsl::narrow_cast<size_t>(y)] + p.in_x1[gsl::narrow_cast<size_t>(x)]];
-                T X221 = Xdata[p.input_height_width_mul_z1[gsl::narrow_cast<size_t>(z)] + p.input_width_mul_y2[gsl::narrow_cast<size_t>(y)] + p.in_x2[gsl::narrow_cast<size_t>(x)]];
+                T X111 = Xdata[p.input_height_width_mul_z1[narrow<size_t>(z)] + p.input_width_mul_y1[narrow<size_t>(y)] + p.in_x1[narrow<size_t>(x)]];
+                T X211 = Xdata[p.input_height_width_mul_z1[narrow<size_t>(z)] + p.input_width_mul_y1[narrow<size_t>(y)] + p.in_x2[narrow<size_t>(x)]];
+                T X121 = Xdata[p.input_height_width_mul_z1[narrow<size_t>(z)] + p.input_width_mul_y2[narrow<size_t>(y)] + p.in_x1[narrow<size_t>(x)]];
+                T X221 = Xdata[p.input_height_width_mul_z1[narrow<size_t>(z)] + p.input_width_mul_y2[narrow<size_t>(y)] + p.in_x2[narrow<size_t>(x)]];
 
-                T X112 = Xdata[p.input_height_width_mul_z2[gsl::narrow_cast<size_t>(z)] + p.input_width_mul_y1[gsl::narrow_cast<size_t>(y)] + p.in_x1[gsl::narrow_cast<size_t>(x)]];
-                T X212 = Xdata[p.input_height_width_mul_z2[gsl::narrow_cast<size_t>(z)] + p.input_width_mul_y1[gsl::narrow_cast<size_t>(y)] + p.in_x2[gsl::narrow_cast<size_t>(x)]];
-                T X122 = Xdata[p.input_height_width_mul_z2[gsl::narrow_cast<size_t>(z)] + p.input_width_mul_y2[gsl::narrow_cast<size_t>(y)] + p.in_x1[gsl::narrow_cast<size_t>(x)]];
-                T X222 = Xdata[p.input_height_width_mul_z2[gsl::narrow_cast<size_t>(z)] + p.input_width_mul_y2[gsl::narrow_cast<size_t>(y)] + p.in_x2[gsl::narrow_cast<size_t>(x)]];
+                T X112 = Xdata[p.input_height_width_mul_z2[narrow<size_t>(z)] + p.input_width_mul_y1[narrow<size_t>(y)] + p.in_x1[narrow<size_t>(x)]];
+                T X212 = Xdata[p.input_height_width_mul_z2[narrow<size_t>(z)] + p.input_width_mul_y1[narrow<size_t>(y)] + p.in_x2[narrow<size_t>(x)]];
+                T X122 = Xdata[p.input_height_width_mul_z2[narrow<size_t>(z)] + p.input_width_mul_y2[narrow<size_t>(y)] + p.in_x1[narrow<size_t>(x)]];
+                T X222 = Xdata[p.input_height_width_mul_z2[narrow<size_t>(z)] + p.input_width_mul_y2[narrow<size_t>(y)] + p.in_x2[narrow<size_t>(x)]];
 
                 Ydata[output_width * output_height * z + output_width * y + x] =
-                    static_cast<T>(p.dx2[gsl::narrow_cast<size_t>(x)] * p.dy2[gsl::narrow_cast<size_t>(y)] * p.dz2[gsl::narrow_cast<size_t>(z)] * X111 +
-                                   p.dx1[gsl::narrow_cast<size_t>(x)] * p.dy2[gsl::narrow_cast<size_t>(y)] * p.dz2[gsl::narrow_cast<size_t>(z)] * X211 +
-                                   p.dx2[gsl::narrow_cast<size_t>(x)] * p.dy1[gsl::narrow_cast<size_t>(y)] * p.dz2[gsl::narrow_cast<size_t>(z)] * X121 +
-                                   p.dx1[gsl::narrow_cast<size_t>(x)] * p.dy1[gsl::narrow_cast<size_t>(y)] * p.dz2[gsl::narrow_cast<size_t>(z)] * X221 +
+                    static_cast<T>(p.dx2[narrow<size_t>(x)] * p.dy2[narrow<size_t>(y)] * p.dz2[narrow<size_t>(z)] * X111 +
+                                   p.dx1[narrow<size_t>(x)] * p.dy2[narrow<size_t>(y)] * p.dz2[narrow<size_t>(z)] * X211 +
+                                   p.dx2[narrow<size_t>(x)] * p.dy1[narrow<size_t>(y)] * p.dz2[narrow<size_t>(z)] * X121 +
+                                   p.dx1[narrow<size_t>(x)] * p.dy1[narrow<size_t>(y)] * p.dz2[narrow<size_t>(z)] * X221 +
 
-                                   p.dx2[gsl::narrow_cast<size_t>(x)] * p.dy2[gsl::narrow_cast<size_t>(y)] * p.dz1[gsl::narrow_cast<size_t>(z)] * X112 +
-                                   p.dx1[gsl::narrow_cast<size_t>(x)] * p.dy2[gsl::narrow_cast<size_t>(y)] * p.dz1[gsl::narrow_cast<size_t>(z)] * X212 +
-                                   p.dx2[gsl::narrow_cast<size_t>(x)] * p.dy1[gsl::narrow_cast<size_t>(y)] * p.dz1[gsl::narrow_cast<size_t>(z)] * X122 +
-                                   p.dx1[gsl::narrow_cast<size_t>(x)] * p.dy1[gsl::narrow_cast<size_t>(y)] * p.dz1[gsl::narrow_cast<size_t>(z)] * X222);
+                                   p.dx2[narrow<size_t>(x)] * p.dy2[narrow<size_t>(y)] * p.dz1[narrow<size_t>(z)] * X112 +
+                                   p.dx1[narrow<size_t>(x)] * p.dy2[narrow<size_t>(y)] * p.dz1[narrow<size_t>(z)] * X212 +
+                                   p.dx2[narrow<size_t>(x)] * p.dy1[narrow<size_t>(y)] * p.dz1[narrow<size_t>(z)] * X122 +
+                                   p.dx1[narrow<size_t>(x)] * p.dy1[narrow<size_t>(y)] * p.dz1[narrow<size_t>(z)] * X222);
               }
             }
           }
@@ -905,7 +906,7 @@ float CubicInterpolation1D(const T* Xdata,
   float result = 0;
   for (int i = 0, j = -1; i < static_cast<int>(CubicModeGridLength); i++, j++) {
     auto orig_data = GetDataForCoordinate(Xdata, x + j, y, input_height, input_width);
-    result += coeff_array[gsl::narrow_cast<size_t>(i)] / coeff_sum * orig_data;
+    result += coeff_array[narrow<size_t>(i)] / coeff_sum * orig_data;
   }
   cache[grid_start_pos] = result;
 
@@ -933,10 +934,10 @@ void ResizeBiCubic(int64_t batch_size,
                    T* Ydata,
                    const GetOriginalCoordinateFunc& get_original_coordinate) {
   std::vector<float> y_original;
-  y_original.reserve(gsl::narrow_cast<size_t>(output_height));
+  y_original.reserve(narrow<size_t>(output_height));
 
   std::vector<float> x_original;
-  x_original.reserve(gsl::narrow_cast<size_t>(output_width));
+  x_original.reserve(narrow<size_t>(output_width));
 
   std::unordered_map<float, std::array<float, CubicModeGridLength>> cubic_coeffs;
   std::unordered_map<float, std::unordered_map<int64_t, float>> coeff_to_1Dinterpolation_map;
@@ -953,7 +954,7 @@ void ResizeBiCubic(int64_t batch_size,
                                                              static_cast<float>(input_height),
                                                              roi[roi_y_start], roi[roi_y_end]);
     y_original.emplace_back(in_y);
-    auto s = y_original[gsl::narrow_cast<size_t>(y)] - std::floor(y_original[gsl::narrow_cast<size_t>(y)]);
+    auto s = y_original[narrow<size_t>(y)] - std::floor(y_original[narrow<size_t>(y)]);
     if (cubic_coeffs.find(s) == cubic_coeffs.end()) {
       cubic_coeffs[s] = GetCubicCoeffs(s, cubic_coeff_a);
       coeff_to_1Dinterpolation_map[s] = {};
@@ -969,7 +970,7 @@ void ResizeBiCubic(int64_t batch_size,
                                                             static_cast<float>(input_width),
                                                             roi[roi_x_start], roi[roi_x_end]);
     x_original.emplace_back(in_x);
-    auto s = x_original[gsl::narrow_cast<size_t>(x)] - std::floor(x_original[gsl::narrow_cast<size_t>(x)]);
+    auto s = x_original[narrow<size_t>(x)] - std::floor(x_original[narrow<size_t>(x)]);
     if (cubic_coeffs.find(s) == cubic_coeffs.end()) {
       cubic_coeffs[s] = GetCubicCoeffs(s, cubic_coeff_a);
       coeff_to_1Dinterpolation_map[s] = {};
@@ -985,7 +986,7 @@ void ResizeBiCubic(int64_t batch_size,
   for (int64_t n = 0; n < batch_size; n++) {
     for (int64_t c = 0; c < num_channels; c++) {
       for (int64_t y = 0; y < output_height; ++y) {
-        auto in_y = y_original[gsl::narrow_cast<size_t>(y)];
+        auto in_y = y_original[narrow<size_t>(y)];
 
         // when use_extrapolation is set and original index is out of the dim range
         // then use extrapolation_value as the output value.
@@ -1006,13 +1007,13 @@ void ResizeBiCubic(int64_t batch_size,
           y_coeff_sum = 0;
           auto& orig_y_coeffs = cubic_coeffs[in_y - y_int];
           for (int64_t i = 0, y_val = y_int - 1; y_val <= y_int + 2; y_val++, i++) {
-            y_coeff_holder[gsl::narrow_cast<size_t>(i)] = (y_val < 0 || y_val >= static_cast<float>(input_height)) ? 0.0f : orig_y_coeffs[gsl::narrow_cast<size_t>(i)];
-            y_coeff_sum += y_coeff_holder[gsl::narrow_cast<size_t>(i)];
+            y_coeff_holder[narrow<size_t>(i)] = (y_val < 0 || y_val >= static_cast<float>(input_height)) ? 0.0f : orig_y_coeffs[narrow<size_t>(i)];
+            y_coeff_sum += y_coeff_holder[narrow<size_t>(i)];
           }
         }
 
         for (int64_t x = 0; x < output_width; ++x) {
-          auto in_x = x_original[gsl::narrow_cast<size_t>(x)];
+          auto in_x = x_original[narrow<size_t>(x)];
 
           // when use_extrapolation is set and original index is out of the dim range
           // then use extrapolation_value as the output value.
@@ -1032,8 +1033,8 @@ void ResizeBiCubic(int64_t batch_size,
             x_coeff_sum = 0;
             auto& orig_x_coeff = cubic_coeffs[s_x];
             for (int64_t i = 0, x_val = x_int - 1; x_val <= x_int + 2; x_val++, i++) {
-              x_coeff_holder[gsl::narrow_cast<size_t>(i)] = (x_val < 0 || x_val >= static_cast<float>(input_width)) ? 0.0f : orig_x_coeff[gsl::narrow_cast<size_t>(i)];
-              x_coeff_sum += x_coeff_holder[gsl::narrow_cast<size_t>(i)];
+              x_coeff_holder[narrow<size_t>(i)] = (x_val < 0 || x_val >= static_cast<float>(input_width)) ? 0.0f : orig_x_coeff[narrow<size_t>(i)];
+              x_coeff_sum += x_coeff_holder[narrow<size_t>(i)];
             }
           }
 
@@ -1045,7 +1046,7 @@ void ResizeBiCubic(int64_t batch_size,
             auto x_interpolation_result = CubicInterpolation1D(Xdata, x_int, y_val,
                                                                input_height, input_width, coeff_x, x_coeff_sum,
                                                                interpolation_result_cache);
-            result += x_interpolation_result * coeff_y[gsl::narrow_cast<size_t>(i)] / y_coeff_sum;
+            result += x_interpolation_result * coeff_y[narrow<size_t>(i)] / y_coeff_sum;
           }
 
           Ydata[y * output_width + x] = static_cast<T>(result);
@@ -1092,7 +1093,7 @@ Status Upsample<T>::BaseCompute(OpKernelContext* context,
 
   bool no_scale = true;
   for (std::size_t i = 0, end = output_dims.size(); i < end; i++) {
-    if (no_scale && output_dims[gsl::narrow_cast<size_t>(i)] != dims[gsl::narrow_cast<size_t>(i)]) no_scale = false;
+    if (no_scale && output_dims[narrow<size_t>(i)] != dims[narrow<size_t>(i)]) no_scale = false;
   }
 
   if (no_scale) {
@@ -1300,7 +1301,7 @@ Status Upsample<T>::Compute(OpKernelContext* context) const {
       size_t input_rank = input_dims.size();
       roi_array.resize(input_rank * 2);
       for (size_t i = 0; i < input_rank; ++i) {
-        roi_array[gsl::narrow_cast<size_t>(i)] = 0;
+        roi_array[narrow<size_t>(i)] = 0;
         roi_array[i + input_rank] = 1;
       }
     }
@@ -1336,7 +1337,7 @@ Status Upsample<T>::Compute(OpKernelContext* context) const {
     ORT_ENFORCE(sizes != nullptr && sizes->Shape().Size() != 0, "Either scales or sizes MUST be provided as input.");
 
     // When sizes input is available directly populate it into the output_dims array.
-    memcpy(output_dims.data(), sizes->template Data<int64_t>(), gsl::narrow_cast<size_t>(sizes->Shape().Size())* sizeof(int64_t));
+    memcpy(output_dims.data(), sizes->template Data<int64_t>(), SafeInt<size_t>(sizes->Shape().Size())* sizeof(int64_t));
 
     ORT_ENFORCE(X->Shape().GetDims().size() == output_dims.size(),
                 "Resize: input tensor's rank does not match the output tensor's rank.");