Add input tensor calibration (#4619)

* add input tensor calibration * set default fusions to be true Co-authored-by: t-yguo <t-yguo@microsoft.com>
2026-07-19 19:00:47 +00:00 · 2020-07-28 14:04:41 -07:00 · 2020-07-28 14:04:41 -07:00 · f3fc8ca954
commit f3fc8ca954
parent d4983f83ff
65 changed files with 39 additions and 25 deletions
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000066.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000066.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000092.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000092.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000170.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000170.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000237.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000237.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000303.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000303.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000336.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000336.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000597.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000597.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000633.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000633.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000634.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000634.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000708.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000708.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000762.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000762.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000888.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000888.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000917.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000917.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000930.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00000930.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001007.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001007.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001092.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001092.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001137.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001137.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001158.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001158.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001191.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001191.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001223.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001223.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001397.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001397.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001663.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001663.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001708.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001708.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001717.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001717.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001858.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001858.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001873.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00001873.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00002305.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00002305.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00002367.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00002367.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00002536.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00002536.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00002645.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00002645.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004173.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004173.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004278.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004278.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004411.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004411.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004562.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004562.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004572.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004572.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004578.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004578.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004655.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004655.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004674.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004674.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004749.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004749.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004750.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004750.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004784.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004784.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004813.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004813.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004880.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004880.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004939.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00004939.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005117.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005117.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005178.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005178.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005220.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005220.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005228.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005228.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005369.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005369.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005397.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005397.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005662.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005662.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005746.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005746.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005855.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005855.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005892.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005892.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005998.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00005998.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00006011.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00006011.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00006108.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00006108.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00006148.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00006148.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00006178.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00006178.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00006182.JPEG
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/calibration_data_set_test/ILSVRC2012_val_00006182.JPEG
--- a/onnxruntime/python/tools/quantization/E2E_example_model/e2e_user_example.py
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/e2e_user_example.py
@ -65,13 +65,13 @@ def preprocess_func(images_folder, height, width, size_limit=0):

 def main():
    model_path = './resnet50_v1.onnx'
-    calibration_dataset_path = './calibration_data_set_test'
+    calibration_dataset_path = './calibration_data_set'
    dr = ResNet50DataReader(calibration_dataset_path)
    #call calibrate to generate quantization dictionary containing the zero point and scale values
    quantization_params_dict = calibrate(model_path,dr)
    calibrated_quantized_model = quantize(onnx.load(model_path),
                                          quantization_mode=QuantizationMode.QLinearOps,
-                                          force_fusions=False,
+                                          force_fusions=True,
                                          quantization_params=quantization_params_dict)
    output_model_path = './calibrated_quantized_model.onnx'
    onnx.save(calibrated_quantized_model, output_model_path)
--- a/onnxruntime/python/tools/quantization/E2E_example_model/test_images/daisy.jpg
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/test_images/daisy.jpg
--- a/onnxruntime/python/tools/quantization/E2E_example_model/test_images/rose.jpg
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/test_images/rose.jpg
--- a/onnxruntime/python/tools/quantization/E2E_example_model/test_images/tulip.jpg
+++ b/onnxruntime/python/tools/quantization/E2E_example_model/test_images/tulip.jpg
--- a/onnxruntime/python/tools/quantization/calibrate.py
+++ b/onnxruntime/python/tools/quantization/calibrate.py
@ -61,33 +61,47 @@ class ONNXCalibrater:
        :return: augmented ONNX model
        '''

+        model = onnx.load(self.model_path)
+        model = onnx.shape_inference.infer_shapes(model)
+        value_infos = {vi.name: vi for vi in model.graph.value_info} 
+        
        added_nodes = []
        added_outputs = []
-        model = onnx.load(self.model_path)
+        tensors_to_calibrate = set()
+
        for node in model.graph.node:
            should_be_calibrate = ((node.op_type in self.calibrate_op_types) and
                                (node.name not in self.black_nodes)) or (node.name in self.white_nodes)
            if should_be_calibrate:
-                input_name = node.output[0]
-                # Adding ReduceMin nodes
-                reduce_min_name = ''
-                if node.name != '':
-                    reduce_min_name = node.name + '_ReduceMin'
-                reduce_min_node = onnx.helper.make_node('ReduceMin', [input_name], [input_name + '_ReduceMin'],
-                                                        reduce_min_name,
-                                                        keepdims=0)
-                added_nodes.append(reduce_min_node)
-                added_outputs.append(helper.make_tensor_value_info(reduce_min_node.output[0], TensorProto.FLOAT, ()))
+                for input_tensor_name in node.input:
+                    if input_tensor_name in value_infos.keys(): 
+                        vi = value_infos[input_tensor_name]
+                        if vi.type.HasField(
+                            'tensor_type') and vi.type.tensor_type.elem_type == onnx_proto.TensorProto.FLOAT and (
+                                input_tensor_name not in model.graph.initializer):
+                            tensors_to_calibrate.add(input_tensor_name)

-                # Adding ReduceMax nodes
-                reduce_max_name = ''
-                if node.name != '':
-                    reduce_max_name = node.name + '_ReduceMax'
-                reduce_max_node = onnx.helper.make_node('ReduceMax', [input_name], [input_name + '_ReduceMax'],
-                                                        reduce_max_name,
-                                                        keepdims=0)
-                added_nodes.append(reduce_max_node)
-                added_outputs.append(helper.make_tensor_value_info(reduce_max_node.output[0], TensorProto.FLOAT, ()))
+                for output_tensor_name in node.output:
+                    if output_tensor_name in value_infos.keys(): 
+                        vi = value_infos[output_tensor_name]
+                        if vi.type.HasField(
+                            'tensor_type') and vi.type.tensor_type.elem_type == onnx_proto.TensorProto.FLOAT:
+                            tensors_to_calibrate.add(output_tensor_name)
+            
+        for tensor in tensors_to_calibrate:
+            # Adding ReduceMin nodes
+            reduce_min_name = tensor + '_ReduceMin'
+            reduce_min_node = onnx.helper.make_node('ReduceMin', [tensor], [tensor + '_ReduceMin'], reduce_min_name, keepdims=0)
+       
+            added_nodes.append(reduce_min_node)
+            added_outputs.append(helper.make_tensor_value_info(reduce_min_node.output[0], TensorProto.FLOAT, ()))
+
+            # Adding ReduceMax nodes
+            reduce_max_name = tensor + '_ReduceMax'
+            reduce_max_node = onnx.helper.make_node('ReduceMax', [tensor], [tensor + '_ReduceMax'], reduce_max_name, keepdims=0)
+       
+            added_nodes.append(reduce_max_node)
+            added_outputs.append(helper.make_tensor_value_info(reduce_max_node.output[0], TensorProto.FLOAT, ()))

        model.graph.node.extend(added_nodes)
        model.graph.output.extend(added_outputs)
@ -209,9 +223,9 @@ class ONNXCalibrater:

 def calibrate(model_path,
              data_reader:CalibrationDataReader,
-              op_types='Conv,MatMul',
-              black_nodes='',
-              white_nodes='',
+              op_types=['Conv','MatMul'],
+              black_nodes=[],
+              white_nodes=[],
              augmented_model_path ='augmented_model.onnx'):   
    '''
        Given an onnx model, augment and run the augmented model on calibration data set, aggregate and calculate the quantization parameters.