From 822b23ff2fafdcbd2d1fdd0f4d7f8f6800ac622a Mon Sep 17 00:00:00 2001
From: Yufeng Li <liyufeng1987@gmail.com>
Date: Tue, 21 Jul 2020 21:43:02 -0700
Subject: [PATCH] Add support of EmbeddingLayerNorm (#4562)

---
 onnxruntime/python/tools/quantization/quantize.py | 11 +++++++++++
 1 file changed, 11 insertions(+)

diff --git a/onnxruntime/python/tools/quantization/quantize.py b/onnxruntime/python/tools/quantization/quantize.py
index 2b440390db..0ed11c7698 100644
--- a/onnxruntime/python/tools/quantization/quantize.py
+++ b/onnxruntime/python/tools/quantization/quantize.py
@@ -356,6 +356,8 @@ class ONNXQuantizer:
                     new_list += self._handle_activation_ops(node, new_list)
                 elif node.op_type == 'Attention':
                     new_list += self._quantize_attention(node, new_list)
+                elif node.op_type == 'EmbedLayerNormalization':
+                    new_list += self._quantize_embed_layernorm(node, new_list)
                 else:
                     new_list += self._handle_other_ops(node, new_list)
 
@@ -1132,6 +1134,15 @@ class ONNXQuantizer:
 
         return nodes
 
+    def _quantize_embed_layernorm(self, node, new_nodes_list):
+        assert (node.op_type == "EmbedLayerNormalization")
+        (quantized_input_names, zero_point_names, scale_names, nodes) = \
+            self._quantize_inputs(node, [2, 3, 4], new_nodes_list)
+
+        nodes.append(node)
+
+        return nodes
+
     def _quantize_convolution_integer_ops(self, node, new_nodes_list):
         '''
         Used when self.mode is QuantizationMode.IntegerOps.