temporarily disable weight/Bias quantization

2026-06-26 03:00:54 +00:00 · 2025-01-22 10:15:16 -08:00 · 2025-01-22 10:15:16 -08:00 · 981d95b81e
commit 981d95b81e
parent bbb5862b9e
1 changed files with 1 additions and 1 deletions
--- a/onnxruntime/core/optimizer/graph_transformer_utils.cc
+++ b/onnxruntime/core/optimizer/graph_transformer_utils.cc
@ -249,7 +249,7 @@ InlinedVector<std::unique_ptr<GraphTransformer>> GenerateTransformers(

      if (!disable_quant_qdq) {
        transformers.emplace_back(std::make_unique<QDQPropagationTransformer>());
-        transformers.emplace_back(std::make_unique<WeightBiasQuantization>());
+        //transformers.emplace_back(std::make_unique<WeightBiasQuantization>());

        // EnsureUniqueDQForNodeUnit is actually a required graph transformation. The unique DQ per QDQ node unit input
        // condition that it ensures is important for the partitioning that happens after Level1 optimizers are run.