pytorch · SS-JIA · Feb 11, 2026 · Feb 11, 2026 · Feb 11, 2026
@@ -431,6 +431,11 @@ def register_torchao_quantize_dequantize():
     )
 
 
+# =============================================================================
+# Q8taQuantizeDequantize.cpp
+# =============================================================================
+
+
 @update_features(
     [
         exir_ops.edge.quantized_decomposed.quantize_per_tensor.default,
@@ -443,7 +448,7 @@ def register_quantize_per_tensor():
             utils.CHANNELS_PACKED_TEXTURE_OR_CONTIGUOUS_BUFFER,
         ],
         outputs_storage=[
-            utils.PACKED_INT8_4W4C_BUFFER,
+            utils.PACKED_INT8_BUFFER,
         ],
     )
 
@@ -457,7 +462,7 @@ def register_quantize_per_tensor():
 def register_dequantize_per_tensor():
     return OpFeatures(
         inputs_storage=[
-            utils.PACKED_INT8_4W4C_BUFFER,
+            utils.PACKED_INT8_BUFFER,
         ],
         outputs_storage=[
             utils.CHANNELS_PACKED_TEXTURE_OR_CONTIGUOUS_BUFFER,

@@ -144,6 +144,8 @@ utils::GPUMemoryLayout get_memory_layout(
       return utils::kPackedInt8_4W4C;
     case vkgraph::VkMemoryLayout::PACKED_INT8_4H4W:
       return utils::kPackedInt8_4H4W;
+    case vkgraph::VkMemoryLayout::PACKED_INT8_4C1W:
+      return utils::kPackedInt8_4C1W;
     default:
       break;
   }

@@ -42,6 +42,7 @@ enum VkMemoryLayout : ubyte {
   TENSOR_CHANNELS_PACKED = 2,
   PACKED_INT8_4W4C = 3,
   PACKED_INT8_4H4W = 4,
+  PACKED_INT8_4C1W = 8,
   DEFAULT_LAYOUT = 255,
 }
 

@@ -50,6 +50,7 @@ class VkMemoryLayout(IntEnum):
     TENSOR_CHANNELS_PACKED = 2
     PACKED_INT8_4W4C = 3
     PACKED_INT8_4H4W = 4
+    PACKED_INT8_4C1W = 8
     DEFAULT_LAYOUT = 255
 
     def __str__(self) -> str:

@@ -594,6 +594,7 @@ def node_has_target(node: Any, target: str):
 all_quantized_memory_layouts: Set[VkMemoryLayout] = {
     VkMemoryLayout.PACKED_INT8_4W4C,
     VkMemoryLayout.PACKED_INT8_4H4W,
+    VkMemoryLayout.PACKED_INT8_4C1W,
 }
 
 universal_memory_layout_set: Set[VkMemoryLayout] = {
@@ -983,7 +984,14 @@ def make_filtered_tensor_repset(
 
 # Only includes memory layouts that can be used by quantized tensors
 
+PACKED_INT8_BUFFER = TensorRepSet(all_quantized_memory_layouts, set())
 PACKED_INT8_4W4C_BUFFER = TensorRepSet({VkMemoryLayout.PACKED_INT8_4W4C}, set())
+PACKED_INT8_4C1W_BUFFER = TensorRepSet({VkMemoryLayout.PACKED_INT8_4C1W}, set())
+
+PACKED_INT8_CHANNELS_PACKED_BUFFER = TensorRepSet(
+    {VkMemoryLayout.PACKED_INT8_4W4C, VkMemoryLayout.PACKED_INT8_4C1W}, set()
+)
+
 
 # Special use RepSets