Speed up offloading using pinned memory. (#10526)

To enable this feature use: --fast pinned_memory
2025-10-28 21:21:01 -07:00
parent 210f7a1ba5
commit 3fa7a5c04a
3 changed files with 56 additions and 1 deletions
@@ -144,6 +144,7 @@ class PerformanceFeature(enum.Enum):
    Fp8MatrixMultiplication = "fp8_matrix_mult"
    CublasOps = "cublas_ops"
    AutoTune = "autotune"
+    PinnedMem = "pinned_memory"

 parser.add_argument("--fast", nargs="*", type=PerformanceFeature, help="Enable some untested and potentially quality deteriorating optimizations. --fast with no arguments enables everything. You can pass a list specific optimizations if you only want to enable specific ones. Current valid optimizations: {}".format(" ".join(map(lambda c: c.value, PerformanceFeature))))