zihugithub · zihugithub · Mar 3, 2026 · Mar 3, 2026 · Mar 3, 2026 · Mar 3, 2026
diff --git a/.github/configs/cuda.yml b/.github/configs/cuda.yml
@@ -6,9 +6,9 @@ hardware_name: cuda
 display_name: "CUDA Tests"
 
 # Docker image for this hardware
-ci_image: localhost:5000/flagscale:cuda12.8.1-cudnn9.7.1-python3.12-torch2.7.1-time2510131515
-ci_train_image: localhost:5000/flagscale-train:dev-cu128-py3.12-20260228210721
-ci_inference_image: localhost:5000/flagscale-inference:dev-cu128-py3.12-20260302102033
+ci_image: localhost:5000/flagscale:cuda12.8.1-cudnn9.7.1-python3.12-torch2.7.1-time2510131515-pre
+ci_train_image: localhost:5000/flagscale-train:dev-cu128-py3.12
+ci_inference_image: localhost:5000/flagscale-inference:dev-cu128-py3.12
 
 # Runner labels for this hardware
 runner_labels:

diff --git a/.github/workflows/all_tests_common.yml b/.github/workflows/all_tests_common.yml
@@ -99,177 +99,177 @@ jobs:
           # Load configuration and group tests by task
           load_platform_config "$PLATFORM"
 
-  unit_tests:
-    needs: checkout_and_config
-    strategy:
-      fail-fast: false
-      matrix:
-        device: ${{ fromJson(needs.checkout_and_config.outputs.device_types) }}
-    uses: ./.github/workflows/unit_tests_common.yml
-    name: unit_tests
-    with:
-      platform: ${{ inputs.platform }}
-      device: ${{ matrix.device }}
-      image: ${{ needs.checkout_and_config.outputs.ci_train_image }}
-      runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
-      container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
-      container_options: ${{ needs.checkout_and_config.outputs.container_options }}
-      source_artifact: flagscale-source-${{ github.sha }}
-      pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
-      env_name: ${{ needs.checkout_and_config.outputs.env_name_train }}
-      env_path: ${{ needs.checkout_and_config.outputs.env_path }}
-
-  functional_tests_train:
-    needs:
-      - checkout_and_config
-      - unit_tests
-    if: fromJson(needs.checkout_and_config.outputs.train_test_matrix)[0] != null
-    uses: ./.github/workflows/functional_tests_train.yml
-    with:
-      platform: ${{ inputs.platform }}
-      test_matrix: ${{ needs.checkout_and_config.outputs.train_test_matrix }}
-      image: ${{ needs.checkout_and_config.outputs.ci_train_image }}
-      runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
-      container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
-      container_options: ${{ needs.checkout_and_config.outputs.container_options }}
-      source_artifact: flagscale-source-${{ github.sha }}
-      pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
-      env_name: ${{ needs.checkout_and_config.outputs.env_name_train }}
-      env_path: ${{ needs.checkout_and_config.outputs.env_path }}
+  # unit_tests:
+  #   needs: checkout_and_config
+  #   strategy:
+  #     fail-fast: false
+  #     matrix:
+  #       device: ${{ fromJson(needs.checkout_and_config.outputs.device_types) }}
+  #   uses: ./.github/workflows/unit_tests_common.yml
+  #   name: unit_tests
+  #   with:
+  #     platform: ${{ inputs.platform }}
+  #     device: ${{ matrix.device }}
+  #     image: ${{ needs.checkout_and_config.outputs.ci_train_image }}
+  #     runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
+  #     container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
+  #     container_options: ${{ needs.checkout_and_config.outputs.container_options }}
+  #     source_artifact: flagscale-source-${{ github.sha }}
+  #     pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
+  #     env_name: ${{ needs.checkout_and_config.outputs.env_name_train }}
+  #     env_path: ${{ needs.checkout_and_config.outputs.env_path }}
 
-  functional_tests_hetero_train:
-    needs:
-      - checkout_and_config
-      - unit_tests
-    if: fromJson(needs.checkout_and_config.outputs.hetero_train_test_matrix)[0] != null
-    uses: ./.github/workflows/functional_tests_hetero_train.yml
-    with:
-      platform: ${{ inputs.platform }}
-      test_matrix: ${{ needs.checkout_and_config.outputs.hetero_train_test_matrix }}
-      image: ${{ needs.checkout_and_config.outputs.ci_train_image }}
-      runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
-      container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
-      container_options: ${{ needs.checkout_and_config.outputs.container_options }}
-      source_artifact: flagscale-source-${{ github.sha }}
-      pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
-      env_name: ${{ needs.checkout_and_config.outputs.env_name_train }}
-      env_path: ${{ needs.checkout_and_config.outputs.env_path }}
+  # functional_tests_train:
+  #   needs:
+  #     - checkout_and_config
+  #     - unit_tests
+  #   if: fromJson(needs.checkout_and_config.outputs.train_test_matrix)[0] != null
+  #   uses: ./.github/workflows/functional_tests_train.yml
+  #   with:
+  #     platform: ${{ inputs.platform }}
+  #     test_matrix: ${{ needs.checkout_and_config.outputs.train_test_matrix }}
+  #     image: ${{ needs.checkout_and_config.outputs.ci_train_image }}
+  #     runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
+  #     container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
+  #     container_options: ${{ needs.checkout_and_config.outputs.container_options }}
+  #     source_artifact: flagscale-source-${{ github.sha }}
+  #     pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
+  #     env_name: ${{ needs.checkout_and_config.outputs.env_name_train }}
+  #     env_path: ${{ needs.checkout_and_config.outputs.env_path }}
 
-  # NOTE: Inference, serve, and rl functional tests are temporarily disabled
-  functional_tests_inference:
-    needs:
-      - checkout_and_config
-      - unit_tests
-    if: fromJson(needs.checkout_and_config.outputs.inference_test_matrix)[0] != null
-    uses: ./.github/workflows/functional_tests_inference.yml
-    with:
-      platform: ${{ inputs.platform }}
-      test_matrix: ${{ needs.checkout_and_config.outputs.inference_test_matrix }}
-      image: ${{ needs.checkout_and_config.outputs.ci_inference_image }}
-      runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
-      container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
-      container_options: ${{ needs.checkout_and_config.outputs.container_options }}
-      source_artifact: flagscale-source-${{ github.sha }}
-      pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
-      env_name: ${{ needs.checkout_and_config.outputs.env_name_inference }}
-      env_path: ${{ needs.checkout_and_config.outputs.env_path }}
+  # functional_tests_hetero_train:
+  #   needs:
+  #     - checkout_and_config
+  #     - unit_tests
+  #   if: fromJson(needs.checkout_and_config.outputs.hetero_train_test_matrix)[0] != null
+  #   uses: ./.github/workflows/functional_tests_hetero_train.yml
+  #   with:
+  #     platform: ${{ inputs.platform }}
+  #     test_matrix: ${{ needs.checkout_and_config.outputs.hetero_train_test_matrix }}
+  #     image: ${{ needs.checkout_and_config.outputs.ci_train_image }}
+  #     runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
+  #     container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
+  #     container_options: ${{ needs.checkout_and_config.outputs.container_options }}
+  #     source_artifact: flagscale-source-${{ github.sha }}
+  #     pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
+  #     env_name: ${{ needs.checkout_and_config.outputs.env_name_train }}
+  #     env_path: ${{ needs.checkout_and_config.outputs.env_path }}
 
-  functional_tests_serve:
-    needs:
-      - checkout_and_config
-      - unit_tests
-    if: fromJson(needs.checkout_and_config.outputs.serve_test_matrix)[0] != null
-    uses: ./.github/workflows/functional_tests_serve.yml
-    with:
-      platform: ${{ inputs.platform }}
-      test_matrix: ${{ needs.checkout_and_config.outputs.serve_test_matrix }}
-      image: ${{ needs.checkout_and_config.outputs.ci_inference_image }}
-      runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
-      container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
-      container_options: ${{ needs.checkout_and_config.outputs.container_options }}
-      source_artifact: flagscale-source-${{ github.sha }}
-      pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
-      env_name: ${{ needs.checkout_and_config.outputs.env_name_serve }}
-      env_path: ${{ needs.checkout_and_config.outputs.env_path }}
+  # # NOTE: Inference, serve, and rl functional tests are temporarily disabled
+  # functional_tests_inference:
+  #   needs:
+  #     - checkout_and_config
+  #     - unit_tests
+  #   if: fromJson(needs.checkout_and_config.outputs.inference_test_matrix)[0] != null
+  #   uses: ./.github/workflows/functional_tests_inference.yml
+  #   with:
+  #     platform: ${{ inputs.platform }}
+  #     test_matrix: ${{ needs.checkout_and_config.outputs.inference_test_matrix }}
+  #     image: ${{ needs.checkout_and_config.outputs.ci_inference_image }}
+  #     runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
+  #     container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
+  #     container_options: ${{ needs.checkout_and_config.outputs.container_options }}
+  #     source_artifact: flagscale-source-${{ github.sha }}
+  #     pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
+  #     env_name: ${{ needs.checkout_and_config.outputs.env_name_inference }}
+  #     env_path: ${{ needs.checkout_and_config.outputs.env_path }}
 
-  # functional_tests_rl:
+  # functional_tests_serve:
   #   needs:
   #     - checkout_and_config
   #     - unit_tests
-  #   if: fromJson(needs.checkout_and_config.outputs.rl_test_matrix)[0] != null
-  #   uses: ./.github/workflows/functional_tests_rl.yml
+  #   if: fromJson(needs.checkout_and_config.outputs.serve_test_matrix)[0] != null
+  #   uses: ./.github/workflows/functional_tests_serve.yml
   #   with:
   #     platform: ${{ inputs.platform }}
-  #     test_matrix: ${{ needs.checkout_and_config.outputs.rl_test_matrix }}
-  #     image: ${{ needs.checkout_and_config.outputs.ci_image }}
+  #     test_matrix: ${{ needs.checkout_and_config.outputs.serve_test_matrix }}
+  #     image: ${{ needs.checkout_and_config.outputs.ci_inference_image }}
   #     runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
   #     container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
   #     container_options: ${{ needs.checkout_and_config.outputs.container_options }}
   #     source_artifact: flagscale-source-${{ github.sha }}
   #     pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
-  #     env_name: ${{ needs.checkout_and_config.outputs.env_name_rl }}
+  #     env_name: ${{ needs.checkout_and_config.outputs.env_name_serve }}
   #     env_path: ${{ needs.checkout_and_config.outputs.env_path }}
 
-  all_tests_complete:
-    defaults:
-      run:
-        shell: bash
-    needs:
-      - checkout_and_config
-      - unit_tests
-      - functional_tests_train
-      - functional_tests_hetero_train
-      # NOTE: Disabled tests removed from needs
-      # - functional_tests_inference
-      # - functional_tests_serve
-      # - functional_tests_rl
-    runs-on: ubuntu-latest
-    if: always()
-    steps:
-      - name: Verify all tests passed
-        run: |
-          # Check all test jobs (skip if not run)
-          failed=false
+  # # functional_tests_rl:
+  # #   needs:
+  # #     - checkout_and_config
+  # #     - unit_tests
+  # #   if: fromJson(needs.checkout_and_config.outputs.rl_test_matrix)[0] != null
+  # #   uses: ./.github/workflows/functional_tests_rl.yml
+  # #   with:
+  # #     platform: ${{ inputs.platform }}
+  # #     test_matrix: ${{ needs.checkout_and_config.outputs.rl_test_matrix }}
+  # #     image: ${{ needs.checkout_and_config.outputs.ci_image }}
+  # #     runs_on: ${{ needs.checkout_and_config.outputs.runs_on }}
+  # #     container_volumes: ${{ needs.checkout_and_config.outputs.container_volumes }}
+  # #     container_options: ${{ needs.checkout_and_config.outputs.container_options }}
+  # #     source_artifact: flagscale-source-${{ github.sha }}
+  # #     pkg_mgr: ${{ needs.checkout_and_config.outputs.pkg_mgr }}
+  # #     env_name: ${{ needs.checkout_and_config.outputs.env_name_rl }}
+  # #     env_path: ${{ needs.checkout_and_config.outputs.env_path }}
 
-          if [ "${{ needs.unit_tests.result }}" != "success" ]; then
-            echo "❌ Unit tests failed"
-            failed=true
-          fi
+  # all_tests_complete:
+  #   defaults:
+  #     run:
+  #       shell: bash
+  #   needs:
+  #     - checkout_and_config
+  #     - unit_tests
+  #     - functional_tests_train
+  #     - functional_tests_hetero_train
+  #     # NOTE: Disabled tests removed from needs
+  #     # - functional_tests_inference
+  #     # - functional_tests_serve
+  #     # - functional_tests_rl
+  #   runs-on: ubuntu-latest
+  #   if: always()
+  #   steps:
+  #     - name: Verify all tests passed
+  #       run: |
+  #         # Check all test jobs (skip if not run)
+  #         failed=false
 
-          # Only check functional tests if they ran
-          if [ "${{ needs.functional_tests_train.result }}" != "success" ] && \
-             [ "${{ needs.functional_tests_train.result }}" != "skipped" ]; then
-            echo "❌ Training functional tests failed"
-            failed=true
-          fi
+  #         if [ "${{ needs.unit_tests.result }}" != "success" ]; then
+  #           echo "❌ Unit tests failed"
+  #           failed=true
+  #         fi
 
-          if [ "${{ needs.functional_tests_hetero_train.result }}" != "success" ] && \
-             [ "${{ needs.functional_tests_hetero_train.result }}" != "skipped" ]; then
-            echo "❌ Heterogeneous training functional tests failed"
-            failed=true
-          fi
+  #         # Only check functional tests if they ran
+  #         if [ "${{ needs.functional_tests_train.result }}" != "success" ] && \
+  #            [ "${{ needs.functional_tests_train.result }}" != "skipped" ]; then
+  #           echo "❌ Training functional tests failed"
+  #           failed=true
+  #         fi
 
-          # NOTE: Inference, serve, and rl checks disabled
-          # if [ "${{ needs.functional_tests_inference.result }}" != "success" ] && \
-          #    [ "${{ needs.functional_tests_inference.result }}" != "skipped" ]; then
-          #   echo "❌ Inference functional tests failed"
-          #   failed=true
-          # fi
+  #         if [ "${{ needs.functional_tests_hetero_train.result }}" != "success" ] && \
+  #            [ "${{ needs.functional_tests_hetero_train.result }}" != "skipped" ]; then
+  #           echo "❌ Heterogeneous training functional tests failed"
+  #           failed=true
+  #         fi
 
-          # if [ "${{ needs.functional_tests_serve.result }}" != "success" ] && \
-          #    [ "${{ needs.functional_tests_serve.result }}" != "skipped" ]; then
-          #   echo "❌ Serve functional tests failed"
-          #   failed=true
-          # fi
+  #         # NOTE: Inference, serve, and rl checks disabled
+  #         # if [ "${{ needs.functional_tests_inference.result }}" != "success" ] && \
+  #         #    [ "${{ needs.functional_tests_inference.result }}" != "skipped" ]; then
+  #         #   echo "❌ Inference functional tests failed"
+  #         #   failed=true
+  #         # fi
 
-          # if [ "${{ needs.functional_tests_rl.result }}" != "success" ] && \
-          #    [ "${{ needs.functional_tests_rl.result }}" != "skipped" ]; then
-          #   echo "❌ RL functional tests failed"
-          #   failed=true
-          # fi
+  #         # if [ "${{ needs.functional_tests_serve.result }}" != "success" ] && \
+  #         #    [ "${{ needs.functional_tests_serve.result }}" != "skipped" ]; then
+  #         #   echo "❌ Serve functional tests failed"
+  #         #   failed=true
+  #         # fi
 
-          if [ "$failed" = "true" ]; then
-            exit 1
-          fi
+  #         # if [ "${{ needs.functional_tests_rl.result }}" != "success" ] && \
+  #         #    [ "${{ needs.functional_tests_rl.result }}" != "skipped" ]; then
+  #         #   echo "❌ RL functional tests failed"
+  #         #   failed=true
+  #         # fi
+
+  #         if [ "$failed" = "true" ]; then
+  #           exit 1
+  #         fi
 
-          echo "✅ All tests completed successfully!"
+  #         echo "✅ All tests completed successfully!"
diff --git a/.github/workflows/all_tests_cuda.yml b/.github/workflows/all_tests_cuda.yml
@@ -1,10 +1,25 @@
 name: cuda_tests
 
 on:
+  # Called by Build Docker Images - CUDA workflow
+  workflow_call:
+
   push:
     branches: ["main"]
+    paths-ignore:
+      - 'docker/cuda/**'
+      - 'docker/build.sh'
+      - 'tools/install/**'
+      - 'requirements/**'
+      - '.github/workflows/build_image_cuda.yml'
   pull_request:
     branches: ["main"]
+    paths-ignore:
+      - 'docker/cuda/**'
+      - 'docker/build.sh'
+      - 'tools/install/**'
+      - 'requirements/**'
+      - '.github/workflows/build_image_cuda.yml'
 
 concurrency:
   group: ${{ github.workflow }}-${{ github.event.pull_request.number || github.ref }}-${{ github.actor }}