Namespace NT2I.ONNX.Architectures.RFDetr

Classes

RFDetrDetection

Architecture de haut niveau pour les modèles de détection RF-DETR.

RF-DETR (Roboflow Detection TRansformer) est un détecteur d'objets temps-réel basé sur DETR, qui produit deux sorties distinctes :

  • boxes [B, N, 4] — boîtes en (cx, cy, w, h) normalisé.
  • logits [B, N, C] — scores bruts de classe.
Contrairement à YOLO, RF-DETR ne requiert pas de NMS.

Pipeline de pré-traitement (identique à SAM2) : normalisation ImageNet + StretchResize → NCHW float32. Cela permet un cache hit dans CudaSharedImageContext si RF-DETR et SAM2 partagent le même Hub.

Nom des tenseurs d'entrée/sortie (convention RF-DETR ONNX standard, à vérifier avec Netron) :

  • Entrée : "images" (index 0).
  • Sortie 0 : "boxes"[B, N, 4].
  • Sortie 1 : "logits"[B, N, C].
Si le modèle exporte des noms différents, utiliser les surcharges par index.
RFDetrSegmentation

Architecture de haut niveau pour les modèles de segmentation d'instance RF-DETR.

Étend RFDetrDetection avec la prise en charge d'un troisième tenseur de sortie : masks [B, N, H', W'] — masques basse résolution à upsampler par image.

Convention des tenseurs de sortie (à vérifier avec Netron sur le modèle exporté) :

  • Index 0 : boxes [B, N, 4].
  • Index 1 : logits [B, N, C].
  • Index 2 : masks [B, N, H', W'].

Le pré-traitement est identique à RFDetrDetection (ImageNet + StretchResize), donc un seul kernel CUDA est exécuté en mode Hub même si les deux variants sont enregistrés simultanément.