Namespace NT2I.ONNX.Architectures.RFDetr

Classes

Architecture de haut niveau pour les modèles de détection RF-DETR.

RF-DETR (Roboflow Detection TRansformer) est un détecteur d'objets temps-réel basé sur DETR, qui produit deux sorties distinctes :

boxes [B, N, 4] — boîtes en (cx, cy, w, h) normalisé.
logits [B, N, C] — scores bruts de classe.

Contrairement à YOLO, RF-DETR ne requiert pas de NMS.

Pipeline de pré-traitement (identique à SAM2) : normalisation ImageNet + StretchResize → NCHW float32. Cela permet un cache hit dans CudaSharedImageContext si RF-DETR et SAM2 partagent le même Hub.

Nom des tenseurs d'entrée/sortie (convention RF-DETR ONNX standard, à vérifier avec Netron) :

Entrée : "images" (index 0).
Sortie 0 : "boxes" — [B, N, 4].
Sortie 1 : "logits" — [B, N, C].

Si le modèle exporte des noms différents, utiliser les surcharges par index.

RFDetrSegmentation

Architecture de haut niveau pour les modèles de segmentation d'instance RF-DETR.

Étend RFDetrDetection avec la prise en charge d'un troisième tenseur de sortie : masks [B, N, H', W'] — masques basse résolution à upsampler par image.

Convention des tenseurs de sortie (à vérifier avec Netron sur le modèle exporté) :

Index 0 : boxes [B, N, 4].
Index 1 : logits [B, N, C].
Index 2 : masks [B, N, H', W'].

Le pré-traitement est identique à RFDetrDetection (ImageNet + StretchResize), donc un seul kernel CUDA est exécuté en mode Hub même si les deux variants sont enregistrés simultanément.