Namespace NT2I.ONNX.Architectures.RFDetr
Classes
- RFDetrDetection
Architecture de haut niveau pour les modèles de détection RF-DETR.
RF-DETR (Roboflow Detection TRansformer) est un détecteur d'objets temps-réel basé sur DETR, qui produit deux sorties distinctes :
boxes[B, N, 4]— boîtes en (cx, cy, w, h) normalisé.logits[B, N, C]— scores bruts de classe.
Pipeline de pré-traitement (identique à SAM2) : normalisation ImageNet + StretchResize → NCHW float32. Cela permet un cache hit dans
CudaSharedImageContextsi RF-DETR et SAM2 partagent le même Hub.Nom des tenseurs d'entrée/sortie (convention RF-DETR ONNX standard, à vérifier avec Netron) :
- Entrée :
"images"(index 0). - Sortie 0 :
"boxes"—[B, N, 4]. - Sortie 1 :
"logits"—[B, N, C].
- RFDetrSegmentation
Architecture de haut niveau pour les modèles de segmentation d'instance RF-DETR.
Étend RFDetrDetection avec la prise en charge d'un troisième tenseur de sortie :
masks [B, N, H', W']— masques basse résolution à upsampler par image.Convention des tenseurs de sortie (à vérifier avec Netron sur le modèle exporté) :
- Index 0 :
boxes[B, N, 4]. - Index 1 :
logits[B, N, C]. - Index 2 :
masks[B, N, H', W'].
Le pré-traitement est identique à RFDetrDetection (ImageNet + StretchResize), donc un seul kernel CUDA est exécuté en mode Hub même si les deux variants sont enregistrés simultanément.
- Index 0 :