Méthodologie d'annotation

Cogite applique une méthodologie d'annotation structurée en quatre piliers : guidelines précises, double annotation, contrôle qualité statistique, et calibration continue de l'équipe. Cette page documente nos standards pour nos clients qui veulent comprendre en profondeur comment nous opérons.

1. Guidelines d'annotation

Chaque projet démarre par la rédaction conjointe (avec votre équipe ML) d'un document de guidelines. Ce document de référence couvre :

2. Double annotation systématique

Sur tous nos projets en plan Production, chaque échantillon est annoté indépendamment par deux annotateurs. Les annotations divergentes sont arbitrées par un troisième annotateur senior. Cette redondance est essentielle pour la qualité finale et permet de mesurer l'inter-annotator agreement.

3. Métriques de qualité

Nous mesurons systématiquement :

Ces métriques sont communiquées dans un rapport hebdomadaire envoyé à votre équipe ML.

4. Calibration continue

Chaque semaine, nos annotateurs participent à des sessions de calibration où ils discutent des cas difficiles rencontrés. Ces sessions sont animées par le chef de projet IA et permettent d'affiner collectivement la compréhension des guidelines. C'est aussi l'occasion de faire remonter au client toute ambiguïté nécessitant une clarification.

Outils utilisés

Nous travaillons avec les principaux outils d'annotation du marché :

Formats de livraison

Nous livrons dans le format de votre choix : JSON, COCO, Pascal VOC, JSONL, YOLO, MS COCO Keypoints, CSV, ou tout format propriétaire spécifié dans le cahier des charges. Les livraisons sont accompagnées d'un dataset card documentant la composition, les statistiques de qualité et les conventions utilisées.