Sisteme avansate de robotică medicală: localizarea ATHENA, estimarea forței sensorless și navigație dentară markerless

Cercetările vizează găsirea de soluții inovatoare pentru chirurgia minim invazivă și implantologia robotizată, eliminând necesitatea senzorilor hardware complecși prin utilizarea tehnicilor avansate de Computer Vision.

Localizarea și poziționarea automată a robotului ATHENA

Obiectiv: Realizarea unei localizări 3D în timp real, fără markeri fizici, pentru a permite andocarea automată și pentru a reduce variabilitatea configurării. Sistemul primește date de la o cameră RGB-D.
Arhitectură de detecție: S-a utilizat modelul YOLO11m (ales în defavoarea versiunilor YOLO8m/9m/10m) pentru detecția a 3 clase specifice: trocarul, instrumentul laparoscopic și modulul paralel (PM) al robotului.
Estimare 3D: Sistemul convertește coordonatele pixelilor din bounding box-urile 2D și informația de adâncime (depth) în coordonate 3D pentru componentele cheie.
Performanță și latență: Evaluarea a indicat un mAP de aproximativ 0.9947, o precizie de 0.9879 și un recall de 0.9849. Latența de inferență este de aproximativ 14.7 ms, cu o latență end-to-end de aproximativ 67 ms.
Impact: Soluția obține o poziționare cu o marjă de eroare de $\le 0.8$ mm și asigură o reducere de 42% a timpului de setup comparativ cu alinierea manuală.

Ahitectura soluției propuse: de la achiziția datelor la controlul mișcării robotului

Estimarea forței „sensorless” în chirurgia minim invazivă

Obiectiv: Estimarea forței de interacțiune instrument-țesut exclusiv din date video, eliminând necesitatea unui senzor distal. Intrarea constă într-un singur cadru endoscopic RGB.
Model: O rețea CNN ușoară, bazată pe EfficientNetV2B0, adaptată pentru regresia forței pentru a oferi o singură ieșire scalară în Newtoni.
Set de date: Antrenamentul s-a bazat pe 40 de clipuri video (9691 de cadre etichetate) obținute din teste in vitro pe esofag, cu etichete de forță în intervalul 0-5 N. Ground-truth-ul a fost preluat de la un senzor Robotiq FT300 montat pe un robot KUKA iiwa LBR 7 R800.
Performanță tehnică: Modelul raportează o eroare medie absolută (MAE) de 0.017 N și o eroare pătratică medie (MSE) de 0.0004 N².
Deployment: Inferența durează aproximativ 12.34 ms, funcționând la o rată de actualizare de aproximativ 6 Hz, cu o latență de predicție de 15-20 ms.
Integrare hardware: Algoritmul operează ca plug-in pe platforma PARA-SILSROB și controlează un dispozitiv haptic Force Dimension Omega.7.

Modelul **EfficientNetV2B0** pentru estimarea forței

Percepție „markerless” pentru navigația în implantologia dentară

Navigație dinamică și control (obiectiv 1): Sistemul folosește un detector YOLO antrenat pe 752 de imagini intraorale pentru a identifica repere anatomice. Această detecție atinge o precizie de 91.2%, recall de 88.5% și mAP@0.5 de 91.2%.
Aliniere și arhitectură: Se utilizează o metodă de aliniere rigidă bazată pe SVD, alături de o rafinare opțională de tip ICP, pentru a raporta poziția la modelele STL generate preoperator din scanările CBCT. O interfață Unity centralizează vizualizarea, în timp ce un server trimite corecțiile de navigație către un robot Kuka Sunrise.
Segmentare la nivel de dinte (obiectiv 2): Pentru a obține o geometrie stabilă a dinților în prezența ocluziilor și reflexiilor, a fost implementat modelul single-stage YOLOv8-seg. Antrenamentul a fost efectuat pe 420 de imagini RGB cu adnotări manuale prin poligoane.
Performanță segmentare: Sistemul a obținut un IoU de aproximativ 0.88 și un indice DSC de aproximativ 0.92. Evaluarea de nivel instanță (Mask mAP@0.5) a fost de 0.907.
Avantaj arhitectural: Fluxul single-stage YOLO-seg generează măști mult mai stabile și o latență considerabil redusă comparativ cu sistemul de tip YOLO+SAM, făcându-l ideal pentru utilizarea în timp real.