next up previous contents
Next: Funzione costospecializzazione Up: L'algoritmo di stereo-visione Previous: L'algoritmo di stereo-visione

Funzione di costo, caso generale

L'algoritmo di stereo di Cox e al. si presta a trovare gli accoppiamenti migliori sia di pixel, sia di strutture più complesse (edge, segmenti, ecc.) descrivibili mediante vettori. In questa sezione deriveremo la funzione di costo per accoppiare due generiche misure, intese come vettori, e poi la funzione globale da minimizzare. In gif la funzione verrà specializzazata al più semplice caso in cui le misure sono l'intesità luminosa dei pixel.

Denotiamo le due telecamere con tex2html_wrap_inline2705 e con tex2html_wrap_inline2707 l'insieme delle misure lungo le due linee epipolari: tex2html_wrap_inline2709 dove tex2html_wrap_inline2711 è il numero di misure dalla telecamera s e tex2html_wrap_inline2715 è una misura ``fantoccio'', utilizzata per indicare l'occlusione della misura accoppiata con essa. Ognuna delle misure tex2html_wrap_inline2717 si suppone essere affetta da rumore addittivo gaussiano.

La condizione che la misura tex2html_wrap_inline2719 dalla telecamera 1 e tex2html_wrap_inline2721 dalla telecamera 2 siano immagini dello stesso punto fisico tex2html_wrap_inline2723 , cioè che le due misure corrispondono, viene indicata con tex2html_wrap_inline2725 . Il caso in cui la misura tex2html_wrap_inline2727 dalla telecamera 1 non abbia corrispondenti nella telecamera 2 è denotato con tex2html_wrap_inline2729 . Il caso in cui la misura tex2html_wrap_inline2731 dalla telecamera 1 non abbia corrispondenti nella telecamera 1 è denotato con tex2html_wrap_inline2733 .

Per calcolare il costo locale di associare due misure tex2html_wrap_inline2735 e tex2html_wrap_inline2737 , esprimiamo la probabilità che la coppia di misure tex2html_wrap_inline2739 siano originate dallo stesso punto fisico tex2html_wrap_inline2741 con

eqnarray1169

dove tex2html_wrap_inline2743 se una misura non viene accoppiata, tex2html_wrap_inline2745 altrimenti. Il termine tex2html_wrap_inline2747 è la funzione di densità della distribuzione che rappresenta la probabilità che la misura z sia originata da un punto tex2html_wrap_inline2751 nella scena. Il parametro tex2html_wrap_inline2753 è la probabilità di rivelare una misura originata dal punto tex2html_wrap_inline2755 mediante il sensore s. Questo parametro è funzione del numero di occlusioni, rumore, ecc. Quindi tex2html_wrap_inline2759 è la probabilità che un punto sia occluso. Assumendo che le misure di intensità tex2html_wrap_inline2761 siano normalmente distribuite attorno al loro valore reale z, allora

  equation1200

dove d è la dimensione dei vettori tex2html_wrap_inline2767 e tex2html_wrap_inline2769 è la matrice di covarianza associata all'errore tex2html_wrap_inline2771 . Siccome il valore vero, tex2html_wrap_inline2773 , è sconosciuto, lo approssimiamo mediante la stima di massima verosimiglianza tex2html_wrap_inline2775 ottenuta dalla coppia di misure tex2html_wrap_inline2777 , data da

  equation1225

dove tex2html_wrap_inline2779 è la covarianza associata alla misura tex2html_wrap_inline2781 .

Dal costo del singolo accoppiamento tex2html_wrap_inline2783 , è necessario determinare il costo totale di tutti gli accoppiamenti. Denotiamo con tex2html_wrap_inline2785 un accoppiamento fattibile, e con tex2html_wrap_inline2787 l'insieme di tutte le soluzioni fattibili, cioè tex2html_wrap_inline2789 . Se tex2html_wrap_inline2791 denota il caso in cui tutte le misure sono disaccoppiate, cioè che non ci sono punti in comune tra le due immagini, allora vogliamo trovare gli accoppiamenti o la partizione che massimizza tex2html_wrap_inline2793 , dove la probabilità tex2html_wrap_inline2795 di una partizione è definita come

displaymath1251

tex2html_wrap_inline2797 è l'angolo visivo della telecamera s e tex2html_wrap_inline2801 il numero delle misure della telecamera s disaccoppiate nella partizione tex2html_wrap_inline2805 . La probabilità di nessun accoppiamento, tex2html_wrap_inline2807 è dato dunque da tex2html_wrap_inline2809 , dove N e M sono il numero totale delle misure, rispettivamente nella prima e seconda immagine.

La massimizzazione di tex2html_wrap_inline2815 è equivalente alla minimizzazione di

displaymath1270

da cui deriva

  eqnarray1274

I primi due termini della sommatoria dell'equazione gif sono il costo di accoppiare due misure, mentre gli ultimi due termini sono i costi delle occlusioni nell'immagine sinistra o nell'immagine destra, rispettivamente. Chiaramente, come la probabilità di occlusione tex2html_wrap_inline2817 diventa piccola, il costo di non accoppiare delle misure cresce.



next up previous contents
Next: Funzione costospecializzazione Up: L'algoritmo di stereo-visione Previous: L'algoritmo di stereo-visione



Alex Cozzi
Fri Dec 8 19:08:26 MET 1995