Sono algoritmi che procedono in una sola fase, operano direttamente sui valori di intensità delle immagini, cercando le aree corrispondenti. L'immagine viene trattata dividendola in ``finestre'' quadrate, delle quali si cerca il corrispondente facendo uso di operatori di confronto. Tra i più utilizzati vi sono gli operatori di correlazione, di correlazione normalizzata, gli operatori di differenza, di distanza quadratica, ecc..
La scelta dell'operatore avviene facendo un bilancio tra il costo computazionale e le caratteristiche desiderate: indipendenza dalle differenze di luminosità, sensibilità al rumore, facilità di realizzazione.
Un modo efficace di ridure il costo computazionale di questi algoritmi
è di restringere la ricerca dei corrispondenti alle linee epipolari:
a ogni pixel in un immagine corrispone un insieme di possibili pixel
corrispondenti sull'altra immagine, questi pixel sono disposti lungo
una linea, alla quale viene dato il nome di linea epipolare
(fig.
). Questa linea è data dall'intersezione
tra due piani. Il primo piano è individuato da tre punti: i due
centri ottici delle telecamere e il punto fisico del quale si stanno
cercando le immagini. Il secondo piano è il piano
dell'immagine. (fig.
)
Figure: Pixel, linea epipolare corrispondente e possibili pixel
corrispondenti.
Figure: La linea epipolare è data dall'intersezione del piano
individuato dai centri ottici e l'oggetto e i piani immagine.
Il vincolo epipolare, derivando direttamente dalla geometria del sistema di visione, è considerato un vincolo ``oggettivamente giustificabile''.
L'utilizzo di operatori estesi su finestre di immagine introduce un
parametro libero aggiuntivo nella progettazione di questi algoritmi:
la scelta della dimensione della finestra. Sono stati proposti schemi
adattivi per la scelta delle dimensioni dell'intorno [12],
tuttavia la strada più seguita resta quella di stabilire a priori
una dimensione fissa, di solito si usano intorni quadrati
,
o
.
Gli operatori di confronto si trovano in difficoltà nelle aree di immagine di intensità uniforme, sulle quali non è possibile effettuare misure di somiglianza affidabili. Per ``riempire'' anche queste aree si introduce un vincolo di ``lisciezza'' (smoothness ), consistente nel supporre che gli oggetti presenti nell'immagine siano per lo più costituiti da superfici continue, con lenti cambiamenti di profondità. Questo vincolo porta ad assegnare distanze simili a pixel vicini.
Purtroppo l'assunzione di lisciezza non è valida proprio nelle aree che portano le informazioni più interessanti dell'immagine: i confini tra un oggetto e l'altro. Gli algoritmi che introducono questo vincolo tendono a smussare i confini degli oggetti, non riuscendo a seguirne le discontinuità.
L'inconveniente può venire in parte ovviato inserendo ulteriori passi di elaborazione e ulteriori assunzioni, a scapito della velocità e della generalità dell'algoritmo, e con l'ulteriore l'introduzione di parametri liberi, di difficile determinazione.
Riassumendo, gli algoritmi area-based
Le assunzioni di lisciezza e altri vincoli che vengono sfruttati da questi algoritmi permettono di misurare le distanze anche in parti di immagine che gli algoritmi feature-based non sono in grado di analizzare, tuttavia, quando le assunzioni vengono violate, si hanno risultati palesemente sbagliati. Per questo motivo è importante prevedere anche metodi per misure l'affidabilità dei risultati forniti da questi algoritmi.