next up previous contents
Next: Limiti dell'approccio ricostruttivo Up: Metodologie per la visione Previous: Metodologie per la visione

Il paradigma di Marr

Marr considera la visione un processo di elaborazione di informazione, intendendo con processo ``una trasformazione da una rappresentazione a un'altra'' gif. Più precisamente, la visione viene definita come ``un processo che produce, a partire da immagini del mondo esterno, una descrizione utile al percipiente e ripulita dell'informazione irrilevante'' gif.

L'ipotesi di Marr è che sia possibile studiare la percezione visiva in generale, come un processo finalizzato a descrivere scene. Questo approccio è conosciuto col nome di recovery school . Secondo questa scuola è richiesta una teoria che pone tra gli obiettivi primari della visione la derivazione di una rappresentazione. Più esplicitamente ``Se fossimo in grado, mediante la visione, di creare un accurata rappresentazione del mondo tridimensionale e delle sue proprietà, allora, usando questa informazione, potremmo svolgere qualunque compito visivo'' gif.

Il maggior contributo di Marr è consistito nella sua proposta metodologica che espone i tre differenti livelli ai quali un sistema di elaborazione di informazione deve essere compreso per poter affermare che esso è stato compreso completamente. Questi tre livelli sono: teoria computazionale, rappresentazione e algoritmi, realizzazione fisica.

Teoria Computazionale
Qual'è il fine della computazione? Perché è appropriato? Qual'è la logica della strategia mediante la quale può essere svolto?

Rappresentazione e algoritmi
Come può essere implementata questa teoria computazionale? In particolare, quali sono le rappresentazioni degli ingressi e delle uscite, e qual'è l'algoritmo che descrive la trasformazione dagli uni alle altre?

Realizzazione fisica
Come possono essere realizzati fisicamente la rappresentazione e gli algoritmi?

Il tentativo di Marr è di astrarre il processo visivo dalle caratteristiche fisiche e dagli scopi dell'osservatore. I vincoli legati agli scopi da conseguire sono relegati ai livelli superiori, dove avviene l'interpretazione delle immagini, e i vincoli connaturati all'osservatore non sono presi in considerazione. I tre livelli di analisi concorrono all'obiettivo di costruire un'efficiente descrizione simbolica dalle immagini.

Diversi lavori successivi, basati sull'impostazione di Marr, hanno evidenziato che molti dei problemi che devono essere risolti per effettuare la ricostruzione di scene, come la determinazione del movimento, la ricostruzione delle forme dall'ombreggiatura, l'interpolazione di superfici, l'estrazione dei bordi, ecc., rientrano nella classe dei problemi sottovincolati, il cui problema inverso frequentemente è mal posto o mal condizionato. Questo ha dato impulso a molti approcci basati sulla teoria della regolarizzazione, favorendo l'introduzione di strumenti matematici sofisticati, spesso però, ha comportato l'assunzione di ipotesi irrealistiche (rigidità, continuità delle superfici, ecc.) per arrivare alla soluzione del problema.





next up previous contents
Next: Limiti dell'approccio ricostruttivo Up: Metodologie per la visione Previous: Metodologie per la visione



Alex Cozzi
Fri Dec 8 19:08:26 MET 1995