Frontiers in Psychology
- Bevezetés:
- Képintenzitások és a vizuális tér
- A velencei vak effektus
- A képintenzitások és a térbeli pozíciók együttesen változnak
- Perceived Surface Slant is Imprecise
- Sztereoszkopikus mélységérzékelés
- Az egyes pontok abszolút mélysége vizuálisan meghatározhatatlan
- Az érzékelt mélységkülönbségek pontatlanok
- A sztereoszkopikus felületi ferdeség pontatlan
- A felszín alakja egy érzékelési primitív
- Binokuláris diszparitás
- A diszparitás a képszerkezetet érinti
- A különbség a felszín alakját érinti
- A 2. rendű képszerkezet diszparitása
- Binocular Disparity in the Venetian Blind Effect
- Interdekütközésre vonatkozó nyilatkozat
Bevezetés:
A sztereoszkópos látás fontos információkat szolgáltat a környező világ térbeli szerkezetéről. A két szem nagyrészt hasonló optikai képet nyújt, de kissé eltérő nézőpontból. A két monokuláris kép közötti kis eltérések vizuálisan fontos információt jelentenek, amely egyik képből sem áll rendelkezésre. A binokuláris látórendszer rendkívül érzékeny erre a sztereoszkópikus információra. De mi is pontosan a binokuláris diszparitás? A kérdés nem a terminológia, hanem a bemeneti információ. A bemenet azonosítása szükséges annak meghatározásához, hogy hogyan dolgozzuk fel ezt a bemenetet.
E probléma egyik aspektusa a “megfelelési probléma” – a két monokuláris kép megfelelő térbeli elemeinek azonosítása (Julesz, 1960, 1971; Marr és Poggio, 1976, 1979). E probléma természetére és fontosságára Julesz elegáns kísérletei világítottak rá a véletlenszerű pontokból álló sztereogramokkal. Ezek a véletlenszerű textúraminták nagyszámú azonos elemet tartalmaznak számtalan potenciális binokuláris megfeleléssel és diszparitással. Nyilvánvaló, hogy a megfelelő képi jellemzők nem lehetnek egyedi textúraelemek. A sima felületeken a lokális textúraelemek közötti kooperatív vizuális kölcsönhatások szükségesnek tűnnek a sztereopszishoz, amint azt Julesz (1960, 1971), valamint Marr és Poggio (1976, 1979) hangsúlyozta. A korrespondenciát eredményező vizuális folyamatok kutatása folytatódik (Blake és Wilson, 2011).
A megfelelési problémán túl azonban a binokuláris diszparitás a térbeli struktúra reprezentációját is magában foglalja. A megfelelő képi jellemzők térbeli pozícióit gyakran hipotetikus, anatómiailag meghatározott retinakoordinátákhoz viszonyítva reprezentálják; a diszparitást pedig e koordináták binokuláris különbségeként reprezentálják. Definíció szerint ezek a retinális koordináták függetlenek az optikai képszerkezettől.
Ez a térbeli reprezentáció azonban ellenőrizhető, plauzibilis alternatív hipotézisekkel. Jelen cikk a binokuláris diszparitás térbeli szerkezetére vonatkozó bizonyítékokat tekinti át. Lappin és Craft (1997, 2000) és Lappin et al. (2011) cikkei szintén relevánsak.
Amint azt Lappin et al. (2011) tárgyalja, a látási információ azonosításának két pszichofizikai kritériuma a felbontás és az invariancia. A felbontás a megkülönböztetés pontosságát foglalja magában, amelyet a variabilitás korlátoz. Röviden, mit lát a két szem a legjobban? Az információt és a geometriai struktúrát szintén az invariancia határozza meg – a megfigyelési körülmények (pl. a látási helyzet és a megvilágítás) azon transzformációcsoportjai, amelyek mellett invariánsak maradnak. Az ilyen invariancia kísérletileg tesztelhető.
Képintenzitások és a vizuális tér
A velencei vak effektus
A binokuláris diszparitás újbóli vizsgálatát több jelenség is motiválja. Az egyik motiváció a “velencei vak hatás” (röviden VBE) – ahol a nem különálló élekkel rendelkező függőleges rácsok dichoptikus intenzitáskülönbségei a 3D felület ferdeségének észlelt változását eredményezik. Úgy tűnik, a térbeli diszparitás nem szükséges.
Cibis és Haber (1951), Ogle (1962), valamint Howard és Rogers (2002) szerint a VBE nem igényli a sztereopszis elméleteinek felülvizsgálatát: A monokuláris intenzitásminták befolyásolhatják a térbeli pozíciójelzéseket – mivel a fényszórás vagy a nemlineáris vizuális jelzés befolyásolhatja a térbeli diszparitást.
A Filley és munkatársai (2011), Hetley és Stine (2011), valamint Dobias és Stine (2012) átfogó vizsgálatai azonban egyértelműen bizonyítják, hogy a VBE nem a térbeli pozíciók, hanem az intenzitások diszparitásából ered. Az eltérő intenzitások és az élek pozíciói additív hatással vannak az érzékelt mélységre; és a két eltérés kiolthatja egymást.
A VBE összhangban van más kísérleti bizonyítékokkal is, amelyek szerint a felszíni kiemelések és árnyalatok eltérései hozzájárulnak a 3D struktúra érzékeléséhez (Bülthoff és Mallot, 1988; Norman et al., 1995; Todd et al., 1997; Vuong et al., 2006; Nefs, 2008). A felületi struktúra befolyásolja a binokuláris diszparitást mind térben, mind árnyékolásban. A VBE egyike a számos bizonyítéknak arra, hogy a látás az információ mindkét dimenzióját használja.
A képintenzitások és a térbeli pozíciók együttesen változnak
A monokuláris képszerkezet az intenzitás térbeli variációit foglalja magában. Függetlenül attól, hogy a fizikai dimenziók, a tér és az intenzitás nem függetlenek vizuálisan.
Egy adott optikai jellemző (pl. él) térbeli helyzete ábrázolható egy független referenciakerethez viszonyítva vagy topológiailag, a környező képszerkezethez viszonyítva. Mindkét megközelítésre találunk példákat a látástudományban. A binokuláris diszparitás fogalma gyakran magában foglalja a térnek a benne lévő tárgyaktól és mintáktól független, intuitív fogalmát. Intuitív módon a retina anatómiája adhat ilyen térbeli koordinátákat.
Alternatív módon a térbeli viszonyok topológiája egy adott ponton többféleképpen is leírható. A topológiai paraméterek közé tartozik (a) a komplexitás (a pontok vagy régiók száma), (b) a dimenzionalitás és (c) a skála (a szomszédság mérete).
Egy ismerős topológiai leírás a Fourier-analízis. A Fourier-teljesítményspektrum a pontpárokban lévő képkontrasztok közötti korrelációkat foglalja magában. A Fourier-fázisspektrum a különböző hullámhosszok relatív pozícióit adja meg, ami pontok hármasai közötti kapcsolatokat foglal magában (Yellott, 1993). A fázisspektrum alapvető fontosságú a látható kép szerkezetének legtöbb aspektusa szempontjából, beleértve a sztereopszist is (Piotrowski és Campbell, 1982; Smallman és McLeod, 1994; DeAngelis és mtsai., 1995; Blake és Wilson, 2011). A teljesítmény- és fázisspektrumok transzláció-invariánsak. Egyik sem igényel retinális koordinátákat.
Egy másik topológiai leírás a differenciálgeometrián alapul. Koenderink és van Doorn (1976, 1992a,b, 1997) és Koenderink (1986, 1990) a fő felelősek a képszerkezet differenciálgeometriájának kidolgozásáért.
A képintenzitás térbeli struktúrája látható információt nyújt a felszín orientációjának változásáról mind a nézési, mind a megvilágítási irányokhoz képest. Számtalan illusztráció található a fényképezés, a festészet, a számítógépes látás és a látástudomány képárnyékolással foglalkozó irodalmában (pl. Koenderink és van Doorn, 2004). Nyilvánvaló, hogy a VBE is illusztrálja ezeket a hatásokat.
A VBE azt mutatja, hogy a retinális helyzetkülönbség nem szükséges a sztereopszishoz. Más, alább áttekintett kísérletek azt mutatják, hogy a retinapozíciók diszparitása szintén nem elegendő.
Perceived Surface Slant is Imprecise
A VBE-ben érzékelt mélység kisebbnek, kevésbé meggyőzőnek és kevésbé megbízhatónak tűnik, mint a térbeli pozíciók diszparitásából származó mélység.
A sztereopszis egyszerűen érzéketlen az intenzitáskülönbségekre? Valójában a binokuláris látás meglehetősen érzékenynek tűnik a dichoptikus kontrasztkülönbségekre; és ezek a kontrasztkülönbségek befolyásolják az észlelt térbeli pozíciókat a binokulárisan fuzionált képeken (Ding és Sperling, 2006).
A VBE-ben észlelt változó felszíni ferdeség egyik forrása, hogy a dichoptikus intenzitáskülönbségek két egymást kiegészítő perceptuális hatással vannak a binokuláris fényességre, valamint a mélységforgatásra (Hetley és Stine, 2011). Hetley és Stine (2011) azt találták, hogy e két hatás relatív nagysága megfigyelőnként és körülményenként változott, de a kombinált hatás viszonylag állandó volt.
A VBE másik korlátja, hogy a felületi ferdeséget amúgy sem érzékelik megbízhatóan – binokuláris diszparitásból, mozgásból származó struktúrából, képárnyékból, textúrából vagy más információból. Ez az észlelési korlátozás aligha meglepő: a felszín orientációjára vonatkozó képi információ szükségszerűen függ a megfigyelő látási pozíciójától. A sztereoszkopikus ferdeség észlelésének pontatlanságára vonatkozó kísérleti bizonyítékokat alább áttekintjük (A sztereoszkopikus felületi ferdeség pontatlan).
Sztereoszkopikus mélységérzékelés
A sztereopszis bemeneti információinak azonosításához visszafelé haladhatunk az észlelési kimenettől az optikai bemenetig: A binokuláris diszparitás milyen struktúrája szükséges és elégséges a környezeti struktúrák mélységbeli érzékeléséhez?
Ez a stratégia példázza a means-end analízist (Simon, 1996) és Gibson (1966) módszerét “The senses considered as perceptual systems” című könyvében. Ez a módszer gyakori a mérnöki tudományokban, de eltér a feltételezett retinális bemenetből való kiindulástól. A hagyományos input-első megközelítés nehézségét az jelenti, hogy a binokuláris diszparitás és az optikai információ sokféleképpen reprezentálható. A sztereoszkópikus észleléshez azonban kevés reprezentáció elegendő.
A sztereopszis nem szükséges a 3D világ érzékeléséhez, de a vizuális élmény sokkal világosabb sztereopszissal, mint nélküle. A sztereopszissel és anélkül való észlelésben mutatkozó különbségek szubjektíve mélyrehatóak, amint azt Oliver Sacks (“Stereo Sue”, in The mind’s eye, Sacks, 2010) és Bruce Bridgeman (http://www.bbc.com/future/story/20120719-awoken-from-a-2d-world) leírta.
Mellett a sztereopszis jelentősen javítja a térlátást. A binokulárisan eltérő relatív pozíciókhoz tartozó élességküszöbök körülbelül 25%-át teszik ki az ugyanezen mintákhoz tartozó, eltérés nélküli mintázatoknak (Berry, 1948; Westheimer és McKee, 1979; Lappin és Craft, 2000).
Mi tehát a sztereoszkopikus észlelés szerkezete? A mélység egy perceptuálisan létrehozott harmadik dimenzió? Ez egy gyakori intuíció, de nem ez az egyetlen lehetőség.
Alternatívaként a sztereoszkopikus tér és a mélység a tárgyak közötti látható kapcsolatokból eredhet. Az érzékelt tér primitív vizuális topológiájáról több hipotézis is lehetséges.
A kísérleti kutatások azt mutatják, hogy a felszíni forma elemi vizuális tulajdonság. A hagyományos szemszögből nézve ez a következtetés nagyon ellentmondásos. Úgy tűnik, hogy a magasabb rendű tárgystruktúrák egyszerűbb vizuális jelekből származnak.
A felületek és a felület alakjának vizuális szerepének mai megértése elsősorban Koenderink és van Doorn (1992a,b, 1997), valamint Koenderink (1990) érdeme. Az alapvető elméleti eredmények közé tartoznak: (1) A környezeti tárgyfelületek és retinális képeik egyaránt kétdimenziós sokaságok, amelyeket bármely ponton két fő ortogonális irányú térbeli deriváltak írnak le. (2) A környezeti felületek differenciális struktúrái és képeik binokuláris diszparitásmezői megközelítőleg izomorfikusak. (3) A helyi felület alakjára vonatkozó képi információt a binokuláris diszparitás és a mozgásparallaxis képmezőinek 2. rendű differenciálstruktúrája adja meg, amelyek az egyes pozíciókban a minimális és maximális görbület arányát adják meg. (4) A helyi felület alakjára vonatkozó 2. rendű képi információ közvetlenül becsülhető anélkül, hogy előzetesen meg kellene becsülni az alacsonyabb rendű tulajdonságokat, például a mélységet vagy a felület orientációját. (5) A helyi felszín alakjának változásai invariánsak a mélységgel, a ferdeséggel és a görbülettel.
A kísérleti bizonyítékok vizsgálata előtt vizsgáljuk meg az észlelt abszolút és relatív mélységekre vonatkozó alternatív hipotéziseket.
Az egyes pontok abszolút mélysége vizuálisan meghatározhatatlan
A legegyszerűbb térbeli primitív az egyes pont. A pontok térbeli helyzetét és binokuláris eltéréseit vizuálisan meghatározhatja a retina anatómiája. Ez egy gyakori intuitív felfogás.
Mindamellett az egyes pont általában sztereoszkopikusan többértelműnek tekinthető a fixációs referenciapont nélkül (Howard és Rogers, 2002).
A két retinális koordinátarendszer binokuláris összehangolása azonban problémás, mivel az összehangolás jelentősen változik a tekintet irányával és távolságával – lásd Howard és Rogers (1995, 2002). Az összehangolást az eltérő szemmozgások is megzavarják (Steinman et al., 1985; Ferman et al., 1987; Collewijn és Erkelens, 1990).
Ezek ellenére a világ érzékelt 3D struktúrája általában állandónak tűnik a tekintet irányának és távolságának változása esetén. Ez az észlelési stabilitás ellentmond annak a hipotézisnek, hogy a sztereoszkópikus mélység a retinális pozíciókból ered. Ráadásul a sztereó látásélesség küszöbértékei a relatív pozícióra vonatkozóan robusztusak a monokuláris képek eltérő mozgásai mellett (Westheimer és McKee, 1978; Steinman és mtsai., 1985; van Ee és Erkelens, 1996; Lappin és Craft, 1997, 2000). Így a sztereoszkópikus mélység nem származhat az egyes pontok retinális pozícióinak eltéréseiből.
Az érzékelt mélységkülönbségek pontatlanok
Egy alternatív hipotézis szerint a sztereopszis a pontpárok közötti mélységkülönbségek érzékelését biztosítja.
A két pont közötti retinális elkülönülés és a kapcsolódó binokuláris diszparitás a fixáció helyétől változatlan. A páronkénti képi diszparitás és a fizikai mélységkülönbség közötti kapcsolat azonban még mindig függ a tárgyaknak a megfigyelőtől való távolságától. Ha a szemtávolság, D, nagy a szemközti szeparációhoz, I-hez képest, akkor egy adott diszparitás (a páros szeparációban), ∂, esetén a megfelelő mélységkülönbség, Δd, megközelítőleg a szemtávolság négyzetével nő:
A szemtávolságnak ez az erős hatása a páros diszparitások alapvető korlátja. Ahogy az várható volt, az észlelt mélységkülönbségek megbízhatatlanok.
McKee et al. (1990) és Norman et al. (2008) tanulmányai azt találták, hogy az észlelt mélységkülönbségek két objektum között pontatlanok, amit nagy Weber-töredékekkel számszerűsítettek. McKee és munkatársai (1990) a sztereoszkopikus mélységkülönbségekre vonatkozó küszöbértékeket körülbelül 3-5-ször magasabbnak találták, mint az azonos ingerek monokuláris elkülönítése esetén. Norman és munkatársai (2008) hasonló pontatlanságot találtak, Weber-frakciókkal (variációs együttható = SD/M) ∼22%. Ezzel szemben a Weber-frakciók a mélység egyszerű érzékelésére kevesebb, mint 0,5% (pl. Lappin és Craft, 1997, 2000).
A sztereoszkopikus felületi ferdeség pontatlan
Koenderink és van Doorn (1976) és Koenderink (1986) kimutatták, hogy a felületi ferdeség befolyásolja a binokuláris diszparitási mező 1. rendű térbeli deriváltjainak “deformációs” komponensét – amely a háromszög alakú felületi foltok eltérő alakját érinti. A deformációs komponens változatlan a kép transzlációjával, kiterjesztésével és elforgatásával, de változik a nézési irány és a távolság függvényében (lásd Howard és Rogers, 2002, 21. fejezet). Ennek megfelelően az észlelt felületi ferdeség kétértelmű.
A ferdeség észlelése is anizotróp, mivel a szemek horizontálisan elkülönülnek, és a függőleges, mint a vízszintes diszparitási gradiensekre érzékenyebbek (Rogers és Graham, 1983; Gillam és Ryan, 1992).
A ferdeség megkülönböztetésének kiszámítható megbízhatatlanságát kísérletileg is megállapították (pl. Todd et al., 1995). A jelenlegi bizonyítékok azonban korlátozottak: az ítélet megbízhatóságáról gyakran nem számolnak be; a látótávolság és a kontextus gyakran állandó; és a diszparitás gradiensek általában együtt változnak a textúra gradiensekkel és más információkkal.
Norman és munkatársai (2006, 2009) kísérletei azt találták, hogy a sztereopszis nagyon kevéssé növeli a textúrán, a relatív mozgáson és az árnyékoláson alapuló ferdeségbecslések korlátozott pontosságát. A felületeket mindkét vizsgálatban állandó távolságban látták; és az ítéletek kevésbé pontosak lettek volna változó látótávolságok esetén.
A meredek felületi ferdeségeket nehéz lehet megkülönböztetni vagy akár felismerni, ha a diszparitás túlságosan nagy mértékben változik túl kis területen. Filippini és Banks (2009) nagy mélységgradiensek sztereoszkopikus detektálását értékelte, véletlenszerű pontokból álló fűrészfogas felületeket használva zajban. A felületek észlelésére szolgáló jel/zaj küszöbértékek gyorsan emelkedtek 1,0 feletti diszparitás/szeparáció arányok esetén, ahogy azt a keresztkorrelációs modellek előre jelezték.
Más kísérletek azonban azt találták, hogy a sima felületeken a mélységváltozások jobban láthatóak, mint azt a keresztkorrelációs modell előre jelezte. Allenmark és Read (2010) azt találták, hogy a nagy mélységváltozások ugyanolyan jól láthatóak sima szinuszhullámos felületeken, mint négyszögletes hullámokon. Norman és munkatársai (1991) nagyon pontos megkülönböztetést találtak a felületek simaságára vonatkozóan, ami meghaladja a keresztkorrelációs vagy más lineáris modellek előrejelzéseit.
A felszín alakja egy érzékelési primitív
Az emberi megfigyelők képesek megkülönböztetni a felszín alakjának nagyon kis változásait – nagyobb pontossággal, mint a mélység vagy a ferdeség megkülönböztetése esetén, és változatlan a mélység és a ferdeség véletlenszerű perturbációi esetén (pl., van Damme és van de Grind, 1993; Todd et al., 1996, 1997; Perotti et al., 1998; Lappin és Craft, 2000; Todd, 2004; Lappin et al., 2011).
Norman et al. (1991) a felület simaságának pontos érzékelését találta. A szélsőértéküknél diszkontinuus, véletlenszerű pontokból álló háromszöghullámú felületeket megkülönböztették a nagyon hasonló sima felületektől (alaphang + a háromszöghullám 3. harmonikusa), amelyek szélsőértékeinél enyhe görbületet mutattak. A simaság megkülönböztetése pontosabb volt, mint a Fourier-teljesítményspektrumok különbségeinek észlelése. Így a sztereoszkópikus észlelés görbült felületeket (2. rendű struktúra) eredményezett, nem pedig mélységeket vagy ferdeségeket.
Az alakzatok megkülönböztetése megbízhatóbb és függetlenebb az észlelt mélységi különbségektől (van Damme és van de Grind, 1993; Todd et al., 1996, 1997; Perotti et al., 1998; Todd, 2004). A sima felület alakja tehát olyan alapvető vizuális tulajdonság, amely nem az észlelt mélységből vagy ferdeségből származik.
Binokuláris diszparitás
Mit mond a sztereoszkópikus észlelés a binokuláris diszparitásról, a sztereopszis bemeneti információjáról?
A diszparitás a képszerkezetet érinti
Az első elv az, hogy a sztereoszkópikus bemenet a különböző képszerkezeteket érinti, nem a retina különböző pozícióit. A sztereoszkópikus hiperszemélyesség (a szem fotoreceptor-sűrűségénél, a pontterjedési függvénynél és a diffrakciós határnál finomabb felbontás) robusztus az egyes szemek retinális képpozícióinak véletlenszerű perturbációival szemben (Az egyes pontok abszolút mélységei vizuálisan meghatározhatatlanok és a felület alakja egy perceptuális primitív). Így a monokuláris térbeli pozíciók vizuálisan meghatározottak a környező képhez képest.
A különbség a felszín alakját érinti
A sztereoszkopikus látás közvetlenül érzékeny a környezeti felületek alakjára (A felszín alakja egy perceptuális primitív). A felszíni alak megbízhatóbban megkülönböztethető, mint a látszólag egyszerűbb tulajdonságok; és a felszíni alakra vonatkozó hiperélesség a relatív mélységhez és ferdeséghez kapcsolódó alacsonyabb rendű diszparitások véletlenszerű perturbációi mellett is fennmarad (Norman et al., 1991; Perotti et al., 1998; Lappin és Craft, 2000).
A felület alakjának sztereoszkópikus észlelése a környezeti felületek és a binokuláris diszparitások közötti strukturális megfelelés miatt lehetséges – ami másodrendű térbeli deriváltakat von maga után (Koenderink és van Doorn, 1992a; Lappin és Craft, 2000; Todd, 2004; Lappin et al, 2011).
A 2. rendű képszerkezet diszparitása
A binokuláris diszparitás “2. rendű differenciális szerkezete” egyszerűbb, mint amilyennek elsőre tűnik. A releváns struktúra csupán az egyes lokális képpontok körüli szomszédság sugárirányú szimmetriája. Egy felület binokuláris képei ennek a szimmetriának a deformációja révén különböznek egymástól. Ennek a helyi képdeformációnak a minőségi formája megfelel a helyi felület alakjának, amely nem változik a megfigyelő látási helyzetével.
Az 1. ábra szemlélteti ezeket a képdeformációkat a lehetséges felületformák mindegyikére. Mint látható, ezek a sztereó deformációk balról jobbra haladva megfelelnek a sík, a vízszintes henger, a függőleges henger, az ellipszoid és a nyereg helyi képeinek – ahogy azt a két fő görbület (ezen az ábrán a vízszintes és a függőleges) relatív nagysága meghatározza. Ezek a minták a sima felületek minőségi lehetőségeit példázzák.
1. ÁBRA. Egy kör alakú felületi folt nézőpontjának a függőleges középtengelye körüli elforgatásával létrehozott képdeformációk sematikus formái. A forgás iránya és a konkávság vs. konvexitás nem egyértelmű. Az alakzatok balról a következők: sík (0 görbület), parabolikus (0 görbület az egyik tengelyen), parabolikus, elliptikus (mindkét tengelyen azonos előjelű görbület) és hiperbolikus (ellentétes előjelű görbület a két tengelyen; Illusztráció Lappin és Craft, 2000, 3. ábra, 14. oldal. Copyright 2000 by the American Psychological Association. Engedéllyel újranyomtatva).
A 2. ábra a véletlenszerű alakú felületek képein mutatja az e helyi szerkezeti eltérések sima változásaira való robusztus vizuális érzékenységet. A helyi felület alakjára vonatkozó képi információ megmarad a képsík forgatásával, tágításával vagy nyírásával előidézett jelentős globális diszparitás-változások mellett is – amint azt a középső és az alsó panel szemlélteti. A legtöbb véletlen elemű sztereogramhoz hasonlóan ezekben a mintákban a véletlen intenzitások függetlenek a felület alakjától és a binokuláris diszparitástól; de itt a mélység és az intenzitás egyaránt egyenletesen változik, éles élek nélkül. A legtöbb természetes képtől eltérően az árnyékolás nem függ a felszín alakjától; és az intenzitások nem egyenlőtlenek.
2. ábra. A binokuláris diszparitásból származó észlelt alak sztereó illusztrációi, invariáns a globális képtranszformációk alatt 2D forgatással és nyírással. Az alakzat és az árnyékolás véletlenszerű és egymástól független. Felső: torzítatlan sztereó, a jobb oldali képet a függőleges tengely körül kb. 5°-kal mélységben elforgatva. Középen: a jobb oldali kép körülbelül 7°-kal elforgatva. Alul: a jobb oldali kép az ortogonális tengelyek mentén kb. 7%-kal kitágítva és összenyomva (“tiszta nyírás”). A bal oldali kép mindhárom párban azonos. (Illusztráció Lappin et al., 2011, 10. ábra, 2368. oldal. Copyright 2011 by the Psychonomic Society. Az illusztráció újrafelhasználása a Springer Science+Business Media szíves engedélyével.)
Binocular Disparity in the Venetian Blind Effect
A VBE a függőleges sávok észlelt forgását foglalja magában. Az ilyen síkbeli elforgatások általában a vízszintes skála kétoldali szimmetrikus tágulását vagy tömörülését eredményezik, ahogy az 1. ábra bal oldalán látható. A relatív intenzitások vízszintes eloszlásának megváltoztatása hasonló hatással lehet a környező ingerlés bal-jobb egyensúlyára reagáló vizuális neuronokra. Az észlelt forgás e képi eltérés plauzibilis és érthető következményének tűnik.
Amint Dobias és Stine (2012) megjegyzik, az észlelt forgás irányának magyarázata nem azonnal nyilvánvaló. A fényvisszaverő felületekről származó képárnyékolás a megvilágítás irányától és a felület tájolásától is függ. Speciális esetekben azonban Lamberti árnyékolás (egyenlő szórás minden irányban), sugárzó felületek és hátulról megvilágított felületek esetén a képintenzitás nagyobb, ha a felület merőleges a nézési irányra. Így a felület irányultsága plauzibilis módon a szem felé merőlegesebbnek (és így kiterjedtebbnek) tűnhet a nagyobb relatív intenzitás vagy kontraszt mellett.
A sztereoszkópikusan érzékelt felületek általában a magasabb rendű képstruktúrák binokuláris eltéréseiből származnak. A vizuális rendszer számára a térbeli pozíció és az intenzitás egymással korreláló dimenziók. A relatív térbeli pozíciók relatív intenzitásokat vonnak maguk után. Mindkettőt a felületek strukturálják, és mindkettő a felszíni struktúrára vonatkozó információt jelent, nem pedig a mélységre mint olyanra vonatkozót.
Interdekütközésre vonatkozó nyilatkozat
A szerző kijelenti, hogy a kutatást olyan kereskedelmi vagy pénzügyi kapcsolatok hiányában végezte, amelyek potenciális érdekellentétként értelmezhetők.
Allenmark, F., and Read, J. C. A. (2010). A szinusz- versus négyzethullámú diszparitási rácsok észlelhetősége: kihívás a mélységérzékelés jelenlegi modelljei számára. J. Vis. 10, 1-16. doi: 10.1167/10.8.17
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Berry, R. N. (1948). Kvantitatív kapcsolatok a vernier, a valós mélység és a sztereoszkopikus mélységélesség között. J. Exp. Psychol. 38, 708-721. doi: 10.1037/h0057362
Pubmed Abstract | Pubmed Full Text | Pubmed Full Text | CrossRef Full Text
Blake, R., and Wilson, H. (2011). Binokuláris látás. Vision Res. 51, 754-770. doi: 10.1016/j.visres.2010.10.009
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Bülthoff, H. H., and Mallot, H. A. (1988). Mélységmodulok integrálása: sztereó és árnyékolás. J. Opt. Soc. Am. A 5, 1749-1758. doi: 10.1364/JOSAA.5.001749
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Cibis, P. A., and Haber, H. (1951). Ansiopia és a térérzékelés. J. Opt. Soc. Am. 41, 676-683. doi: 10.1364/JOSA.41.000676
CrossRef Full Text
Collewijn, H., and Erkelens, C. J. (1990). “Binokuláris szemmozgások és a mélység észlelése”, in Eye Movements and Their Role in Visual and Cognitive Processes, ed. Kowler (Amsterdam: Elsevier), 213-261.
DeAngelis, G. C., Ohzawa, I., and Freeman, R. D. (1995). A sztereopszis hátterében álló neuronális mechanizmusok: hogyan kódolják az egyszerű sejtek a látókéregben a binokuláris diszparitást? Perception 24, 3-31. doi: 10.1068/p240003
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Ding, J., and Sperling, G. (2006). A binokuláris kombináció erősítés-szabályozó elmélete. Proc. Nat. Acad. Sci. U.S.A. 103, 1141-1146. doi: 10.1073/pnas.0509629103
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Dobias, J. J., and Stine, W. W. (2012). A velencei vak hatás időbeli dinamikája. Vision Res. 60, 79-94. doi: 10.1016/j.visres.2012.02.013
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Ferman, L., Collewijn, H., Jansen, T. C., and Van den Berg, A. V. (1987). Az emberi tekintet stabilitása horizontális, vertikális és torziós irányban az akaratlagos fejmozgások során, háromdimenziós szklerális indukciós tekercs technikával értékelve. Vision Res. 27, 811-828. doi: 10.1016/0042-6989(87)90078-2
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Filley, E. T., Khutoryansky, N., Dobias, J. J., and Stine, W. W. (2011). A velencei redőnyhatás vizsgálata. Seeing Perceiving 24, 241-292. doi: 10.1163/187847511X580366
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Filippini, H. R., and Banks, M. S. (2009). A sztereopszis határai a helyi keresztkorrelációval magyarázva. J. Vis. 9, 1-16. doi: 10.1167/9.1.8
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Gibson, J. J. (1966). Az érzékek mint érzékelési rendszerek. Boston: Houghton Mifflin.
Gillam, B., and Ryan, C. (1992). Perspektíva, orientációs diszparitás és anizotrópia a sztereoszkopikus ferde észlelésben. Perception 21, 427-439. doi: 10.1068/p210427
CrossRef Full Text
Hetley, R. S., and Stine, W. W. (2011). A kontraszt vagy a fénysűrűség diszparitás felosztása észlelt intenzitássá és forgássá. Seeing Perceiving 24, 315-350. doi: 10.1163/187847511X584461
Pubmed Abstract | Pubmed Full Text | Pubmed Full Text | Ref Full Text
Howard, I. P., and Rogers, B. J. (1995). Binokuláris látás és sztereopszis. New York: Oxford University Press.
Howard, I. P., and Rogers, B. J. (2002). Seeing in Depth, Vol. 2: Depth Perception. Toronto: I Porteous.
Julesz, B. (1960). Számítógéppel generált minták binokuláris mélységérzékelése. Bell Sys. Tech. J. 39, 1125-1162. doi: 10.1002/j.1538-7305.1960.tb03954.x
CrossRef Full Text
Julesz, B. (1971). A ciklopédikus észlelés alapjai. Chicago: University of Chicago Press.
Koenderink, J. J. (1986). Optikai áramlás. Vision Res. 26, 161-180. doi: 10.1016/0042-6989(86)90078-7
CrossRef Full Text
Koenderink, J. J. (1990). Szilárd alakzat. Cambridge, MA: MIT Press.
Koenderink, J. J., and van Doorn, A. J. (1976). A binokuláris látás geometriája és a sztereopszis modellje. Biol. Cyber. 21, 29-35. doi: 10.1007/BF00326670
CrossRef Full Text
Koenderink, J. J., and van Doorn, A. J. (1992a). Másodrendű optikai áramlás. J. Opt. Soc. Am. A 9, 530-538. doi: 10.1364/JOSAA.9.000530
CrossRef Full Text
Koenderink, J. J., and van Doorn, A. J. (1992b). Felületi alak és görbületi skálák. Image Vis. Comp. 10, 557-564. doi: 10.1016/0262-8856(92)90076-F
CrossRef Full Text
Koenderink, J. J., and van Doorn, A. J. (1997). Az általános bilineáris kalibrációs becslési probléma. Int. J. Comp. Vis. 23, 217-234. doi: 10.1023/A:1007971132346
CrossRef Full Text
Koenderink, J. J., and van Doorn, A. J. (2004). “Shape and shading,” in The Visual Neurosciences, eds L. Chaluppa and J. S. Werner (Cambridge, MA: MIT Press), 1090-1105.
Lappin, J. S., and Craft, W. D. (1997). A binokuláris diszparitás meghatározása és detektálása. Vision Res. 37, 2953-2974. doi: 10.1016/S0042-6989(97)00091-6
CrossRef Full Text
Lappin, J. S., and Craft, W. D. (2000). A térlátás alapjai: a retinális képektől az érzékelt alakzatokig. Psychol. Rev. 107, 6-38. doi: 10.1037/0033-295X.107.1.6
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Lappin, J. S., Norman, J. F., and Phillips, F. (2011).Fechner, information, and shape perception. Atten. Percept. Psychophys. 73, 2353-2378. doi: 10.3758/s13414-011-0197-4
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Marr, D., and Poggio, T. (1976). A sztereó diszparitás kooperatív számítása. Science 194, 283-287. doi: 10.1126/science.968482
CrossRef Full Text
Marr, D., and Poggio, T. (1979). Az emberi sztereó látás számítási modellje. Proc. Royal Soc. London B Biol. Sci. 204, 301-328. doi: 10.1098/rspb.1979.0029
CrossRef Full Text
McKee, S. P., Levi, D. M., and Bowne, S. F. (1990). A sztereopszis pontatlansága. Vision Res. 30, 1763-1779. doi: 10.1016/0042-6989(90)90158-H
CrossRef Full Text
Nefs, H. T. (2008). Háromdimenziós tárgy alakja árnyékolásból és kontúrkülönbségekből. J. Vis. 8, 1-16. doi: 10.1167/8.11.11
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Norman, J. F., Crabtree, C. E., Bartholomew, A. N., and Ferrell, E. L. (2009). Az öregedés és a ferdeség érzékelése optikai textúrából, mozgásparallaxisból és binokuláris diszparitásból. Attent. Percept. Psychophys. 71, 116-130. doi: 10.3758/APP.71.1.116
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Norman, J. F., Lappin, J. S., and Zucker, S. W. (1991). Sima sztereoszkopikus felületek megkülönböztethetősége. Perception 20, 789-807. doi: 10.1068/p200789
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Norman, J. F., Norman, H. F., Craft, A. E., Walton, C. L., Bartholomew, A. N., Burton, C. L.,et al. (2008). Stereopszis és öregedés. Vision Res. 48, 2456-2465. doi: 10.1016/j.visres.2008.08.008
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Norman, J. F., Todd, J. J., and Phillips, F. (1995). A felszíni orientáció észlelése több optikai információforrásból. Percept. Psychophys. 57, 629-636. doi: 10.3758/BF03213268
CrossRef Full Text
Norman, J. F., Todd, J. T., Norman, H. F., Clayton, A. M., and McBride, T. R. (2006). A helyi felületi struktúra látásbeli megkülönböztetése: ferdeség, dőlés és görbület. Vision Res. 46, 1057-1069. doi: 10.1016/j.visres.2005.09.034
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Ogle, K.N. (1962). “The optical space sense,” in The Eye, Vol. 4, ed. H. Davson (New York: Academic Press), 302-303.
Perotti, V. J., Todd, J. T., Lappin, J. S., and Phillips, F. (1998). A felületi görbület pontossága optikai mozgásból. Percept. Psychophys. 60, 377-388. doi: 10.3758/BF03206861
CrossRef Full Text
Piotrowski, L. N., and Campbell, F. W. (1982). A térfrekvenciás amplitúdó és fázis vizuális jelentőségének és rugalmasságának bemutatása. Perception 11, 337-346. doi: 10.1068/p110337
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Rogers, B. J., and Graham, M. E. (1983). Anizotrópiák a háromdimenziós felületek érzékelésében. Science 221, 1409-1411. doi: 10.1126/science.6612351
CrossRef Full Text
Sacks, O. (2010). Az elme szeme. New York: Knopf.
Simon, H. A. (1996). A mesterséges tudományok, 3. kiadás. Cambridge, MA: MIT Press.
Smallman, H. S., and McLeod, D. I. A. (1994). Méret-egyenlőtlenség korreláció a sztereopszisban a kontrasztküszöbnél. J. Opt. Soc. Am. A 11, 2169-2183. doi: 10.1364/JOSAA.11.002169
CrossRef Full Text
Steinman, R. M., Levinson, J. Z., Collewijn, H., and van der Steen, J. (1985). Látás ismert természetes retinális képmozgás jelenlétében. J. Opt. Soc. Am. A 2, 226-233. doi: 10.1364/JOSAA.2.000226
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Todd, J. T. (2004). A 3D alakzat vizuális észlelése. Trends Cogn. Sci. 8, 115-121. doi: 10.1016/j.tics.2004.01.006
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Todd, J. T., Koenderink, J. J., van Doorn, A. J., and Kappers, A. M. (1996). A változó látási körülmények hatása a simán ívelt felületek érzékelt szerkezetére. J. Exp. Psychol. Hum. Percept. Perform. 22, 695-706.
Pubmed Abstract | Pubmed Full Text
Todd, J. T., Norman, J. F., Koenderink, J. J., and Kappers, A. M. L. (1997). A textúra, a megvilágítás és a felületi reflexió hatása a sztereoszkopikus formaérzékelésre. Perception 26, 807-822. doi: 10.1068/p260807
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Todd, J. T., Tittle, J. S., and Norman, J. F. (1995). A háromdimenziós tér torzulásai a mozgás és a sztereó érzékelésében. Perception 24, 75-86. doi: 10.1068/p240075
Pubmed Abstract | Pubmed Full Text | Pubmed Full Text | CrossRef Full Text
van Damme, W. J., and van de Grind, W. A. (1993). Aktív látás és a háromdimenziós alakzat azonosítása. Vision Res. 33, 1581-1587.
van Ee, R., és Erkelens, C. J. (1996). A binokuláris mélységérzékelés stabilitása mozgó fej és szem mellett. Vision Res. 36, 3827-3842. doi: 10.1016/0042-6989(96)00103-4
CrossRef Full Text
Vuong, Q. C., Domini, F., and Caudek, C. (2006). A diszparitás és az árnyékolási jelek együttműködnek a felületinterpolációban. Perception 35, 141-155. doi: 10.1068/p5315
Pubmed Abstract | Pubmed Full Text | CrossRef Full Text
Westheimer, G., and McKee, S. P. (1978). Sztereoszkópos látásélesség mozgó retinális képek esetén. J. Opt. Soc. Am. 68, 45-455. doi: 10.1364/JOSA.68.000450
CrossRef Full Text
Westheimer, G., and McKee, S. P. (1979). Milyen előzetes egyszemű feldolgozás szükséges a sztereopszishoz? Invest. Ophthalmol. Vis. Sci. 18, 893-912.
Pubmed Abstract | Pubmed Full Text
Yellott, J. I. Jr. (1993). A korreláció egyediségének következményei a textúrastatisztikára és a Julesz-féle sejtés. J. Opt. Soc. Am. A 10, 777-793. doi: 10.1364/JOSAA.10.000777
CrossRef Full Text