Ekološka (ne)veljavnost znanih socialnopsiholoških eksperimentov
Veljavnost je po avtorjih Ferligoj, Leskošek in Kogovšek (1995) eden izmed »najbolj protislovno opredeljenih pojmov v družboslovju« (Ferligoj, Leskošek in Kogovšek, 1995, str. 64), saj se mnenja avtorjev že pri samih definicijah razlikujejo med seboj. Nekateri pojmujejo veljavno raziskovanje kot tisto, pri katerem se to, kar želimo meriti, ujema s tem, kar nameravamo meriti (Cronbach, 1970; Bohrnstedt, 1990; Splichal, 1990, v Ferligoj idr., 1995), nekateri pa veljavnost razširijo tudi na preučevanje povezave med teoretičnimi konstrukti in izmerjenim (Jaeger, 1990, v Ferligoj idr., 1995). Ferligoj idr. (1995) veljavnost bolj splošno in upoštevajoč različne definicije opredelujejo kot relevantnost empiričnega raziskovanja za razvijanje teorije.
V nadaljevanju avtorice najprej natančneje opredelimo veljavnost in različne delitve le-te, kasneje pa opišemo tri socialnopsihološke eksperimente, ki jih hkrati tudi analiziramo z vidika predstavljene teorije.
V praksi zasledimo le malo poskusov preučevanja opredelitve veljavnosti, kar Cohen (1990, v Ferligoj idr., 1995) pripiše dvema vzrokoma. Prvi je, da posamezniki veljavnost velikokrat izenačujejo z resničnostjo. Pri tem pojasnjuje, da resničnost podatkov (če empirični podatki ustrezajo dejstvom) še ne pomeni, da se podatki skladajo s teoretičnimi izhodišči, kar pa je pri veljavnosti ključno (Kirchgässler, 1991, v Ferligoj idr., 1995). Četudi so pridobljeni empirični podatki resnični, to še ne pomeni, da so tudi veljavni oz. da se skladajo z relevantnimi teoretičnimi konstrukti.
Drugi razlog pa je pripisovanje veljavnosti empiričnim lastnostim samim in opredeljevanje konstrukta kot posedujočega veljavnosti ali ne. Pri veljavnosti gre pravzaprav bolj za pripisovanje le-te določenemu odnosu med teoretičnim konstruktom in izmerjeno spremenljivko. Merjenje samo po sebi ne more biti veljavno ali neveljavno. To je ključnega pomena, saj pri ugotavljanju veljavnosti dobljene rezultate interpretiramo v luči teoretičnih konstruktov, kar pomeni, da se veljavnost preverja pri interpretacijah. Osnovno pravilo, ki se ga držimo pri veljavnosti, je, da če imamo dve spremenljivki, ki merita isti koncept, bi morali biti tudi rezultati, ki jih pridobimo pri merjenju teh spremenljivk, med seboj povezani oz. bi morali visoko korelirati (Bohrnstedt, 1977, v Ferligoj idr., 1995).
Veljavnost se torej nanaša na odnos med konstruktom in spremenljivko. Posledično je veljavnost vedno povezana s teoretičnimi konstrukti. Ob preučevanju raziskovalec vedno preverja veljavnost uporabe merjene spremenljivke za določen namen. Veljavnost torej ne more biti popolnoma prisotna ali odsotna; vedno se govori o določeni stopnji (ne)veljavnosti (Carmines in Zellet, 1979, v Ferligoj idr., 1995).
Delitve veljavnosti
Definicija Ameriškega psihološkega združenja (Splichal, 1990, v Ferligoj idr., 1995) zajema štiri razsežnosti veljavnosti: vsebinska veljavnost (ali se pridobljeni rezultati skladajo z izsledki predhodnih raziskav), konstruktna veljavnost (če spremenljivke, ki merijo isti konstrukt, med seboj visoko korelirajo, ter da posledično korelirajo tudi z drugimi spremenljivkami, ki merijo podoben konstrukt), nato pa še napovedna veljavnost in sočasna veljavnost. Vsebinska, napovedna in sočasna veljavnost opredeljujejo pragmatično veljavnost (nimajo neposredne povezave s teorijo), pri konstruktni veljavnosti pa gre za teoretsko opredelitev merjenja (za razliko od pragmatične veljavnosti raziskovalec tukaj povezuje merjene spremenljivke in teorijo).
Ferligoj idr. (1995) uvrstijo napovedno in sočasno veljavnost pod kriterijsko veljavnost, ki jo definiramo kot velikost korelacije med teoretično in izmerjeno spremenljivko. Teoretične spremenljivke ni mogoče meriti neposredno, zato namesto nje uporabimo drugo spremenljivko, za katero vemo, da ima visok koeficient korelacije s teoretično spremenljivko. Napovedna veljavnost se nanaša na »zmožnost raziskovalnega instrumenta za napovedovanje dogodkov«, sočasna veljavnost pa je podobna napovedni s to razliko, da ni vezana na prihodnost, ampak merimo merjeno in kriterijsko spremenljivko ob istem času in lahko stopnjo veljavnosti določimo takoj in ne v prihodnosti (Ferligoj idr., 1995).
Ferligoj idr. (1995) dodajajo še notranjo in zunanjo veljavnost. Notranja nam pove, do katere mere so zaključki o subjektu pravilni ali napačni znotraj eksperimentalnega načrta. Zunanja veljavnost pa pove, do kakšne mere dobljeni rezultati ostanejo točni, četudi spremenimo metode in vzorec. Ekološko veljavnost (veljavnost okolja) avtorji umestijo pod zunanjo veljavnost: ali določena raziskovalna situacija ustrezno predstavlja »resnični svet« (Lehman, 1991, v Ferligoj idr., 1995).
Nazadnje velja omeniti še interpretativno veljavnost, ki govori o »pripisovanju vzročnega odnosa med dvema spremenljivkama, ki jih izmerimo, kjer samo ena spremenljivka sodeluje v vzročnem procesu« (Brewer in Hunter, 1989, v Ferligoj idr., 1995).
Pomembno je omeniti tudi, da obstajajo tudi drugačne delitve veljavnosti. Podlesek in Brenk (2004) tako navajata naslednje veljavnosti: razvidno (če pogledaš konstrukt na hitro, koliko je jasen namen metode udeležencu in ocenjevalcu; je verjetno najšibkejša vrsta veljavnosti), vsebinsko (če definicija konstrukta vsebuje vse bistvene vsebine za raziskovalni problem), napovedno (če lahko s pomočjo trenutnega rezultata pri konstruktu napovedujemo rezultate na nekem drugem konstruktu) in konstruktno veljavnost (kadar imajo podatki strukturo, ki bi jo pričakovali glede na teorijo, iz katere smo metodo razvijali). Vidimo lahko, da so si delitve in definicije nekaterih tipov veljavnosti med seboj zelo podobne, s to razliko, da nekatere poudarjajo druge vrste veljavnosti.
Ekološka veljavnost
Tudi drugi avtorji opredelujejo ekološko veljavnost. Orne (1973, v Kihlstrom, 2002) pravi, da je namen laboratorijskih študij razumeti svet: poenostaviti problem, da ga lahko proučujemo efektivno in hkrati kontroliramo relevantne spremenljivke (še posebno vzročne zveze). Posploševanje zunaj laboratorija zahteva določeno stopnjo podobnosti med pogoji v laboratoriju in resničnim svetom.
Poznamo več groženj ekološke veljavnosti (Rosenthal in Rosnow, 1969, v Kihlstrom, 2002). Prva je, da se človek prostovoljno odloči za sodelovanje, pri čemer lahko dobi v zameno za sodelovanje honorar. Poleg tega emocionalno investira v raziskavo tako, da izhaja iz treh ciljev: povečati obseg (svojih) spoznanj, prispevati k boljšemu poznavanju sebe ter predstaviti sebe kot udeleženca v pozitivni luči. Druga grožnja je, da skleneta eksperimentator in subjekt dogovor, kjer se slednji strinja z neudobjem, raznimi zvijačami in dolgočasjem za potrebe eksperimenta. Obenem pa mu eksperimentator zagotavlja varnost in blagostanje – to zagotovilo prikrito namiguje, da bo udeleženec zaradi tega lažje sledil navodilom eksperimentatorja; slednji pa je na nek način upravičen do vsega, kar naredi. Tretja grožnja je, da je eksperiment po svoji naravi »epizodičen«, kar pomeni, da je ločen od drugih izkušenj udeleženca, je časovno omejen in zanj nima dolgoročnih posledic. Že po sami definiciji lahko sklepamo, da je takšen eksperiment težje posplošiti na vsakdanje življenje, v katerem posameznik doživlja dražljaje celostno in tudi v daljših časovnih obdobjih. Četrta in zadnja grožnja pa je, da udeleženci sami ugotovijo namen in cilj eksperimenta po svoje. Ti so lahko različni od namena in ciljev raziskovalcev; v primeru, da se udeleženci vedejo v skladu s tem, lahko dobimo popačene rezultate.
Zimbardov zaporniški eksperiment
V Zimbardovem eksperimentu so sodelovali študentje, ki so jim raziskovalci naključno pripisali vlogo paznika ali zapornika. Paznikom je bilo rečeno, da lahko v zapornikih poustvarijo občutja nemoči, zatiranja, frustracij, anonimnosti in strahu (do neke stopnje) ter občutje, da je njihovo življenje kontrolirano s strani paznikov. Prvih 24 ur je eksperiment potekal dokaj neproblematično, nato pa so se zaporniki začeli upirati in so pazniki začeli uporabljati različne oblike posrednega nasilnega vedenja, npr. verbalno nasilje. Študija je bila načrtovana za obdobje 14 dni, končala pa se je po šestih dneh zaradi vedenja paznikov in živčnega zloma nekaterih zapornikov. Glavni namen Zimbardove študije je bil preučiti vedenje posameznikov v situaciji, ki je podobna zaporu, in analizirati, če je dispozicijska hipoteza, ki je bila v tistem času prevladovalna miselnost, primerna za razlago zaporniškega vedenja. Dispozicijska hipoteza pravi, da nasilje v zaporih povzročijo določene osebnostne lastnosti ljudi. Da bi ločili dispozicijsko in situacijsko hipotezo, so ustvarili zapor, ki je po zgledu in socialnopsiholoških značilnosti podoben resničnemu, s to razliko, da so v tem zaporu ljudje, ki se bistveno ne razlikujejo od povprečnih ljudi (Haney, Banks in Zimbardo, 1973).
Če pogledamo Zimbardov eksperiment (Haney idr., 1973) vidimo, da pazniki niso bili ogorčeni nad svojim početjem. Ko so po koncu eksperimenta paznike vprašali o njihovem vedenju, jih je večina odgovorila, da so se samo trudili igrati vlogo »pravega« paznika. Tukaj se pojavi vprašanje, kako daleč mora iti vedenje, da mi verjamemo, da to ni več zgolj posledica igranja vloge, ampak posledica situacije. Pri Zimbardovem eksperimentu se je pojavilo preveč vedenj, ki jih opazimo v resnični tovrstni instituciji, kar seveda prispeva k ekološki veljavnosti spoznanj. Lahko tudi trdimo, da so udeleženci ponotranjili moč situacije, saj nobena skupina ni samo igrala svojih vlog – upoštevati moramo tudi zaznano depresivnost pri zapornikih, navdušenje paznikov nad tem, da bi delali nadure brez honorarja, uporabo svoje šifre namesto imena ipd. Do neke mere se je tako zaporniška situacija približala resnični (Haney idr., 1973).
Kljub temu pa pri posploševanju opozarjamo, da gre samo za minimalne analogije s pravimi zapori. Avtorji sami opozarjajo, da njihov namen ni bil dobesedno poustvariti zapor, saj nekatera etična, legalna in praktična načela to preprečujejo. V tej situaciji je bil posledično (nujno) odsoten rasizem (udeleženci so bili kavkazijci, samo en udeleženec je imel orientalsko poreklo), fizično nasilje in grožnje s smrtjo. Poleg tega je bil eksperiment načrtovan za obdobje štirinajstih dni, s čimer so bili udeleženci seznanjeni. Vse navedeno morebiti kaže na to, da ne moremo posplošiti dogajanja v tem umetno načrtovanem zaporu na dejanske zapore.
Lewinov eksperiment
Raziskovalci so vedenje 10-letnih dečkov opazovali pri izvajanju aktivnosti pod različnimi stili vodenja. Eksperiment je trajal pet mesecev, sodelovale so štiri skupine različnih otrok. Vsakih šest tednov je imela vsaka skupina novo vodjo z drugačno tehniko vodenja, tako da je imela vsaka skupina v poteku eksperimenta vse tri stile vodenja – avtoritarnega, demokratskega in permisivnega (Lewin, Lippitt in White, 1939). Zaradi prostovoljne narave sodelovanja v eksperimentu in sodelovanja staršev s šolskim sistemom ni bilo radikalnih avtokratskih metod (groženj, spodbujanja strahu in podobno). V eni od petih avtoritarnih skupin se je pojavila agresivnost, ki je bila 8-krat bolj pogosta kot v demokratskih skupinah.
Težavnosti, ki se pojavljajo pri vrednotenju posplošljivosti tega eksperimenta, so najprej in najbolj očitno vezane na dejstvo, da so bili udeleženci 10-letni dečki. Kot navajajo že avtorji (Lewin idr., 1939), je posplošljivost kateregakoli eksperimenta omejena na situacije, pri katerih se pojavljajo isti ali dovolj podobni vzorci. Vsak stil vodenja ima ogromno različnih variant in možnosti izpeljave, poleg tega pa osebnostne značilnosti vodje, članov, vsebina naloge, časovno obdobje, trajanje in mnogi drugi dejavniki prispevajo k možnim rezultatom eksperimentov. Verjetno je z vidika ekološke veljavnosti najbolj pomanjkljiva specifičnost eksperimentalne situacije. V realnem življenju je verjetno, da bi bile članom naloge bolj pomembne, poleg tega pa so bili dečki v tem eksperimentu zelo izčrpno opazovani, česar v vsakodnevnem življenju v večini primerov ne moremo izvesti.
Aschev eksperiment konformnosti
Asch je znan po študijah konformnosti in bolj specifično po ugotovitvi, da lahko ima večinsko mnenje velik vpliv na konformnost v skupini. Njegov eksperiment je potekal tako, da je bilo v skupini od sedem do devet posameznikov, med kateremi so bili pravi udeleženci ter »udeleženci«, ki jih je tja postavil eksperimentator in so imeli vnaprej določeno nalogo. Udeležencem je bilo rečeno, da sodelujejo v psihološki raziskavi o vizualnih sodbah, bolj specifično o sodbi dolžin črt. Eksperimentator je pokazal dve tablici. Na eni so bile črte različnih dolžin, na drugi pa le ena črta. Naloga udeleženca je bila, da na glas pove, katera črta na tablici z več črtami ustreza tisti na drugi tablici. Udeleženca je eksperimentator postavil v sobo tako, da je udeleženec vedno zadnji v vrsti podal svoj odgovor. Študijo so izvedli večkrat. Pri prvih nekaj pokusih je vse potekalo, kot bi moralo (»udeleženci« so podali pravilen odgovor). Po parih poskusih je eden izmed »udeležencev« podal zelo vidno napačen odgovor. Enak odgovor sta podala tudi drugi in tretji »udeleženec«, nato še ostali. Kako je odgovoril edini pravi udeleženec? Rezultati kažejo, da v 76 % procentih primerov udeleženci vsaj enkrat odgovorijo v skladu z ostalimi »udeleženci«, čeprav vedo, da je ta odgovor napačen (Jetten in Hornsey, 2012).
Eden izmed problemov z ekološko veljavnostjo pri Aschevem eksperimentu je ta, da v resničnem življenju sodbe nikoli niso tako enoumne kot v Aschevi umetni situaciji: zelo redko se zgodi, da mora posameznik sodbo podati na način, da je en odgovor pravilen, vsi ostali pa napačni. Prav tako je posameznik redko v situaciji, kjer obstajata samo dve možnosti za konformnost: ali se udeleženec podredi ali pa ne. Pravzaprav je v vsakodnevnih situacijah tako, da včasih sprejmemo določen vpliv od drugih, delno pa ga tudi zavrnemo. Na primer, če grem s prijatelji v kino, se lahko vsi strinjamo, da je film slabo zaigran ali slabo napisan, kljub temu pa lahko diskutiramo in se ne strinjamo glede tega, ali so bili vizualni efekti v filmu dobro narejeni ali ne. V omenjenem primeru se prav tako ne počutimo slabše, ker smo se glede kvalitete filma vsi strinjali oz. smo bili konformni, v nasprotju s tem, kar se je zgodilo v Aschevem eksperimentu. Razumemo, da ima vsak drugačen pogled na stvarnost kot drugi. Nekateri zaradi tega kritizirajo Aschev eksperiment z vidika, da udeleženci niso bili pripravljeni na tako bizarno eksperimentalno situacijo, zaradi česar so se strinjali z večino samo zaradi tega, ker niso imeli orodij za spoprijemanje s situacijo in se je bilo lažje konformirati skupini (Jetten in Hornsey, 2012).
Literatura
Ferligoj, A., Leskošek, K. in Kogovšek, T. (1995). Veljavnost merjenja. V Zanesljivost in veljavnost merjenja (str. 63 – 102). Ljubljana: FDV.
Haney, C., Banks, C., & Zimbardo, P. (1973). Interpersonal dynamics in a simulated prison. International Journal of Criminology & Penology, 1(1), 69–97.
Jetten, J., & Hornsey, M. J. (2012). Conformity: Revisiting Asch’s line-judgment studies. In J. R. Smith, S. A. Haslam, J. R. Smith, S. A. Haslam (Eds.), Social psychology: Revisiting the classic studies (pp. 76-90). Thousand Oaks, CA: Sage Publications Ltd.
Kihlstrom, J., F. (2002). Demand Characteristics in the Laboratory and the Clinic: Conversations an Collaborations With Subject and Patients. Prevention & Treatment, 36c (5).
Lewin, K., Lippitt, R., & White, R. K. (1939). Patterns of aggressive behavior in experimentally created ‘social climates.’. The Journal Of Social Psychology, 10, str. 271-299.
Podlesek, A. in Brenk, K. M. (2004). Osnove psihološkega merjenja: Psihofizikalna metodologija. Ljubljana: Filozofska fakulteta, Oddelek za psihologijo.

