| Kulturkanalen | Samtiden | 5/6-97
Bjørn Vassnes
TRØSTEVISE FOR GARRI KASPAROV
De filosofiske lærdommene av forsøket på å skape «Kunstig intelligens»
Datamaskinen «Deep Blue» til tross, det å skape Kunstig intelligens har vist seg langt vanskeligere enn man trodde. Men underveis har man gjort oppdagelser som har implikasjoner langt utover datateknologien: Det er selve det moderne selvbildet, rasjonalismen, som er blitt testet og funnet for lett.
1997 skulle altså bli året da en datamaskin endelig greide å slå en verdensmester i sjakk. Men selv om det var et tungt slag for Kasparov, var det påfallende få som så dette som et vendepunkt i forholdet mellom menneske og teknologi. Og hvorfor skulle de det? Få lar seg hisse opp over at Geir Moen blir en sinke mot en moped. Moen og mopeden beveger seg nemlig på ulike måter, og vi har etter hvert også forstått at mennesker og maskiner «tenker» på svært ulike måter. Mens «Deep Blue» brukte rå regnekraft, og kunne vurdere 200 millioner stillinger pr. sekund, måtte Kasparov bruke det vi kaller «teft», opparbeidet gjennom mange år ved turneringsbordet. Og egentlig er det fantastisk hvor lenge denne «teften» har holdt stand mot datakraften. Sjakkspillende datamaskiner har nemlig vært en del av forskningsfeltet Kunstig intelligens siden 50-tallet, og da ble det spådd at en datamaskin ville være verdensmester i sjakk innen ti år. Spådommen syntes vel begrunnet: De første eksemplene på Kunstig intelligens var imponerende, bl.a. med et program («Logic Theorist») som kunne bevise de fleste teoremene i Whitehead og Russels Principia Mathematica. En av skaperne av dette programmet, Herbert Simon, erklærte i 1958 at:
Jeg mener ikke å overraske eller sjokkere dere (...) Men den enkleste måten jeg kan summere det opp på er ved å si at det nå finnes maskiner som tenker, som lærer og som skaper (...) Intuisjon, innsikt, og læring er ikke lenger menneskers eksklusive eiendom.
Det var ikke måte på hvilke vyer som åpnet seg. Mange mente dette var starten på en helt ny æra, et nytt sprang i evolusjonen. Som Ed Friedkin på MIT (Massachusetts Institute of Technologi) sa det: «Det er tre store begivenheter i historien. Den ene er universets skapelse. Den andre er livets tilblivelse. Den tredje, som jeg tror er like viktig, er framveksten av Kunstig intelligens.» For det var jo ikke bare snakk om å utvikle maskiner som kunne tenke like bra som mennesker: Når det stadiet først var nådd, ville maskinene nødvendigvis utvikle seg videre, og etterlate oss på evolusjonens søppelbinge. Som vi nå vet, skulle det ikke gå slik. Det å få maskiner til å «tenke» viste seg å være mye vanskeligere enn man hadde trodd. Bl.a. strever man fremdeles med å få maskiner til å gjenkjenne objekter, og å forstå vanlig tale ñ oppgaver som man i utgangspunktet trodde var rene barnematen. Dette betyr imidlertid ikke at Kunstig intelligens har vært et uinteressant prosjekt. Tvert imot, men betydningen ligger på et helt annet felt enn først forventet. Det er nettopp i KI-forskningens problemer at nye innsikter har vist seg, og disse innsiktene holder nå på å revolusjonere vårt selvbilde.
Descartes goes digital
For KI-prosjektet kan nemlig sees som en test av det selvbildet vi har levd med siden 1600-tallet, det vi gjerne kaller «rasjonalismen» (inkludert det som i filosofibøker ofte blir kalt for rasjonalismens motpol: empirismen). Kunstig intelligens var faktisk Descartesí og hans etterfølgeres fornuftsmodell satt ut i praksis, filosofi gjort om til elektronikk. «Logic Theorist» og andre KI-programmer (som den mer allsidige «General Problem Solver») jobbet etter samme prinsipper som Descartes og Hobbes hadde skissert opp for logisk tenkning: Problemer ble formulert ved hjelp av enkle symboler, manipulert etter presise regler, og vips: Selv de mest avanserte problemer lot seg knekke. Og til å begynne med gikk det altså strålende: KI-forskningen så ut til å bekrefte den rasjonalistiske modellen.
Descartes og Hobbes hadde på mange måter formulert grunnprinsippene for Kunstig intelligens gjennom sine beskrivelser av menneskets intelligens. Brødrene (Hubert og Stuart) Dreyfus sier det slik:
Descartes hadde allerede antatt at all forståelse besto av å danne og manipulere egnede representasjoner, at disse representasjonene kunne bli analysert i enkle elementer (naturas simplices), og at alle fenomener kunne forstås som komplekse kombinasjoner av disse enkle elementene. Dessuten hadde Hobbes samtidig implisitt antatt at elementene var formelle komponenter relatert ved rent syntaktiske operasjoner, slik at tenkning kunne reduseres til kalkulering.
Leibniz så for seg et «universelt symbolsystem», der hver ting hadde sitt spesielle nummer, et slags «tankenes alfabet». Dette skulle til og med kunne brukes til å løse konflikter, ved at man regnet ut de riktige svarene på alle mulige slags problemer! Med andre ord: «General Problem Solver» forespeilet 250 år før tiden. Men inntil videre bare i teorien. For hvordan skulle tanker omsettes til enkle størrelser, til tall? Det skulle gå 150 år før noen kom noe videre med disse ideene, og det skjedde først da den engelske matematikeren George Boole (1815-1864) fant opp en ny type logikk: symbolsk logikk. Det Boole gjorde, var å konkretisere Leibnizí idé om et «tankenes alfabet», et «filosofisk språk». Boole analyserte språklige utsagn i sine enkleste komponenter, som han ga symboler som a, b, x, y, osv. Disse komponentene kunne så kombineres gjennom presist definerte operasjoner tilsvarende de vanlige matematiske (addisjon, subtraksjon, etc.), til nye utsagn. Disse operasjonene kalte Boole «tankens lover». Noe av det viktigste Boole fant ut, var at dette systemet var et to-verdi system: Alle utsagn kunne uttrykkes som enten 1 («sant») eller 0 («usant»). Og alle resonnementer kunne i prinsippet formes som en serie med ja/nei-spørsmål, som i selskapsleken «Tyve spørsmål». I 1938 kom så oppskriften på hvordan Booles symbolske logikk kunne omsettes til elektronikk. Dette skjedde i en hovedoppgave av en ung student ved MIT, Claude Shannon. Booles «logiske kretser» med ja/nei svar kunne ifølge Shannon erstattes med elektriske kretser med av-og-på-brytere. Dersom en logisk operasjon kunne settes opp som en serie av ja/nei-svar, kunne den også uttrykkes elektronisk. Få år etter hadde datamaskinen funnet sin form, og Leibniz' drøm kunne omsettes i praksis, som Kunstig intelligens. Men etter en lovende start møtte man veggen. Hva var galt?
Den vanskelige hverdagen
En årsak til at man lot seg lure av de første suksessene, var at man tok feil mht. hva som var «vanskelig» og «lett», hva som krever intelligens, og hva som ikke gjør det. Både symbolsk logikk og sjakk er selvfølgelig vanskelig nok. Poenget er imidlertid at slike programmer ikke «skjønner» noe av verken sjakk eller logikk. De kan likevel programmeres til å løse oppgaver som kun går ut på å følge visse prosedyrer. Og fordi sjakk og symbolsk logikk er formaliserte «spill» med faste regler, kan problemer innen disse feltene formuleres på en slik måte. Men i det virkelige liv vil et KI-program av typen «General Problem Solver» alltid få problemer, fordi problemene aldri lar seg analysere ned til en så klar og enkel form som GPS krever. Virkeligheten har for mange alternativer, og for mange gråsoner. Og den vanskeligste oppgaven er ofte å definere hva problemet går ut på, eller kanskje å oppdage problemet i første instans. Når problemet er satt opp og definert, med mål og hvilke midler man har til rådighet, er i grunnen det verste gjort. Og det var først på dette stadiet GPS kunne begynne.
Det man etter hvert oppdaget, var at det var de hverdagslige problemene, de vi alltid har betraktet som enkle, som var vanskeligst å takle for KI-systemer. Mens det vi tradisjonelt har sett på som vanskelig ñ å løse matematiske oppgaver, spille sjakk ñ var mye lettere å hanskes med for datamaskinene. Den britiske KI-forskeren Donald Michie sier det slik: «Det å få en datamaskin til å styre et romskip til månen, er ingen sak. Men å få den til å styre en robot rundt gatehjørnet for å kjøpe en pakke sigaretter, er bortimot umulig.»
Etter hvert innså man vanskelighetene, men man ga ikke dermed opp selve strategien. Kanskje programmene fikk problemer fordi de hadde for få kunnskaper om den «verden» de skulle operere innenfor? En mulig løsning da var å lage små «mikroverdener», som var små nok til at systemene ikke ble stående fast pga. uvitenhet. Denne tanken lå bak programmet SHRDLU, som en doktorgradsstudent på MIT, Terry Winograd, designet rundt 1970. SHRDLU opererer i en mikroverden av et begrenset antall klosser i ulike former og farger. Man kan «snakke» til SHRDLU om klossene via en terminal, og be det foreta operasjoner med klossene. SHRDLU kan be deg presisere dersom kommandoen er uklar, og programmet kan også forklare hvorfor det løser oppgavene på den ene eller andre måten. Da det kom, ble SHRDLU ansett som et gjennombrudd for KI-forskningen. SHRDLU kunne, innenfor sin lille verden, kommunisere og handle på måter som i hvert fall kunne tyde på en slags intelligens. Men, som ikke minst Winograd selv har påpekt senere, dette var bare «utenpå». Man kunne ikke snakke om noen egentlig «forståelse». SHRDLU var f.eks. helt uten evne til å lære, til å forbedre seg. Dessuten var SHRDLUs verden ikke bare «mikro», den var også totalt lukket og dermed statisk.
En parallell til SHRDLU og dens mikroverden er «ekspertsystemer». Prinsippet her er å avgrense et lite fagfelt, fore systemet med så mye kunnskap om dette som mulig, og på bakgrunn av levende eksperters erfaringer, sette opp et system av «tommelfingerregler». Målet er at det ferdige systemet skal kunne fungere som en «ekspert»: det skal kunne konsulteres på samme måte som et levende eksemplar av arten. Dette er kanskje den grenen av KI som har hatt størst suksess innenfor felter som kjemisk analyse, medisinsk diagnostikk, finansanalyser etc. Men begrensningene er de samme som i SHRDLU: Det går bra så lenge verden utenfor ikke forstyrrer. Og det skjer som kjent litt for ofte.
Mange innen KI-forskningen har tolket disse problemene dit hen at det er mangel på kunnskap som har vært bøygen. Dersom systemene bare fikk nok kunnskap, ville de også kunne utvise det vi kaller «skjønn». For «skjønnet» er selvfølgelig ingen mystisk evne, det er nettopp de som har samlet lang erfaring på et område, som har dette skjønnet. Men en ekspert er også mer enn bare en ekspert, han eller hun har også et vidt spekter av andre kunnskaper som kan dras veksler på om nødvendig. Et av de mest ambisiøse nåtidige KI-prosjektene prøver å løse dette «kunnskapsproblemet» ved rett og slett å samle inn alt som er! Prosjektet CYC (fra Encyclopedia) har holdt på siden 1984 og er i skrivende stund ennå ikke avsluttet. Målet er å bygge en database stor nok til inneholde en betydelig del av vanlig «hverdagskunnskap», av den typen vi alle må ha for å kunne fungere i dagliglivet. Det er mangelen på en slik basiskunnskap som har skapt vansker for KI så langt, mener prosjektleder Douglas Lenat.Tanken bak CYC er at «intelligens» vil komme «av seg selv» når bare kunnskapsmengden er stor nok.
Å samle inn og systematisere «en betydelig del» av vanlig hverdagskunnskap har vist seg å være en større oppgave enn antatt: Lenat & Co. har nå holdt på i over ti år, og skeptikere mener de aldri vil nå målet. Men la oss si at målet en dag var nådd, at man hadde klart å samle inn en god del av den hverdagskunnskapen de fleste av oss er avhengige av. Ville man da ha et virkelig intelligent system? Dessverre: Å samle inn og lagre kunnskapen er bare en del av «kunnskapsproblemet». Det er også nødvendig å gjøre denne kunnskapen anvendelig, og dette har minst tre aspekter: For det første må kunnskapen være organisert slik at den er lett å finne når vi trenger den. For det andre må den holdes oppdatert, og for det tredje må man ha måter å sortere ut hva som er relevant kunnskap. Forholdet her er at jo mer kunnskap vi putter i en database, jo vanskeligere blir det å bruke denne kunnskapen. Hva hjelper det å søke på et stikkord dersom vi får flere tusen «treff»? Dette er noe man kan erfare allerede på dagens internett, og et fullført CYC-prosjekt har helt andre dimensjoner.
Douglas Lenat har selv sagt at dersom CYC-prosjektet mislykkes, kan dette tyde på at det må være noe galt med selve grunntanken bak KI, det han kaller «symbolparadigmet». Men mange KI-kritikere mener vi ikke behøver å vente på CYC, fordi KI allerede har vist seg å være et feilslått prosjekt. En av de første som pekte på en iboende vanskelighet ved KI-prosjektet, var den britiske matematikeren Sir James Lighthill, i en rapport for den britiske regjeringen. Det man ikke hadde tatt hensyn til, ifølge Lighthill, var den «kombinatoriske eksplosjonen»: den eksplosjonsartede økningen av antall muligheter som nødvendigvis oppstår i systemer som prøver å takle det virkelige liv (der mengden mulig informasjon lett går mot uendelig) ved å kalkulere. Vi vet at selv i et sjakkspill går antallet mulige trekk opp i et astronomisk antall om vi bare ser tre-fire steg framover (derfor må selv de kraftigste sjakkcomputerene bruke tommelfingerregler), og i virkelighetens verden blir det mye verre.
Filosofenes inntog
Omtrent samtidig med Lighthills kritikk møtte KI-prosjektet innvendinger også fra en annen og mer uventet kant. I en rapport for RAND Corporation fyrte filosofen Hubert Dreyfus av en bredside mot KI-forskningen, med ammunisjon fra en av de mest obskure filosofer siden Heraklit, nemlig Martin Heidegger. I sitt hovedverk Sein und Zeit, i 1927, hadde Heidegger kritisert den rasjonalistiske modellen for hvordan vi erfarer omverdenen. Ifølge denne eksisterer verden «der ute» som en samling fakta, som vi lærer oss å kjenne, bit for bit. Men dette er å begynne i feil ende, mente Heidegger: Vi forholder oss i utgangspunktet til verden som en meningsfull helhet, som handlende og kommuniserende vesener. Fakta og regler er noe vi abstraherer ut av denne helheten etterpå. Men ingenting av dette er fritt for kontekst, vi opplever alltid ting ut fra et ståsted, som et eller annet som gir mening (eller ikke gir mening) for oss. Vi kan aldri komme dit hen at vi ser oss selv og verden «utenfra», fra «evighetens synsvinkel».
Heideggers poeng er at verden ikke består av «fakta», at språket (som representerer verden) ikke består av en samling «betydnings-atomer» som man så setter sammen for å uttrykke ideer og meninger. Det som er utgangspunktet for vår forståelse er den situasjonen vi befinner oss i som handlende vesener. For Heidegger er skillet subjekt/objekt noe som oppstår først når vi abstraherer, inntar et teoretisk forhold til tilværelsen. I begynnelsen finnes verken «det tenkende subjekt», «ordet», eller «verden der ute», men kun mennesket-i-verden.
Uavhengig av Heidegger kom Ludwig Wittgenstein fram til en liknende konklusjon. Wittgenstein prøvde først, i god rasjonalistisk ånd, å finne fram til virkelighetens «atomer». Dette var prosjektet hans i Tractatus logico-philosophicus. Men denne boken ender på en tvetydig måte: Prosjektet er fullført, det som kan sies, er blitt sagt. Men hvor har det egentlig ført oss? Med Wittgensteins egne ord: «Mine påstander tjener som forklaringer på følgende måte: Enhver som forstår meg vil se at de er meningsløse, når han bruker dem som trinn for å klatre opp over dem. (Han må, så å si, kaste vekk stigen når han har klatret opp.)»
I sin senere filosofi ble denne tvetydigheten til en klar skepsis mot rasjonalismen. Nå holdt ikke engang det lille han hadde sagt i Tractatus: Det fantes ingen «logiske atomer», ikke engang vitenskapens «sannheter» var objektive. Ingen språklige ytringer kunne forstås isolert, bare som handlinger i en kontekst. Wittgenstein viste også at språket ikke er så systematisk som vi vil ha det til. Mens Kant mente begreper og kategorier kunne defineres ved hjelp av regler («Hvis det har fire bein, logrer og bjeffer, er det en hund.»), demonstrerte Wittgenstein at språket i praksis ikke fungerer slik. Om vi tar en kategori som «stol», vil vi se at det er vanskelig å finne et sett med kriterier som er felles for absolutt alle stoler. Ikke alle stoler har fire bein, ikke alle stoler er til å sitte på, etc.
Ironisk nok kom Wittgensteins radikale kritikk av rasjonalismen samtidig med at datamaskinen ga den samme rasjonalismen nytt liv (etter den andre verdenskrig). Og KI-forskerne følte vel neppe at Heideggers og Wittgensteins filosoferinger hadde noe med dem å gjøre. Men for Dreyfus ble det nettopp Heidegger som skulle vise hva som var galt med KI-prosjektet. Og feilen stakk dypt, problemet var selve den rasjonalistiske modellen for hvordan mennesker tenker og kommuniserer, den samme modellen KI-forskerne hadde prøvd å omsette i praksis: «Forsøket på å analysere intelligent adferd i et digitalt datamaskinspråk ser bort fra (...) grunnleggende menneskelige tenkemåter (...) Viktige fremskritt i kunstig intelligens må avvente datamaskiner av en helt ny sort, der den eneste eksisterende prototypen er den lite forståtte menneskehjernen.»
En liknende kritikk av KI-prosjektet kom også innenfra, fra mannen som hadde designet SHRDLU-programmet, Terry Winograd. Også Winograd hadde lest Heidegger, og senere «språkhandlings»-filosofer som J.L. Austin og John Searle. Felles for alle disse filosofene var at de forkastet den rasjonalistiske oppfatningen av hva «mening» er, og som lå til grunn for SHRDLU: «Den rasjonalistiske tilnærmingen til mening som ligger bak systemer som SHRDLU er grunnet på antakelsen av at meningen i ord, i setninger og fraser kan bli beskrevet uavhengig av den enkeltes tolkning i en gitt situasjon.»
Det både Heidegger, Wittgenstein, Austin og Searle hadde demonstrert, var at et ord eller en setning aldri kan defineres entydig én gang for alle. Et utsagn står aldri alene; det står alltid i en konkret situasjon, og henvender seg til personer med en spesifikk bakgrunn og forståelse. Det er en sosial handling hvis betydning ikke alltid lar seg analysere ut av ordene. Austin og Searle har vist at språk i praksis brukes på mange flere måter enn til å uttrykke påstander. «Det er kaldt,» kan f.eks. være en bønn om å lukke vinduet. Vi forventer at personen som sitter ved vinduet vil lukke det, ikke at han bare vil svare: «Ja, termometeret står på minus to». Men nettopp noe slikt er hva man kan forvente av en datamaskin, som analyserer ordene rent formelt, uten «følelse» for den sosiale situasjonen.
Forståelse for situasjonen er en del av det «bakteppet» som alltid er med i en samtale. Man sier bare det som ikke «sier seg selv». Når du snakker med en arbeidskollega eller en annen person med noenlunde samme bakgrunn som deg selv, kan du spille på dette felles bakteppet: Du behøver ikke ta med alle detaljer, og kan heller ikke gjøre det, fordi det kreves en uendelig mengde med informasjon for å beskrive en hverdagslig tanke eller situasjon fullt ut. Grunnen til at KI-forskerne gang på gang har møtt veggen, er nettopp at deres systemer ikke har denne enorme mengden bakgrunnskunnskap som vi mennesker hele tiden bærer med oss, og som vi bruker for å tolke de ørsmå bitene av informasjon vi fanger opp i en samtale eller en tekst. Ved hjelp av vår egen bakgrunnskunnskap, spinner vi videre på det lille vi får, og lager meningsfulle helheter av det. Men disse bakgrunnskunnskapene er ikke det eneste vi drar veksler på i en samtalesituasjon: Selve situasjonen har en mengde iboende referanser som begge samtalepartnerne forutsettes å oppfatte. En parallell fra biologien kan illustrere dette. Det er en vanlig feil å tro at DNA-et (genene) har i seg all den informasjonen som trengs for å skape et menneske eller en frosk. Men prøv å slippe et DNA-molekyl ut i et vakuum og se hva som skjer: Ingenting. Det skjer noe først når DNA-et møter de helt bestemte molekylene det er «ment» å møte. Det er bare når det plasseres i et helt bestemt mikrobiologisk miljø at DNA-ets «budskap» får en mening: «Lag de og de aminosyrene, sett dem sammen til de og de proteinene osv.»
Ett forsøk på å begrense problemet med bakgrunnsinformasjonen på, var å lage såkalte «scripts» (eller «frames»), beskrivelser av prototypiske situasjoner man ofte kommer opp i, situasjoner som «på restaurant», «på bussen», «i familieselskap» o.l. For hver av disse situasjonene er kun et begrenset sett med bakgrunnsinformasjon nødvendig. Når jeg tar bussen til byen, vet både jeg og buss-sjåføren hva vi har å gjøre: Jeg gir ham penger og han gir meg billett. Jeg trekker i snoren og han stanser. Når jeg så kommer på jobben, skifter jeg automatisk «script» idet jeg går inn døren. Og på samme måten i andre situasjoner: På butikken, ved middagsbordet hjemme osv. Hver gang er det bare ett sett med kunnskaper som må «aktiveres». Prinsippet med «scripts» synes å gripe et eller annet fundamentalt med måten vi mennesker fungerer på. Skulle vi gå gjennom hele «arkivet» av kunnskaper hver eneste gang, ville verden raskt gå i stå for oss. Men problemet med å overføre dette prinsippet til maskiner, er at vi stadig må vurdere hvilke scripts som passer. Ofte må vi hoppe fra det ene til det andre, eller kombinere ulike scripts. Mens vi sitter på restaurant kan det komme en bekjent eller kollega forbi, og vi må «skru over» på en annen kanal. Eller mannen på nabobordet kan få hjerteproblemer, og da må vi plutselig bryte den regelen i scriptet som sier at vi skal la nabobordene være i fred.
En annen måte å tenke på?
Men om datamaskinene har problemer med det virkelige liv, hvordan greier vi mennesker å takle dette? Eller med andre ord: Hva er det vi har som ikke maskinene har?
Det er greit nok å postulere egenskaper som «teft», «skjønn» og «intuisjon» (som ifølge Kurt Gödel og Roger Penrose ikke er til å komme utenom selv i matematikken), men blir ikke dette ren okkultisme? Om vi mener at vi mennesker har «andre måter å tenke på» enn datamaskinen, bør vi også si noe om hvordan.
Og tilfeldigvis finnes det faktisk en alternativ modell. Ideen er ikke ny. Allerede fra begynnelsen av har det nemlig vært to «skoler» innen datateknologi og KI. Den ene er tradisjonell, «seriell» databehandling, den andre (som lenge lå nede, men som nå er i skuddet igjen) er «nettverks-modellen» (også kalt PDP, «parallel distributed processing»). Mens den serielle, symbolmanipulerende skolen satset på å mekanisere logiske operasjoner, uten å bry seg om dette var måten menneskehjerner arbeidet på, var det noen som gikk den andre veien og brukte hjernen som modell. Inspirert av hjerneforskeren D.O. Hebbs teori om at læring skjer ved at forbindelsen mellom nevroner (hjerneceller) blir styrket, prøvde Frank Rosenblatt på femtitallet å lage kunstige nettverk med enkle «nevroner» (mye enklere enn hjernecellene). Disse kunne lære og løse problemer gjennom prøving og feiling. Han konstruerte et system, «perceptronen», som var i stand til å klassifisere ulike mønstre og skille dem fra hverandre.
Dette «klassifikasjonsproblemet» er av Douglas Hofstadter blitt kalt «det sentrale problemet for KI». Hofstadter koker det ned til et spørsmål om hvordan en datamaskin kan kjenne igjen en «A». For oss høres dette latterlig enkelt ut, men om vi ser alle måtene en A faktisk kan skrives på er det umulig å gi utvetydige regler. Likedan når vi hører en «a». Avhengig av lydene rundt, kan en «a» være alt fra «o» til «e», men vi tolker den likevel rett, ut fra konteksten. Denne typen oppgaver viste seg altså lettere å løse med nettverksmetoden. Her var det nemlig ikke snakk om regler, men om læring, å trene opp et nettverk gjennom å kjøre en rekke eksempler. Hukommelsen ligger ikke i de enkelte nodene («nevronene»), men ligger «distribuert» i hele systemet. Forbindelsen mellom nodene (tilsvarer synapsene i hjernen) kan ha ulik vekt, og det er i summen av disse vektene, i mønstrene disse danner, at nettverkets hukommelse til enhver tid finnes. Man trener nettverket på eksempler og ser på resultatet av hvert forsøk. Feilene blir kalkulert og tilbakemeldt til nettverket, som korrigeres ved at vekterne blir justert. Dermed blir også systemets hukommelse justert, det lærer.
Med boken Parallel Distributed Processing (1986) satte David Rumelhart og James McClelland i gang en ny bølge, og en ny optimisme. For nettverksmodellen så ut til å være svaret på akkurat de problemene den tradisjonelle KI-forskningen hadde kjørt seg fast på: Å takle den ikke-formaliserte informasjonen, der regler ikke hjelper. Vi har nevnt det å klassifisere nesten like tilfeller som en kategori: Det kan være å se at en krusedull er en «a» (noe tre år gamle unger greier svært godt), eller å kjenne igjen et ansikt (dette er også noe vi mennesker har en utrolig kapasitet til, forsøk har vist at vi kan huske tusenvis). En variant av dette er å tenke med metaforer ñ her er det jo også snakk om å oppdage mønstre som går igjen.
Andre fordeler som kunstige nevrale nettverk har vis-à-vis vanlige KI-programmer, er at de kan lære, uten programmering, og at de ikke kollapser pga. en liten feil. Alle som har jobbet med tradisjonelle datasystemer vet hvor utrolig sårbare de er. Få steder gjelder ordtaket om at «liten tue kan velte stort lass» mer enn her. Nevrale nettverk, derimot, lar seg ikke så lett vippe av pinnen. Om én node ramler ut, betyr det ikke så mye: «Hukommelsen» sitter ikke i de enkelte nodene, men i de dynamiske mønstrene som finnes i nettverket som et hele.
Ikke bare KI-forskere, men også andre som på en eller annen måte har kognisjon som sitt felt (filosofer, psykologer, antropologer) har grepet fatt i nettverksmodellen som om det var den hellige Gral. For her var endelig det håndfaste beviset på at det finnes andre måter å tenke på enn den den symbolmanipulerende, rasjonalistiske modellen foreskrev. Hubert Dreyfus var en av dem som så nettverksmodellen som en bekreftelse på at rasjonalismen var falsk:
Dersom flerlags-nettverk holder hva de lover, vil forskerne måtte oppgi overbevisningen til Descartes, Husserl og den tidlige Wittgenstein om at den eneste måten å produsere intelligent adferd på er ved å speile verden med en formell teori i tanken. Verre er at man må gi opp den mer grunnleggende filosofiske intuisjonen om at det må finnes en teori for hvert aspekt av virkeligheten.
Andre er mer forbeholdne, og viser til at kunstige nettverk til nå kun har vært modellerte på vanlige datamaskiner, og følgelig har benyttet seg av vanlig «computing» eller symbolprosessering. Penrose, f.eks., mener dette betyr at konneksjonismen ikke kan gi forklaringen på menneskets ikke-algoritmiske evner. Men at kunstige nettverk til nå har vært henvist til å modelleres på vanlige computere, betyr at det vi har sett så langt kun er en forsmak, mener andre. Det er først når vi får laget og prøvd ut spesialbygde nettverk at ideen vil slå ut i full blomst. Og dette er like rundt hjørnet.
Simulerte eller virkelige, neurale nettverk er ikke bare teori, de har allerede funnet kommersiell anvendelse, bl.a. i sikkerhetskontroll av flybagasje, og kvalitetskontroll av kjøtt i danske slakterier. Men den viktigste effekten så langt har vært den filosofiske: Inntil nå hadde filosofer og andre kunnet snakke om «andre» måter å tenke på, men uten at de kunne si noe om hvilke. Og så finnes det plutselig datasystemer som viser at dette ikke bare er tomt prat, at kognisjon kan fungere etter helt andre prinsipper enn logisk prosessering av symboler. Og at dette ikke bare er unntaket, men høyst sannsynlig den vanlige måten hjernen vår jobber på. Ren logikk bedriver vi bare i spesialtilfeller, og da ofte som ren «etterpåklokskap», når vi skal begrunne hvorfor vi gjorde eller tenkte som vi gjorde.
Nettverksmodellen har satt i gang nytenkning innenfor alle kognitive vitenskaper, og det er ikke å overdrive å si at et paradigmeskifte er på gang. Den rasjonalistiske forståelsen av kognisjon ñ «datamaskinmodellen» ñ har jo vært grunnlaget for nesten alle teorier innen kultur- og samfunnsvitenskapene. Det man har tatt for gitt, er at en kultur består av et system av betydninger, uttrykt i tegn. Å forstå et slikt system, en kultur, var ifølge teorien ensbetydende med å forstå de reglene som bandt systemet sammen. Man kan si at allerede Wittgenstein hadde vist urimeligheten i dette, men nettverksmodellen gjør det enda tydeligere. Og i enkelte fag, som sosialantropologi, er det allerede noen som har tatt dette inn over seg. Og det er forsøket på å lese kulturens underliggende strukturer eller regler som nå avvises som en misforståelse:
«En ting som både strukturalisme og symbolsk/fortolkende antropologi hadde som en grunnleggende forutsetning var ideen om at kultur er en struktur, et system -- en slags helhetlig ting,» sier Roy D'Andrade i sin bok The Development of Cognitive Anthropology, der han særlig er opptatt av hvordan nettverksmodellen ødelegger antropologiens oppfatning av kultur som noe systematisk, regelbundet: «Kultur sies ofte å bestå av regler (...) Disse reglene sies å være implisitte fordi vanlige folk ikke kan si hva de er (..). Men det finnes ingen regler ñ eksplisitte eller implisitte --i et nevralt nettverk.»
Ekstra interessant for psykologer og antropologer er at nettverksmodellen gir en mulig forklaring på fenomenet med prototyper og «familielikhet». Også kunstige nevrale nettverk viser nemlig den såkalte «prototypeeffekten», og årsaken er rett og slett statistikk: En (innlært) prototype representerer et statistisk gjennomsnitt av ens erfaringer.
En annen forestilling som har dominert antropologien, er ideen om at språket bestemmer hvordan vi oppfatter verden, den såkalte Sapir-Whorf-hypotesen. Her er språket et slags «slør» som bare slipper gjennom det som språket tillater (har språket bare tre farger, ser man bare tre farger). Også denne forestillingen mener D'Andrade blir slått til jorden av nettverksmodellen:
Fra nettverkssynspunktet, er slørhistorien ukorrekt (...) I nettverksmodellen «koder» ikke «ord» erfaringer. Det er heller slik at ord angir skjemaer, som betyr at enhetene som aktiveres av en bestemt språklyd også aktiverer et større mønster av forbindelser som er det aktive skjema for en bestemt erfaring. Lydene av ord er som «pekere» til mønstre av erfaring ñ veivisere til indre mentale strukturer, ikke «slør» mellom virkeligheten og erfaringen.
Filosofen Paul Churchland skriver også om hvordan nettverksbasert kunnskap er annerledes enn man har forestilt seg den språklige:
Vår evne til å gjenkjenne eller uttrykke oppfattede egenskaper overgår vanligvis vår evne til å artikulere eller uttrykke grunnlaget for slike distinksjoner i ord. Smaker og farger er de fremste eksemplene, men poenget viser seg å ha en langt videre gyldighet. Ansikter er også noe vi kan skjelne, gjenkjenne, og huske, i en grad som overgår ethvert mulig verbalt uttrykk. Ansiktsuttrykk for følelser er et tredje eksempel. Gjenkjennelsen av lyder er et fjerde. Ved nærmere undersøkelse viser det førspråkliges forrang framfor det språklige faktisk å gjelde alle våre kognitive kategorier.
Hva så?
Den «klassiske» KI-forskningens fallitt har implikasjoner langt ut over sitt eget fagfelt. Vitenskaper som sosialantropologien synes å stå overfor en temmelig drastisk reformulering. For det som har skjedd nå, er intet mindre enn at antropologiens «gjenstander» ñ symbolene, begrepene, tegnene ñ har smuldret bort som sand mellom fingrene. Og dette gjelder ikke bare antropologien, men samtlige kulturvitenskaper. De har, for å bruke Bibelens ord, bygd sine hus på sand, på begreper og forestillinger som i beste fall er temmelig uklare. For hva kan man nå si om en «tanke» eller et «begrep»? Hvordan kan en tanke «representeres»? Selv den enkleste tanke involverer et astronomisk antall hjerneceller og enda flere forbindelser. Og en tanke lar seg avgrense like lite logisk som fysio-logisk: Den sprer seg ut i et nesten uendelig nettverk av assosiasjoner og forutsetninger.
Nettverksmodellen er selvfølgelig ikke noen fullstendig beskrivelse av hvordan vi mennesker tenker. Hjernens naturlige nettverk er uendelig mer komplekst enn de kunstige man i overskuelig framtid vil klare å bygge, og bruker også andre prinsipper: Bl.a. kjemiske signaler spiller en viktig rolle, f.eks. ved å forsterke eller dempe aktiviteten i nevronene. For å forstå hjernen (og den menneskelige fornuft) må vi forstå den som et biologisk fenomen, som et produkt av evolusjonen. Og det er nettopp dette som er begynt å skje: Lærdommen fra KI-forskningen, og fra forsøkene med kunstige nettverk, inngår i dag i en uhyre spennende dialog med forskning innenfor en rekke andre kognitive disipliner: Nevrologi, psykologi, lingvistikk, antropologi, m.m. Denne tverrfaglige forskningen (som også inkluderer mange filosofer) er helt unik i vitenskapshistorien, og er i ferd med å gi resultater som antyder en ny vitenskapelig revolusjon, kanskje like dramatisk som den på 1600-tallet. Nobelprisvinneren Gerald Edelman ser f.eks. det som nå skjer, som innledningen til «den største av alle vitenskapelige revolusjoner, med viktige og uungåelige sosiale konsekvenser».
I ett av sine partier mot «Deep Blue» syntes Kasparov at han så et glimt av noe som lignet menneskelig intelligens. Dette viste seg å være falsk alarm, og datamaskinene vil kanskje aldri kunne tenke på «vår måte». Det paradoksale er at det var nettopp datamaskinene, gjennom Kunstig intelligens-forskningen, som skulle vise oss dette.
Litteratur
En mer utførlig beskrivelse av den «kognitive revolusjonen» og dens implikasjoner finnes i Bjørn Vassnes' Myten om Fornuften (Pax, 1997).
Ellers:
Churchland, P.: The Engine of Reason, the Seat of the Soul (Bradford/MIT, 1995)
Clark, A.: Being There (MIT, 1997)
Copeland, J.: Articial Intelligence (Blackwell, 1993)
D. Andrade, R.: The Development of Cognitive Anthropology (Cambridge UP, 1995)
Dreyfus, H&S: «Making a mind versus modelling the brain», i Boden, red., The Philosophy of Artificial Intelligence (Oxford UP, 1990)
Winograd & Flores, Understanding Computers and Cognition (Addison-Wesley, 1987)
Copyright Kulturkanalen
og Samtiden, 5/6-97