Re: [Friclist] Se kdo najde v tem?

Rok Resnik Fri, 04 Jun 2010 06:10:47 -0700

Hoj,

Ja, ampak lahko je enosmerni [info. kanal] (od AI k tebi). Kar se tiče AI,lebdi v
vesolju, in razen nje same ni ničesar več. Ti pa bereš podatke, in
čakaš na trigger - AI se je reprogramirala v Zlodeja - in takrat,
seveda ustaviš in zalaufaš debugger.

Ali gre za enosmeren ali dvosmeren kanal je irelevantno. V splošnem gre zaneke oblike interakcijo pri kateri lahko superinteligentna AI vpliva na nas,tudi če jo samo 'opazujemo' (prikaže nam recimo izjemno prepričljiv video onjenih dobrohotnih namerah in nujnosti tega, da ji damo malce več svobode,da bo lažje vplivala na zunanji svet - kako ve za nas? Tako kot bi miopazili v našem vesolju inteligentni design, če bi ta obstajal. :)).

Omenil si tudi, da bi lahko zaznali kdaj se je AI transformirala v Zlodeja:kako misliš, da bi to lahko napravili?

Kompleksnost njenih miselnih procesov bi namreč hitro izjemno narastla,zaradi česar bi bilo njeno zavajanje zelo težko/praktično nemogočezaznati... Že pri drugih ljudeh imamo težave s tem, pri čemer nas jeevolucija močno optimizirala za takšne naloge, medtem ko bi pri tako tujemrazumu kot je 'de novo' AI povsem pogoreli.

Tukaj si predpostavil da ima AI dejansko precizno vedenje o fizikalnih
značilnostih našega sveta (še bolj precizno, očitno, kot ga imamo mi
sami), vedenje o tem kaj se dogaja okrog njenega clusterja (in to brez
da bi imela kakršenkoli input iz okolice). Od kje ji to vedenje? Ni
namreč treba, da ji ga damo, še vedno je lahko inteligentna, samo na
fiziko se ne spozna.

Pomisli na to, kako bi AI sploh zlezla po lestvici do transčloveškeinteligence. Obstaja sicer več potencialnih poti, od učenja v nekempreprostejšem virtualnem svetu, do podajanja večjih količin informacij vobliki DVD-ja z wikipedijo. V vsakem primeru pa ji nekaj podatkov enostavnomoramo podati, kar pa hitro pomeni, da lahko na osnovi teh tudi izluščifizikalne zakone našega sveta (niti ne potrebuje česa natančnejšega karimamo mi - trenutna kvatna fizika/kemija namreč zadostuje za izgradnjonano-robotov, ki ji na široko odprejo vrata na prostost). Če imaš težavopredstavljati si, kako bi ji to lahko uspelo, si preberi naslednjo zgodbo:http://lesswrong.com/lw/qk/that_alien_message/

Eden izmed naukov te zgodbe je, kako zelo neučinkoviti smo ljudje pri izrabiinformacij, ki jih pridobimo iz okolja. AI bi bila pri tem mnogo boljša inbi tako lahko že na osnovi peščice bitov locirala pravilne hipoteze, kar papri ljudeh zahteva nekaj velikostnih redov več informacij.

Si kdaj pomislil da bi bil scenarist romantičnih komedij? To bo še
večji hit kot Twilight: programer se zaljubi v zlobno AI, in jo
izpusti; nevedoč, da ga bo takoj za tem pokončala division by zero
napaka na njegovem mobilnem telefonu.


:-D

(očitno bi bilo bolje, če bi se kar ti lotil pisanja takšnih scenarijev)

Spet veliko predpostavk, ki so nam samoumevne, za AI pa zelo tuje. AI
"živi" v svojem svetu, njeni edini vhodni signali so signali, ki ji
jih je programer namenil. Recimo da je to:
- dostop do pomnilnika
- dostop do audio/video signala iz okolice (vem, če bi bil jaz
programer, bi hotel da me vidi, svojega kreatorja)

Potemtakem tudi ljudje 'živimo v svojem svetu' naših možganov, pa nam očitnonavkljub temu uspe marsikaj postoriti. :)

Osredotočaš se na napačen nivo abstrakcije. Seveda AI je neka koda zdostopom do pomnilnika, diskovja in kakih drugih V/I naprav, vendar ali tanajnižji nivo opisa sploh kakorkoli omejuje njene sposobnosti? Ne samo, dajih ne, njegov učinek je celo nasproten. Medtem ko ima AI precizen dostop dolastne kode, se moramo ljudje zadovoljiti z introspektivnim opazovanjempovšine svojega uma in le zelo grobo visokonivojsko kontrolo - nobenemožnosti nimamo, da bi npr. videli kaj počenja določena skupina nevronov injo popravili. AI je torej zaradi te sposobnosti potencialno še mnogomočnejša od nas.

Tvoje besede so me drugače spomnile na še nekaj pomembnejšega: očitno prisvojem modeliranju AI (tudi formalnem, kakršen je recimo AIXI) pogostorazmišljamo v skladu s kartezičnim dualizmom. V osnovi gre za delitev na AIter na svet, pri čemer lahko AI vpliva nanj le preko točno določenihmehanizmov (teoretično gledano pošlje nek bit-string na svoj izhod), kjer setudi nahaja dualistična meja med 'virtualnim/platonističnim' agentom in'materialnim' svetom... Dejanska slika je seveda drugačna: AI je del sveta,tako kot vse drugo. Njena dejanja vplivajo tudi na njo samo in če želimorazumeti samo-modifikacijo, moramo razumeti tudi to. Zaradi tega tudipotrebujemo reflektivno teorijo odločanja... (zadnje opazke so namenjenebolj meni samemu - se opravičujem, če so nerazumljive :)).

Kakorkoli že, predlagam, da si na hitro pogledaš AI-Box Experiment tule:http://yudkowsky.net/singularity/aibox(sp. del o protokolu ipd. ni posebej pomemben - relevanten je predvsemrezultat, ki je (po mojem spominu, stran namreč trenutno ne deluje) vsaj venem poskusu uspešen pobeg AI iz Boxa, pri čemer jo je igral sicer zelozvit, a še vedno inteligenčno zelo omejen človek. Za transčloveškointeligenco torej to ne bi smel biti kak poseben izziv.)

Omenil bi še eno izmed ključnih idej FAI designa: konzervativnost pripredpostavkah o zmogljivosti AI.Primer: če nisi ravno prepričan kako hitra je lahko rekurzivnasamo-izboljšava vse do nivoja superinteligence, je bolje predpostaviti, daje lahko zelo hitra, v časovnem okviru sekund in ne tednov ali let. Zakaj?Ker na takšen način poskrbiš za večjo robustnost varnostnih mehanizmovpotencialne FAI, podobno kot so recimo dvigala zgrajena, da zdržijo10-kratno največjo možno obremenitev. Če nam uspe ustvariti Friendly AI inpreživeti eksplozijo inteligence (tehnološko singularnost), nam to ne bouspelo le za las, temveč kot posledica dobrega načrtovanja s širokim pasomvarnostne tolerance. Filmski scenariji tule odpadejo.

Če to idejo povlečeš na področje izolacije AI v nek cluster (AI-Box), sehitro vidi, da takšna zasnova ne zdrži visokih meril FAI designa.

Res pa obstaja vsaj ena različica te ideje, ki vsaj na prvi pogled ni takoslaba (<razmišljam, ali bi počakal, da jo odkriješ sam...>).

Oh well, gre za sledeče: motivacijski sistem AI zasnuješ tako, da je njenprvi podcilj design AI-Boxa iz katerega ne more uiti. S tem uporabiš njenomoč proti njej sami. Kako to narediti... je pa drugo vprašanje. Poleg tegaima ideja še druge pomankljivosti.

Rok

Re: [Friclist] Se kdo najde v tem?

Reply via email to