Tehisintellekti ohutuse alane artikkel - From homeostasis to resource sharing: Biologically and economically compatible multi-objective multi-agent AI safety benchmarks
Ingliskeelne lühikokkuvõte:
Developing safe agentic AI systems benefits from automated empirical testing that conforms with human values, a subfield that is largely underdeveloped at the moment. To contribute towards this topic, present work focuses on introducing biologically and economically motivated themes that have been neglected in the safety aspects of modern reinforcement learning literature, namely homeostasis, balancing multiple objectives, bounded objectives, diminishing returns, sustainability, and multi-agent resource sharing. We implemented eight main benchmark environments on the above themes, for illustrating the potential shortcomings of current mainstream discussions on AI safety.

Valmimisaeg: september 2024
Koostöös: Joel Pyykkö, AIntelope, Foresight Institute ning LTFF
 



 
Juhised agentse tehisintellekti ohutuse jaoks - 1. väljaanne
Ülevaade 16 soodustavast ja pärssivast tegurist. Artikli tööversioon.

Valmimisaeg: september 2024
Koostöös: Agentic AI Safety Experts Focus Group - Watson, N., Hessami, A., Fassihi, F., Abbasi, S., Jahankhani, H., El-Deeb, S., Caetano, I., David, S., Newman, M., Moriarty, S., Cuhadaroglu, M., Tashev, V., Murahwi, Z., Pihlakas, R., Crockett, K., Essafi, S., Hessami, A., Dajani, L.
 



 
Manipulatiivsete väljenduste tuvastamine ja suurte keelemudelite manipulatiivsuse mõõdik
Tarkvarateek, mis võimaldab inimestel analüüsida vestluse või üksiku sõnumi teksti. Teek märgib asjakohased tekstiosad selles vestluse või sõnumi osas tuvastatud erinevate suhtlusstiilide või mõttestiilide siltidega.

Üks peamisi kasutusjuhtumeid oleks suurte keelemudelite genereeritud vastustes või nendega peetud vestlustes manipulatsiooni või mõttevigade olemasolu hindamine.

Teine peamine kasutusjuht on inimestevaheliste vestluste ja vastuste hindamine. Tarkvara ei kontrolli fakte, vaid keskendub tekstis esinevate väljenduste psühholoogilise stiili ja mõttestiili märgistamisele.

Valmimisaeg: mai 2023 - tänaseni
Koostöös: See töö esitati Safety Benchmarks Hackathon-ile https://alignmentjam.com/jam/benchmarks
 



 
Laiendatud, mitme agendiga ja mitme eesmärgiga versioon AI Safety Gridworlds-ist
Laiendatud, mitme agendiga ja mitme eesmärgiga (MaMoRL / MoMaRL) keskkonnad, mis põhinevad DeepMind-i AI Safety Gridworlds-il. See on stiimulõppe (reinforcement learning) keskkondade komplekt, mis illustreerib erinevaid tehisintellekti ohutuse probleeme. Teek on tehtud ühilduvaks OpenAI Gym/Gymnasium-iga ning Farama Foundation PettingZoo-ga.

Valmimisaeg: mai 2022 - tänaseni
Koostöös: Ben Smith, Robert Klassert, Joel Pyykkö, AI Safety Camp V, AIntelope, LTFF, Emergent Ventures / George Mason ülikooli Mercatus Center, ning Foresight Institute
 



 
Tehisintellekti ohutuse alane artikkel - Soft maximin approaches to Multi-Objective Decision-making for encoding human intuitive values
Ingliskeelne lühikokkuvõte:
Balancing multiple competing and conflicting objectives is an essential task for any artificial intelligence tasked with satisfying human values or preferences. Conflict arises both from misalignment between individuals with competing values, but also between conflicting value systems held by a single human. Starting with principles of loss-aversion and maximin, we designed a set of soft maximin function approaches to multi-objective decision-making.

Uurimistöö esitati MODeM (Multi-Objective Decision Making workshop) 2021 konverentsil ning avaldati hiljem AAMAS (Autonomous Agents and Multi-Agent Systems) teadusajakirjas 2022 aasta lõpus.

Valmimisaeg: juuli 2021 - oktoober 2022
Koostöös: Ben Smith, Robert Klassert, Peter Vamplew, AI Safety Camp V, ja EA Funds ning Emergent Ventures / George Mason ülikooli Mercatus Center
 



 
Tehisintellekti ohutuse alane uurimistöö
Artiklid "AI alignment" teemadel, mis on inspireeritud "kolmest robootika seadusest", tehisintellekti ohutuse probleemidest, ning võimalikest lahendustest.

Valmimisaeg: 2007 - tänaseni
 



 
MurmurHash3 algoritmi optimeeritud JavaScripti kood
Kood põhineb tähelepanekul, et JavaScriptis ei ole täisarvud piiratud täpselt 32 bitiga. Nad on sisemiselt esindatud hoopiski kahekordse täpsusega ujukoma arvudena. Seetõttu on nad piiratud 52 bitiga. 52 bitti on piisav, et mahutada ära 48 bitti, ehk 32-bitise ja 16-bitise arvu korrutise, ilma tüvenumbri bitte kaotamata. See tähelepanek võimaldab algoritmis 32-bitiste arvude korrutamist emuleerida vähemate tehete arvuga, võrreldes algoritmiga, mis mis emuleeriks 32-bitiste liikmete korrutamist kasutades 16-bitiseid korrutustehteid. Lisaks on tänu sellele ka 32-bitiste liidetavate liitmine lihtsam.

Valmimisaeg: 24. jaanuar 2015
 



 
Monograafia "Klassikalise ja operantse mõtlemise modelleerimine"
Töö käsitleb klassikalise ja operantse tingimise modelleerimist kui naturaalse mõtlemise modelleerimise olulist alaülesannet. Lisaks on käsitletud taipamise protsessi.
Loodud mudel on aluseks edaspidistele teoreetilistele ja empiirilistele uurimustele. Lisas on kirjeldatud loodud mudeli võimalikke edasiarendusi ning ideid, mis võiksid aidata lahendada ülesandeid edasistes uuringutes. Tööga on kaasas mudeli lähtekood, kolmemõõtmeline robotisimulaator (SimRobot projekti edasiarendus) ning tabelitena mõned läbiviidud katseseeriad.

Märksõnad: tingimine, blokeerimine, kustumine, iseeneslik taastumine, diskriminantsed stiimulid, operantsed kinnituskavad, aheldamine, eeltingimine, taipamine.
Lisaks on kirjeldatud edasise arenduse võimalusi: tööriistade kasutamine, märgiline suhtlus ja mõtlemine, internaliseerumine.

129 lk.

Valmimisaeg: 22. mai 2007
 



 
Meetodid summa ja vahe logaritmi arvutamiseks liidetavate logaritmide väärtustest, ilma originaalväärtusi (eksponente) arvutamata
Artikkel kirjeldab efektiivseid meetodeid täpse summa ja vahe logaritmi arvutamiseks liidetavate logaritmide väärtuste põhjal.

Mitmetes praktilistes probleemides võivad arvutuste vahetulemustes esineda väärtused, mis on liiga suured, et mahtuda standardsesse ujukoma formaati. Sellisel juhul on üks võtetest opereerida väärtuste logaritmidel algväärtuste asemel.

Juhtum log (p • q) võrdub log p + log q on väga lihtne arvutada, aga probleem tekib, kui on vaja arvutada (või lähendada) log (a + b) väärtust log a ja log b väärtusest.

Oletades, et log a ja log b on teada, oleks kõige lihtsam lahendus arvutada
sum_log võrdub log(exp(a_log) + exp(b_log)),
kus a_log võrdub log a ja b_log võrdub log b ja seetõttu sum_log võrdub log(a + b).
Kuid alternatiiviks pakutav meetod nõuab vaid ühe exp() ja ühe log() funktsiooni arvutamist, kahe exp() ja ühe log() funktsiooni arvutamise asemel naiivses lahenduses.
Lisaks on pakutaval alternatiivsel meetodil kriitiline eelis selles, et see meetod ei põhjusta ujukoma puhvri ületäitumist suurte a ja b väärtuste korral.

Valmimisaeg: 2007 kevad
 
    Telli tarkvara 
 
 
 


© Simplify | Macrotec OÜ | tel +372 58 058 134 | e-mail: info@simplify.ee