Verteilte Künstliche Intelligenz - Uni Ulm WS95/96
5 "Theories of Agency"
Viele Formalismen beschäftigen sich nur mit einem Aspekt der Agentenmodellierung: "Belief", "Goals and Desires", "Introspection", für eine umfassendere theoretische Erarbeitung von Agenten ist es jedoch notwendig, die verschiedenen Ansätze innerhalb eines logischen Rahmen einzubetten.
* Motivation
* Moore, Cohen und Levesque, Singh, Werner
* Rao & Georgeff
* und andere
* Zusammenfassung
Literatur: M.J. Wooldridge: The Logical Modelling of computational Multi-Agent Systems. PhD Thesis, University of Manchester, Department of Computation, Technical Report MMU-DOC-94-01, 1992.
5.1 Motivation
Nicht nur die Kombination von Beliefs, Goals und Desire sondern auch die dynamischen Aspekte müssen logisch beschreibbar sein.
* wie sind Information (Beliefs) und Ziele und Wünsche miteinander verbunden?
* Wie verändert sich der kognitive Zustand eines Agenten über die Zeit?
* Wie beeinflußt die Umgebung den kognitiven Zustand eines Agenten?
* Wie beeinflussen Informationen und Einstellungen die Handlungen eines Agenten?
5.2 Ansatz von Cohen und Levesque
"rationale Balanz" zwischen Glauben, Ziele, Aktionen und Intentionen im Mittelpunkt, basierend auf einer "possible world" Semantik. es handelt sich um eine mehr-sorten, multi-modale Logik. Mit 4 modalen Operatoren:
* (BEL x p) Agent x glaubt p
* (GOAL x p) Agent x hat das Ziel p
* (HAPPENS a) Aktion a wird als Nächste durchgeführt werden
* (DONE a) Aktion a ist gerade ausgeführt worden
Diese Arbeit beeinflußte:
* Analyse und Kooperation im Multi-Agentendialog
* Theorie der kooperativen Problemlösungen
Literatur: Cohen P.R. & Levesque H.J., 1990: Intention is Choice with Commitment. Artificial Intelligence, 42: 213-261.
Intentionen stehen im Mittelpunkt (vgl. Bratman):
* Intentionen stehen am Anfang der Aktivität von Agenten, Agenten auf der Suche nach Problemlösungen für die aus ihrer Intention sich ergebenden Problemstellungen
* Intentionen filtern und adaptieren andere Intentionen
* Agenten verfolgen ihre Intentionen hartnäckig
* Agenten halten ihre Intentionen für möglich und unter bestimmten Umständen für realisierbar
* Agenten glauben nicht, daß sie ihre Intentionen nicht realisieren können.
* Agenten intendieren nicht alle "Seiteneffekte" die mit dem Erreichen ihrer Intention verbunden sind.
"a logic of rational agency" - Auf zwei Ebenen
* atomaren
"being careful to sort out the relationships among the basic modal operators. "
* molekularen
"new concepts defined out of the primitives ..., properties of communicateive acts can be derived form the embedding logic of rational interaction, whose properties are themselves grounded in rational action."
Dynamik
Neben den Operatoren DONE und HAPPENS werden weitere Operatoren genutzt, um die Struktur von Ereignissequenzen zu beschreiben, z.B.
* a;a' Ereignis a' folgt auf Ereignis a
* a? Testaktion (tritt auf, wenn a vorliegt, und löst ein leeres Ereignis aus)
Benutzt werden modalen Zeitoperatoren, z.B.:
*
p := exists x: (HAPPENS
x;p?)
*
p := ¬
¬p
* (LATER p) := ¬p &
p
Auf der atomaren Ebene - Aktionen HAPPENS und DONE
Einige Eigenschaften komplexer Aktionen
(HAPPENS a;b) := (HAPPENS a; (HAPPENS b)?)
(DONE a) := (DONE (HAPPENS a)?;a)
p == (DONE p?)
Definitionen
(DONE x a) := (DONE a) & (AGT x a)
(HAPPENS x a) := (HAPPENS a) & (AGT x a)
AGT ordnet jedem Event einen Agenten zu, der als Initiator für diesen Event verantwortlich zeichnet.
Auf der atomaren Ebene - Belief
Axiome (Weak S5)
forall x (BEL x p) & (BEL x (p =>q)) => (BEL x q)
forall x
(BEL x p) => (BEL x (BEL x p))
forall x
¬(BEL x p) => (BEL x ¬(BEL x p))
forall x
(BEL x p) => ¬(BEL x p)
Inferenzregel
f then
(BEL x f)
Wissen und Glauben
(KNOW x p) := p & (BEL x p)
Kompetenz
(COMPETENT x p) := (BEL x p) => (KNOW x p)
Kompetentes Wissen über die eigene Tat
forall x,e (AGT x e) => [(DONE e) == (BEL x (DONE e))]
Auf der atomaren Ebene - Achievement Goal
Konsistenz
forall x (GOAL x p) => ¬(GOAL x ¬p)
Achievement Goals
(A-GOAL x p) := (GOAL x (LATER p)) & (BEL x ¬p)
Keine Persistenz von Zielen - Jedes Ziel wird irgendwann aufgegeben
¬(GOAL x (LATER
p))
Auf der molekularen Ebene - "Persistent Goal"
p
ist ein "persistent goal" - ein andauerndes Ziel genau dann wenn:* der Agent hat das Ziel, daß
* der Agent gibt das Ziel
p nur auf, falls p erreicht wurde oder falls er zu der Ansicht gekommen ist, daß p generell nicht erreichbar ist.(P-GOAL x p) := (GOAL x (LATER p)) & (BEL x ¬p) & [BEFORE ((BEL x p) |
(BEL x
¬p)) ¬(GOAL x (LATER p))]
mit (LATER p) := ¬p &
p
und
(BEFORE p q) := forall c (HAPPENS c;q?) => exists a: (a «= c) &
(HAPPENS a;p?)
Auf der molekularen Ebene - Intention
Intention als eine bestimmte Art des persistent goal
(INTENTION x a) := (P-GOAL x [DONE x (BEL x (HAPPENS a))?; a])
Die Intention, eine Aktion a auszuführen, ist eine Art von Verpflichtung (Persistent-Goal) a ausgeführt zu haben. Es ist nicht nur eine Verpflichtung etwas zu tun, sondern die Handlung bewußt zu tun, d.h. zunächst daran zu glauben, daß er sie gleich ausführen wird und es dann auch zu tun.
Ein Modell dieses Ansatzes ist beschrieben durch:
<U,P,E,Agt,T,B,G,Pr>* U eine Menge von Dingen (Universum)
* P ist eine Menge von Agenten
* E ist eine Menge primitiver Aktionen
* Agt: E -> P ordnet Ereignisse die verantworlichen Agenten zu
* T subset-of World ist eine Menge von Welten
* B subset-of T x P x Z x T st die Verbindungsrelation zwischen den Welten bzgl. Glauben (K45D), schwach S5
* G subset-of T x P x Z x T ist die Verbindungsrelation zwischen den Welten bzgl. der Ziele (D seriell) und G subset-of B
* Pr interpretiert die Prädikate
Die Semantik der Sprache wird über die Erfülltheitsrelation
zwischen Strukturen der Form
<M,sigma,v,n>
und Formeln der Sprache definiert (M ist ein Modell, sigma eine Sequenz von
Ereignissen, v bezeichnet die Variablenzuordnungsfunktion und n den zeitlichen Index ).
<M,sigma,v,n>
(HAPPENS a)
iff exists m in Z (m »= n) & <M,sigma,v,m[a]n>
<M,sigma,v,n>
(DONE a) iff
exists m in Z (m «= n) & <M,sigma,v,m[a]n>
<M,sigma,v,n>
(BEL x a) iff
forall sigma' in World <sigma, v(x),n,sigma'> in B =>
<M,sigma',v,n>
a
<M,sigma,v,n>
(GOAL x a) iff
forall sigma' in World <sigma,v(x),n,sigma'> in G =>
<M,sigma',v,n>
a
mit m[a]n bedeutet, daß a zwischen den Zeitpunkten n und m auftritt.
5.3 Ansatz von Werner
Werner definiert den kognitiven Zustand eines Agenten als Trippel:
<I,S,V>
*
I als Informationszustand*
S als intentionaler Zustand*
V als EvaluierungszustandLiteratur: Werner E., 1989: Cooperating Agents a Unified Theory of Communication and Social Structure. In: L.Gasser, and M. Huhns (eds.): Distributed Artificial Intelligence Vol. II, 3-36, San Mateo, CA.
Ein paar Bemerkungen zu CANPLAN.
* P,P1.... Eigenschaften
* Rn, Rn n-stellige Relationen für
* O eine Menge von Indiviuen.
* T eine Menge von Zeitpunkten geordnet durch die Relation <.
* TP eine Menge von Zeitperioden.
Eine Situation s ist eine Menge von Objekten in O, welche bestimmte Eigenschaften P haben und in der Relation Rn zueinander stehen, z.B.
S = {Pa;yes. Qa;no. R(a,b);yes}
CANPLAN - eine Multimodale Logik mit 8 Modaloperatoren
| Pµ | µ galt irgendwann in der Vergangenheit |
| Fµ | µ gilt rgendwann einmal |
| es ist notwendig für Agenten A, daß µ gilt | |
| Agent A plant, µ zu erreichen | |
| Gruppe G plant, µ zu erreichen | |
| CANµ | Agent A kann µ erreichen |
| COCANµ | Agent A kann mit anderen kooperieren, um µ zu erreichen |
| COPCANµ | Gruppe G kann µ kooperativ erreichen |
5.4 Rao & Georgeff - BDI Architekturen
Es existieren keine klaren Vorstellungen, welche Kombination von Vorinformation und Pro-Attitüden geeignet sind, einen Agenten zu charakterisieren:
* Konolige - Beliefs
* Cohen und Levesque - Beliefs und Goals
* Werner - Glauben (Information), Intention (Strategien) und Nützlichkeit
* Rao & Georgeff: Beliefs, Desire (oder Goals) und Intentions.
Basierend auf einer Theorie von sich verzweigenden zeitlichen Entwicklungen, in welcher die Belief-, Desire- und Intention-acessible Welten in Form von sich verzweigenden Zeitstrukturen interpretiert werden.
Insbesondere wird der Frage nachgegangen, wie die Antizipation von zukünftigen Zuständen, die Handlungen von Agenten beeinflußt.
Literatur: Rao A. Georgeff M.P., 1991: Modeling Rational Agents within a BDI Architecture. In: Principles of Knowledge Representation and Reasoning. Proceedings of the Second International Conference. Cambridge Massachusetts.
Branching Time

Im Gegensatz zu dem Ansatz von Cohen und Levesque, die jede mögliche Welt als eine Sequenz von Ereignissen entlang einer unendlichen Zeitachse interpretieren, repräsentieren Rao und Georgeff jede Welt als einen Zeitbaum.

Die aktuelle Welt ist eine von den über die Belief-Relation erreichbaren Welten, z.B. b1.
Dann wären die Ziele beschrieben durch die zu b1 korrespondierende Welt, die über die Goal-Relation erreichbar ist. Ziele und Intentionen bilden "Submengen" der Glaubensinhalte.
Intentionen bilden "first-class" Objekte vgl. Cohen/Levesque.
Intentionen in Anlehnung an Bratman bilden partielle Pläne, die angewendet werden können, um die Ziele zu erreichen, ähnlich den Strategien von Werner.
Es wird unterschieden zwischen:
* Entscheidungsfreiheit des Agenten
* Entwicklungen der Welt, die aus der Dynamik der Umwelt resultiert und nicht direkt auf die Handlungen des Agenten zurückgeführt werden können.
Beispiel

Ereignisse: d1 - gehe zu Zahnärztin Ohneschmerz
d2 - gehe zu Zahnarzt Mahlzahn
b - gehe schwimmen
Fakten: p - Schmerz
f - Zahnfüllung
Jeder Zeitbaum, zeigt die Entscheidungsfreiheiten eines Agenten auf, ein Agent A glaubt X zu einem Zeitpunkt t, wenn X zum Zeitpunkt t in allen über die Belief-Relation erreichbaren Welten wahr ist.
Formale Theorie
Erweiterung der CTL Logik (Temporale Aussagenlogik mit verzweigenden Zeiten) von Emerson durch:
* Prädikatenlogik erster Ordnung
* Einführung modaler Operatoren für Belief, Goals und Intentions
Unterscheidung in
* state-formula (evaluiert zu einem bestimmten Zeitpunkt)
* path-formula (evaluiert über einen bestimmten Pfad)
Syntax:
* jede Prädikatenformel ist eine state formula.
* wenn p1 und p2 state formula sind und x ist ein Individuum oder eine Ereignisvariable, dann sind ¬p1, p1 | p2 und exists x.p1(x) auch state formulas.
* wenn e ein Ereignis, dann sind auch succeeds(e), fails(e), does (e), succeeded(e), failed(e) und done(e) state formula.
* wenn eine p state formula ist dann ist auch BEL(p), GOAL(p), und INTEND(p) state formula.
* wenn q eine path formula ist, dann ist auch optional(q) eine state formula.
* jede state formula ist auch eine path formula
* wenn q1 und q2 path formulas sind, dann sind auch &172;q1, q1 | q2,
q1 U q2, exists x.q1(x),
q1 und
q1 path formulas.
(
U until,
Auszüge aus der Semantik
Interpretation:
M = <W, E, T,
, U,
B, G,
I, Pr>
W Menge von Welten, E
Menge von primitiven Ereignistypen, T Menge von Zeitpunkten,
binäre Relation auf den Zeitpunkten, U
das Universum, Pr ist eine Abbildung von Entities erster Ordnung nach U bei gegebener Welt w und Zeitpunkt t, eine Situtation w
W =
T
w subset-of T eine Menge von Zeitpunkten der Welt w und Aw entspricht
M,v,(wt0,wt1,...)
p iff M, v, wt0
p
M,v,(wt0,wt1, ...)
q iff M,v,(wt1, ...)
q
M,v,(wt0,wt1,...)
q iff exists k: k »= 0 , so daß
M,V,(wtk,...)
q
M,v,(wt0,wt1, ...)
q1 U q2 iff
(a) exists k, k»=0, so daß M, v, (wtk, ...)
q2
forall 0 «= j < k: M,v,(wtj,...)
q1
oder
(b) forall k »= 0, M,v,(wtk, ...)
q1
Ereignisse:
M, v, w
t1done(e) := succeeded(e) | failed(e)
suceeds(e) = inevitable (e)(inevitable(
y) := ¬optional(¬q) ......
Beliefs, Goals and Intentions:
M, v, wt
BEL(p)
iff forall w' in Œ Bw,t : M, v, w't
p
M, v, w
tM, v, w
tAxiome
A1 GOAL(p) implies BEL(p)
A2 INTEND(p) implies GOAL(p)
A3 INTEND(does(p)) implies does(p)
A4 INTEND(p) IMPLIES BEL(INTEND(p))
A5 GOAL(p) implies BEL(GOAL(p))
A6 INTEND(p) implies GOAL(INTEND(p))
A7 done(e) implies BEL(done(E))
A8 INTEND(p) implies inevitable(
Folgende Formeln sind erfüllbar:
* BEL(p) & ¬GOAL(p))
* inevitable(
BEL(p)) &
¬GOAL(p)
* GOAL(p) & BEL(inevitable(
(p
implies r))) & ¬GOAL(r)
Jedoch gilt die Geschlossenheit unter Implikation für Intention und Ziele, folgende Formeln sind gültig:
INTEND(p) & INTEND(p implies r) implies INTEND(r)
GOAL(p) & GOAL(p implies r) implies GOAL(r)
5.4 Situated Automaton
Der Ontologische Status von "possible worlds" und "epistemischen Alternativen" ist fragwürdig"
vs.
"possible worlds" sind eine sinnvolle Abstraktion, auch wenn sie nicht notwendigerweise "existieren" müssen.
Eine Alternative sind die "situated automaton" von Rosenschein. Hier wird die Information analysiert, die implizit im Zustand eines Automaten vorhanden ist.
Literatur: Rosenschein S.J., Kaelbling L.P., 1995: A situated view of representation and control. Artificial Intelligence 73 (1995) 149-173. Kaelbling L.P., Littman M.L., Cassandra A.R., 1995: Partially Obervable markov Decision Processes for Artificial Intelligence. Wachsmuth I., Rollinger C.-R., Brauer W. (eds.): KI-95: Advances in Artificial Intelligence. Springer, Heidelberg, 1-18.
"the key lies in understanding how a process can naturally mirror in its states subtle conditions in its environments and how this mirrowng states ripple out to overt actions that eventually achieve goals."
Allgemeine Definition eines Automaten
<S,Sigma,A,delta,lambda,s0>
* S ist ein Menge von Zuständen
* Sigma ist eine Menge von Inputs
* A ist eine Menge von Outputaktionen
* delta: S x Sigma -> S ist eine Zustandsfunktion, die gegeben einen Zustand und eine Inputfunktion den nächsten Zustand berechnet.
* lambda: S -> A ist die Ausgabefunktion
* s0 in S ist der initiale Zustand
Der Automat interagiert mit seiner Umwelt durch das Senden von Outputs, die Umgebung versorgt den Automaten wiederum mit einem Stimulus, der zu einem internen Zustandsübergang führt und wiederum einen Output auslösen wird usw..

Der Zustand einer Welt wird beschrieben durch den Zustand des Systems und den Zustand der Umgebung.
* Unterscheidung nach deterministischen und nicht deterministischen Welten
* Absolute oder nur teilweise Beobachtung dieser Welt durch den Agenten möglich
Kontrolle eines Markovprozesses mit partieller Beobachtbarkeit

SE (state estimator): in Abhängigkeit der letzten Aktion, der aktuellen Beobachtung und des früheren Glaubens über den Zustand der Welt manifestiert sich der Glauben über die derzeitige Welt (sie wird als Wahrscheinlichkeitsverteilung angegeben).
π (policy): Strategie wie sich ein Agent gegeben eine bestimmte Situation am besten verhält (Auswertung eines kontinuierlichen Belief Markov Entscheidungsprozesses)
"impractical for problems of reasonable size... the results are encouraging and have allowed us to get very good solutions ... in the order about 100 states...."
5.5 Zusammenfassung
Offene Probleme:
* Omniscience, Inkonsistenz
* Resource Bounded
* Beziehung zwischen Intention und Aktion
* Welche Kombination von Attitüden ist erforderlich, Agenten zu beschreiben, z.B. BDI (Rao & Georgeff) oder Notion of Choice (Shoham)
Welche Rolle soll eine entwickelte Agententheorie spielen?
* Spezifikation von Agenten (ähnliche Problemstellung, wie im Softwareengineering, welche Eigenschaften eines Agenten, seines Glauben usw. können abgeleitet werden), wie nützlich und ausdrucksstark ist eine spezielle Spezifikationssprache?
* Wissensrepräsentationsformalismus - es stellt sich dann die Frage nach der Wissensverarbeitung, Algorithmen gesucht, die mit solchen Theorien schliessen
* Anregung für die Kognitionswissenschaften und die Philosophie (dies war z.B. die Intention von Hintikka).
