scholarly journals Collective artificial intelligence and personalized educational interactions in learning new skills

2017 ◽  
Author(s):  
Χαϊρή Κιουρτ

Η Κοινωνική Μάθηση (Social Learning) αποτελεί μια νέα, σημαντική περιοχή έρευνας στον τομέα της Τεχνητής Νοημοσύνης (Artificial Intelligence) και συγκεκριμένα στην μελέτη των μηχανισμών μάθησης των πολυπρακτορικών συστημάτων (Multi-Agent Systems) παιχνιδιού. Επίσης, θεωρείτε ένας σημαντικός άξονας μελέτης και εφαρμογών για διάφορους επιστημονικούς τομείς, όπως η κοινωνιολογία, η οικονομία και το μάρκετινγκ. Οι κοινωνικοί οργανισμοί (Social Organizations), βασιζόμενοι στα συστήματα προσομοίωσης με πράκτορες, καθώς και η μελέτη/διερεύνηση των στρατηγικών/τεχνικών εκπαίδευσης και μάθησης των πρακτόρων, εμπνεύστηκαν από την ικανότητα των ανθρώπων να μαθαίνουν από κοινωνικά περιβάλλοντα που είναι πλούσια σε κρυφές πληροφορίες και σε αλληλεπιδράσεις μεταξύ οντοτήτων (π.χ. ανθρώπων). Αυτός ο πλούτος του περιβάλλοντος, είναι μια πηγή πολυπλοκότητας όπου ένας μαθητευόμενος πρέπει να μπορεί να πλοηγηθεί ορθά και αποτελεσματικά σύμφωνα με τον στόχο του. Η εισαγωγή της κοινωνικής δυναμικής στα πολυπρακτορικά περιβάλλοντα, θεωρείται ως μια πολλά υποσχόμενη προσέγγιση για την προσομοίωση ρεαλιστικών συμπεριφορών παιχνιδιού, συμπεριφορές που μοιάζουν με ανθρώπινες, καθώς και για την ανάδειξη της σημαντικότητας της Συλλογικής Γνώσης (Collective Knowledge).Η διατριβή αυτή, στοχεύει στην έρευνα της απόδοσης των συνθετικών πρακτόρων (Synthetic Agents) σε σενάρια μάθησης και παιξίματος σε παιχνίδια στρατηγικής με μηδενικό άθροισμα (Zero-Sum). Επίσης, αναδεικνύουμε την σημαντικότητα και την ικανότητα των μοντέλων μάθησης με βάση τον αντίπαλο (Opponent Based Learning), που παρουσιάζουν τα ανταγωνιστικά κοινωνικά περιβάλλοντα με στόχο την αποδοτικότερη μάθηση και παίξιμο ενός πράκτορα.Οι συνθετικοί πράκτορες σχεδιάστηκαν και αναπτύχθηκαν με βάση διάφορους συνδυασμούς κάποιων βασικών παραμέτρων μάθησης, όπως η επιλογή μεταξύ εξερεύνησης και εκμετάλλευσης γνώσης, ταχύτητα μάθησης κ.α.. Στη συνέχεια, οι συνθετικοί πράκτορες αλληλεπιδρούν σε μεγάλους αριθμούς παιχνιδιών και τα πειραματικά δεδομένα αναλύονται για τον προσδιορισμό των ομαδοποιήσεων τους, που παρουσιάζουν σημαντικές συσχετίσεις μεταξύ των παραμέτρων μάθησης και την τελική κατάταξη των επιδόσεων τους.Επιπλέον, εξετάζουμε πώς οι συνθετικοί πράκτορες αλληλεπιδρούν σε κοινωνικά περιβάλλοντα, χρησιμοποιώντας διάφορες στρατηγικές εκπαίδευσης εναντίον διαφόρων αντιπάλων (πράκτορες με διαφορετικά χαρακτηριστικά μάθησης και παιξίματος). Αυτός ο πειραματισμός εκπαίδευσης και παιξίματος, αναδεικνύει πως η ποιότητα του παιξίματος εξαρτάται περισσότερο από τη ορθή παραμετροποίηση του μηχανισμού μάθησης παρά από την εμπειρία.Εξετάζουμε επίσης, την πρόοδο/εξέλιξη της μάθησης των άπειρων πρακτόρων σε κοινωνικά περιβάλλοντα ανταγωνιστικών παιχνιδιών, στοχεύοντας στον προσδιορισμό της επίδρασης ενός έμπειρου αντιπάλου σε έναν αρχάριο πράκτορα. Η διερεύνηση των επιπτώσεων της πολυπλοκότητας του περιβάλλοντος στη συμπεριφορά παιξίματος και μάθησης των συνθετικών πρακτόρων, αναδεικνύει τον τρόπο με τον οποίο ένας αποτελεσματικός παίκτης πρέπει να προσαρμόσει το προφίλ μάθησης και παιξίματος του, για να διατηρήσει ένα συγκεκριμένο προφίλ απόδοσης, όταν η πολυπλοκότητα τους κοινωνικού περιβαλλοντικές μεταβάλλεται.Για την επιβεβαίωση των πειραμάτων αποτελεσμάτων, διεξάγουμε μια αξιολόγηση, μεγάλης κλίμακας, των υπαρχουσών μεθόδων αξιολόγησης της επίδοσης των παικτών (Elo και Glicko), εφαρμοσμένες σε πολυπρακτορικά συστήματα, όπου τονίζεται μια ασυνέπεια (ασυμφωνία) ως προς τον τρόπο με τον οποίο οι προαναφερθέν μέθοδοι αξιολογούν της επιδόσεις των συνθετικών πρακτόρων. Στην συνέχεια, προτείνουμε μία νέα προσέγγιση αξιολόγησης της επίδοσης των πρακτόρων. Η προσέγγιση αυτή, μπορεί να θεωρηθεί ως βάση για την ανάπτυξη μεθόδων αξιολόγησης της επίδοσης παικτών για πολυπρακτορικά συστήματα. Με ένα μεγάλο αριθμό πειραμάτων αποδεικνύεται η αποτελεσματικότητά της προσέγγισης που προτάχθηκε.Επίσης, στα πλαίσια της διατριβής αυτής, παρουσιάζεται μία μέθοδος επιλογής αντιπάλου από μία ομάδα διαφορετικών πρακτόρων, με σκοπό την αποτελεσματικότερη μάθηση και παίξιμο. Μελετήθηκε ένας συνθετικός πράκτορας (με προφίλ καλού παίκτη) όπου πειραματίζεται σε παιχνίδια στρατηγικής με διάφορες αλληλουχίες διαφορετικών αντιπάλων (πράκτορες με διαφορετικά χαρακτηριστικά παιξίματος και επιδόσεις) για τον προσδιορισμό της αλληλουχίας που θα του προσφέρει την "αποτελεσματικότερη μάθησης". Τα αποτελέσματα των πειραμάτων, δείχνουν ότι η αποτελεσματικότερη πρόοδος και η σταθερότερη εξέλιξη ενός πράκτορα, προκύπτει όταν αυτός αντιμετωπίζει αρχικά αντιπάλους με χειρότερο προφίλ παιξίματος από το δικό του και σταδιακά επιλέγει αντιπάλους με καλύτερο προφίλ παιξίματος. Επίσης, οι μελέτες δείχνουν πως ένας συνθετικός πράκτορας με σωστά διαμορφωμένο/παραμετροποιημένο μηχανισμό μάθησης αποδίδει καλύτερα όταν αντιμετωπίζει λιγότερο ευνοϊκά διαμορφωμένους πράκτορες.Η προσομοίωση των κοινωνικών περιβαλλόντων, όπως στα προαναφερθέντα πειράματα, απαιτεί τεράστιους υπολογιστικούς πόρους. Για τον λόγο αυτό τα πειράματα της διατριβής αυτής διαχειρίστηκαν μέσω κατανεμημένων ή υψηλής απόδοσης υπολογιστικών υποδομών, όπως οι υποδομές του HellasGrid. Για το σκοπό αυτό, η διατριβή αυτή, παρουσιάζει μια νέα πλατφόρμα με διάφορες καινοτομίες για την τμηματοποίηση και τη διαχείριση των πειραμάτων κοινωνικής προσομοίωσης, πολυπρακτορικά συστήματα παιχνιδιών. Η πλατφόρμα αυτή, διαχειρίζεται μέσω ενός διαδικτυακού γραφικού περιβάλλοντος χρήστη, συνδυάζοντας τα πλεονεκτήματα των υπολογιστικών υποδομών υψηλής απόδοσης (HellasGrid), του δυναμικού ενδιάμεσου λογισμικού τους (Middleware) και των εξελιγμένων συστημάτων ροής εργασίας, με τρόπο που ορισμένες γενικές λειτουργίες θυσιάζονται προς όφελος της απόκτησης μιας ομαλής και σταθερής εξέλιξης των κατανεμημένων υπο-πειραμάτων, χωρίς να διακυβεύεται η ασφάλεια όλων των συστημάτων. Τέλος, η πλατφόρμα αυτή μπορεί να χρησιμοποιηθεί από ερευνητές του τομέα της μηχανικής μάθησης, για να πειραματιστούν με τα δικά τους παιχνίδια, μηδενικού αθροίσματος και τους δικούς τους μηχανισμού μάθησης πρακτόρων.


Author(s):  
Mehdi Dastani ◽  
Paolo Torroni ◽  
Neil Yorke-Smith

AbstractThe concept of anormis found widely across fields including artificial intelligence, biology, computer security, cultural studies, economics, law, organizational behaviour and psychology. The concept is studied with different terminology and perspectives, including individual, social, legal and philosophical. If a norm is an expected behaviour in a social setting, then this article considers how it can be determined whether an individual is adhering to this expected behaviour. We call this processmonitoring, and again it is a concept known with different terminology in different fields. Monitoring of norms is foundational for processes of accountability, enforcement, regulation and sanctioning. Starting with a broad focus and narrowing to the multi-agent systems literature, this survey addresses four key questions: what is monitoring, what is monitored, who does the monitoring and how the monitoring is accomplished.



Automatica ◽  
2016 ◽  
Vol 73 ◽  
pp. 200-206 ◽  
Author(s):  
Jingying Ma ◽  
Yuanshi Zheng ◽  
Bin Wu ◽  
Long Wang


2020 ◽  
Vol 14 (1) ◽  
pp. 75-87
Author(s):  
Claudia Cavallaro ◽  
Gabriella Verga ◽  
Emiliano Tramontana ◽  
Orazio Muscato

 When a person visits an unknown large city having multiple interesting locations, it is not so easy for him to find one location that is lively and convenient to visit in a given time-frame. To overcome such a problem, this paper proposes to make use of two technologies: smartphones, equipped with sensors for reading GPS coordinates; and multi-agent systems, providing assistance to users and gathering collective knowledge. Data collected by means of devices are analysed and organised in such a way to find locations that could be of immediate interest to people. Proposed agents gather opinions from several users, in terms of scores quantifying the level of satisfaction on visiting some place on a given time-frame. While gathering such an opinion, a solution is put into place to preserve user privacy (his location). Suggestions are made to potentially interested users by selecting for them locations according to closeness and satisfaction scores. In this approach, interesting locations emerge from the analysis of data gathered, hence scores and suggestions can be available for any large city in any place, provided that enough people hand data to the system. Moreover, such places are found dynamically according to people behaviour and preferences.



AI Magazine ◽  
2018 ◽  
Vol 39 (4) ◽  
pp. 29-35
Author(s):  
Christopher Amato ◽  
Haitham Bou Ammar ◽  
Elizabeth Churchill ◽  
Erez Karpas ◽  
Takashi Kido ◽  
...  

The Association for the Advancement of Artificial Intelligence, in cooperation with Stanford University’s Department of Computer Science, presented the 2018 Spring Symposium Series, held Monday through Wednesday, March 26–28, 2018, on the campus of Stanford University. The seven symposia held were AI and Society: Ethics, Safety and Trustworthiness in Intelligent Agents; Artificial Intelligence for the Internet of Everything; Beyond Machine Intelligence: Understanding Cognitive Bias and Humanity for Well-Being AI; Data Efficient Reinforcement Learning; The Design of the User Experience for Artificial Intelligence (the UX of AI); Integrated Representation, Reasoning, and Learning in Robotics; Learning, Inference, and Control of Multi-Agent Systems. This report, compiled from organizers of the symposia, summarizes the research of five of the symposia that took place.



2019 ◽  
Vol 3 (2) ◽  
pp. 21 ◽  
Author(s):  
David Manheim

An important challenge for safety in machine learning and artificial intelligence systems is a set of related failures involving specification gaming, reward hacking, fragility to distributional shifts, and Goodhart’s or Campbell’s law. This paper presents additional failure modes for interactions within multi-agent systems that are closely related. These multi-agent failure modes are more complex, more problematic, and less well understood than the single-agent case, and are also already occurring, largely unnoticed. After motivating the discussion with examples from poker-playing artificial intelligence (AI), the paper explains why these failure modes are in some senses unavoidable. Following this, the paper categorizes failure modes, provides definitions, and cites examples for each of the modes: accidental steering, coordination failures, adversarial misalignment, input spoofing and filtering, and goal co-option or direct hacking. The paper then discusses how extant literature on multi-agent AI fails to address these failure modes, and identifies work which may be useful for the mitigation of these failure modes.



2001 ◽  
Vol 16 (3) ◽  
pp. 277-284 ◽  
Author(s):  
EDUARDO ALONSO ◽  
MARK D'INVERNO ◽  
DANIEL KUDENKO ◽  
MICHAEL LUCK ◽  
JASON NOBLE

In recent years, multi-agent systems (MASs) have received increasing attention in the artificial intelligence community. Research in multi-agent systems involves the investigation of autonomous, rational and flexible behaviour of entities such as software programs or robots, and their interaction and coordination in such diverse areas as robotics (Kitano et al., 1997), information retrieval and management (Klusch, 1999), and simulation (Gilbert & Conte, 1995). When designing agent systems, it is impossible to foresee all the potential situations an agent may encounter and specify an agent behaviour optimally in advance. Agents therefore have to learn from, and adapt to, their environment, especially in a multi-agent setting.



2000 ◽  
Vol 15 (2) ◽  
pp. 197-203 ◽  
Author(s):  
RUTH AYLETT ◽  
KERSTIN DAUTENHAHN ◽  
JIM DORAN ◽  
MICHAEL LUCK ◽  
SCOTT MOSS ◽  
...  

One of the main reasons for the sustained activity and interest in the field of agent-based systems, apart from the obvious recognition of its value as a natural and intuitive way of understanding the world, is its reach into very many different and distinct fields of investigation. Indeed, the notions of agents and multi-agent systems are relevant to fields ranging from economics to robotics, in contributing to the foundations of the field, being influenced by ongoing research, and in providing many domains of application. While these various disciplines constitute a rich and diverse environment for agent research, the way in which they may have been linked by it is a much less considered issue. The purpose of this panel was to examine just this concern, in the relationships between different areas that have resulted from agent research. Informed by the experience of the participants in the areas of robotics, social simulation, economics, computer science and artificial intelligence, the discussion was lively and sometimes heated.



Author(s):  
Roman Dushkin ◽  
Mikhail Grigor'evich Andronov

This article meticulously examines the questions of application of certain technologies of multi-agent systems theory in the area of unmanned traffic management for combatting the so-called “generative adversarial attacks” on the computer vision systems that are used in such vehicles. The article provides examples of generative-adversarial attacks on various types of neural networks, as well as describes the problems that arise when using computer vision. Possible solutions to these problems are proposed. Research methodology includes the theory of multi-agent systems applicable to automobile transport, which suggests using the so-called V2X-interaction, i.e. constant exchange of information between the vehicle and various actors involved in road traffic – a central control system, other vehicles, roadside infrastructure and pedestrians. The authors’ special contribution to this research lies in application of the theory of multi-agent systems for traffic arrangement with consideration of its actors as the agents with diverse roles. The novelty consists in employment of one of the methods of artificial intelligence in solution of the problems, obtained due to the use of other methods of artificial intelligence (recognition of images in computer vision). The relevance of the study is based on the detailed coverage of the questions of organization of unmanned traffic on training grounds and public roads.



Sign in / Sign up

Export Citation Format

Share Document