AAMAS 2025: Proceedings of the 2025 International Conference on Autonomous Agents and Multiagent Systems

Main Page

Table of Contents

Table of Contents

AAMAS'25 Chairs Welcome

AAMAS'25 IFAAMAS Copyright Page

Conference Organization

Area Chairs

Senior Program Committee

Program Committee

Auxiliary Reviewers

Special Track Reviewers

Awards

Sponsors & Supporters

(Return to Top)

Keynote Talks	Blue Sky Ideas	Demo Track
Research Paper Track	Doctoral Consortium	JAAMAS Track
Extended Abstracts

Return to top

Keynote Talks

Responsible AI and Autonomous Agents: Governance, Ethics, and Sustainable Innovation (Page 1)
Virginia Dignum (AI Policy Lab, Umeå University)

The Agent Paradox: Can Multi-Agent Systems Replicate the Complexity of Human Cognition and Social Behavior? (Page 3)
Rada Mihalcea (University of Michigan)

Multiagent Systems, and the Search for Appropriate Foundations: A Personal Journey and Retrospective (Page 4)
Jeffrey S. Rosenschein (The Rachel and Selim Benin School of Computer Science and Engineering, The Hebrew University of Jerusalem)

Return to top

Research Paper Track

Enhancing Offline Reinforcement Learning with Curriculum Learning-Based Trajectory Valuation (Page 5)
Amir Abolfazli (L3S Research Center)
Zekun Song (Technical University of Berlin)
Avishek Anand (Delft University of Technology)
Wolfgang Nejdl (L3S Research Center)

Who Reviews The Reviewers? A Multi-Level Jury Problem (Page 14)
Ben Abramowitz (Tulane University)
Omer Lev (Ben-Gurion University of the Negev)
Nicholas Mattei (Tulane University)

An Improved Mechanism for Pricing Ride-Hailing Fares (Page 23)
Marek Adamczyk (Institute of Informatics, University of Wroclaw)
Maurycy Borkowski (Institute of Informatics, University of Wroclaw)
Michal Pawlowski (University of Warsaw & Sapienza University of Rome)

EFX Allocations and Orientations on Bipartite Multi-graphs: A Complete Picture (Page 32)
Mahyar Afshinmehr (Sharif University of Technology)
Alireza Danaei (Sharif University of Technology)
Mehrafarin Kazemi (Sharif University of Technology)
Kurt Mehlhorn (Max Planck Institute for Informatics, Saarland Informatics Campus)
Nidhi Rathi (Max Planck Institute for Informatics, Saarland Informatics Campus)

Harmonious Balanced Partitioning of a Network of Agents (Page 41)
Pulkit Agarwal (Indian Institute of Technology Bombay)
Harshvardhan Agarwal (Indian Institute of Technology Bombay)
Vaibhav Raj (Indian Institute of Technology Bombay)
Swaprava Nath (Indian Institute of Technology Bombay)

SCMRAG: Self-Corrective Multihop Retrieval Augmented Generation System for LLM Agents (Page 50)
Rishabh Agrawal (University of Western Ontario)
Murtaza Asrani (University of Western Ontario)
Hadi Youssef (University of Western Ontario)
Apurva Narayan (University of Western Ontario)

Investigating the Perspective of Non-Native Speakers on Foreigner-Directed Speech using Virtual Agents: The Role of Racial Ingroup Affiliation and Language Proficiency on Perception and Comprehension (Page 59)
Ohenewa Bediako Akuffo (Socially Interactive Agents, University of Würzburg)
Birgit Lugrin (Socially Interactive Agents, University of Würzburg)

Return to top

Impact Measures for Gradual Argumentation Semantics (Page 69)
Caren Al Anaissy (CRIL, Univ. Artois CNRS & LIP6, Sorbonne University)
Jérôme Delobelle (Université Paris Cité, LIPADE, F-75006)
Srdjan Vesic (CRIL CNRS Univ. Artois)
Bruno Yun (Universite Claude Bernard Lyon 1, CNRS, Ecole Centrale de Lyon, INSA Lyon, Université Lumière Lyon 2, LIRIS, UMR5205, 69622)

Approximation Ratio for Preference Aggregation Using Tree CP-Nets (Page 78)
Abu Mohammad Hammad Ali (University of Regina)
Daniel Ogundare (University of Regina)
Boting Yang (University of Regina)
Sandra Zilles (University of Regina and Amii)

Geometric Freeze-Tag Problem (Page 87)
Sharareh Alipour (Tehran Institute for Advanced Studies, Khatam University)
Kajal Baghestani (Sharif University of Technology)
Mahdis Mirzaei (University of Tehran)
Soroush Sahraei (University of Tehran)

Robin Hood Reachability Bidding Games (Page 96)
Shaull Almagor (Technion)
Guy Avni (University of Haifa)
Neta Dafni (Technion)

A Hypothesis-Driven Approach to Explainable Goal Recognition (Page 105)
Abeer Alshehri (University of Melbourne & King Khalid University)
Hissah Alotaibi (Jazan University)
Tim Miller (University of Queensland)
Mor Vered (Monash University)

Algorithmically Fair Maximization of Multiple Submodular Objective Functions (Page 115)
Georgios Amanatidis (Athens University of Economics and Business Archimedes / Athena RC)
Georgios Birmpas (University of Liverpool)
Philip Lazos (Jump Trading)
Stefano Leonardi (Sapienza University of Rome)
Rebecca Reiffenhäuser (University of Amsterdam)

Truthful and Welfare-maximizing Resource Scheduling with Application to Electric Vehicles (Page 124)
Ramsundar Anandanarayanan (Indian Institute of Technology Bombay)
Swaprava Nath (Indian Institute of Technology Bombay)
Prasant Misra (Tata Consultancy Services Limited)

Model and Mechanisms of Consent for Responsible Autonomy (Page 133)
Anastasia S. Apeiron (Utrecht University)
Davide Dell'Anna (Utrecht University)
Pradeep K. Murukannaiah (Delft University of Technology)
Pinar Yolum (Utrecht University)

Return to top

FORM: Learning Expressive and Transferable First-Order Logic Reward Machines (Page 142)
Leo Ardon (Imperial College London)
Daniel Furelos-Blanco (Imperial College London)
Roko Parac (Imperial College London)
Alessandra Russo (Imperial College London)

Probably Correct Optimal Stable Matching for Two-Sided Market Under Uncertainty (Page 152)
Andreas Athanasopoulos (University of Neuchâtel)
Anne-Marie George (University of Oslo)
Christos Dimitrakakis (University of Neuchâtel)

Bidding Games on Markov Decision Processes with Quantitative Reachability Objectives (Page 161)
Guy Avni (University of Haifa)
Martin Kurecka (Masaryk University)
Kaushik Mallik (IMDEA Software Institute)
Petr Novotný (Masaryk University)
Suman Sadhukhan (University of Haifa)

Fair Allocation of Divisible Goods under Non-Linear Valuations (Page 170)
Haris Aziz (UNSW Sydney)
Zixu He (UNSW Sydney)
Xinhang Lu (UNSW Sydney)
Kaiyang Zhou (UNSW Sydney)

Condorcet Winners and Anscombe's Paradox Under Weighted Binary Voting (Page 179)
Carmel Baharav (ETH Zürich)
Andrei Constantinescu (ETH Zürich)
Roger Wattenhofer (ETH Zürich)

Local Topological Information as a Powerful Enhancer for Generalizable Neural Method in Travelling Salesman Problem (Page 188)
Xiaoxin Bai (School of Computer Science and Engineering, Southeast University)
JunYang Yang (School of Cyber Science and Engineering, Southeast University)
Shengchao Yuan (School of Computer Science and Engineering, Southeast University)
Yinghao Zhang (School of Electronics and Information Engineering, South China University of Technology)
Hanqian wu (School of Cyber Science and Engineering, Southeast University)

On the Gale-Shapley Algorithm for Stable Matchings with a Partial Honesty Nash Refinement (Page 197)
James P. Bailey (Rensselaer Polytechnic Institute)
Craig A. Tovey (Georgia Institute of Technology)

The Price of Anarchy in Spatial Social Choice (Page 205)
James P. Bailey (Rensselaer Polytechnic Institute)
Craig A. Tovey (Georgia Institute of Technology)

Alternating-time Temporal Logic with Stochastic Abilities (Page 214)
Gabriel Ballot (SEIDO Lab, EDF R&D and Télécom Paris, Institut Polytechnique de Paris)
Vadim Malvone (LTCI, Télécom Paris, Institut Polytechnique de Paris)
Jean Leneutre (LTCI, Télécom Paris, Institut Polytechnique de Paris)
Jingxuan Ma (SEIDO Lab, EDF R&D)
Mourad Leslous (SEIDO Lab, EDF R&D)

Return to top

An AI-Driven Card Playing Robot: An Empirical Study on Communicative Style and Embodiment with Elderly Adults (Page 223)
Michael Banck (AI and Knowledge Systems, University of Würzburg)
Elisabeth Ganal (Socially Interactive Agents, University of Würzburg)
Hanna-Finja Weichert (Socially Interactive Agents, University of Würzburg)
Frank Puppe (AI and Knowledge Systems, University of Würzburg)
Birgit Lugrin (Socially Interactive Agents, University of Würzburg)

On the Complexity of Learning to Cooperate in Populations of Socially Rational Agents (Page 233)
Saptarashmi Bandyopadhyay (Department of Computer Science, University of Maryland)
Mustafa Mert Çelikok (Department of Intelligent Systems, Delft University of Technology)
Robert Loftin (Department of Computer Science, University of Sheffield)

Beyond Words: Integrating Personality Traits and Context-Driven Gestures in Human-Robot Interactions (Page 242)
Tahsin Tariq Banna (Robotics & Mechatronics Engineering, University of Dhaka)
Sejuti Rahman (Robotics & Mechatronics Engineering, University of Dhaka)
Mohammad Tareq (Accounting & Information Systems, University of Dhaka)

Neural DNF-MT: A Neuro-symbolic Approach for Learning Interpretable and Editable Policies (Page 252)
Kexin Gu Baugh (Imperial College London)
Luke Dickens (University College London)
Alessandra Russo (Imperial College London)

Sea-cret Agents: Maritime Abduction for Region Generation to Expose Dark Vessel Trajectories (Page 261)
Divyagna Bavikadi (Arizona State University)
Nathaniel Lee (Arizona State University)
Paulo Shakarian (Arizona State University)
Chad Parvis (EpochGeo)

Opinion Dynamics with Median Aggregation (Page 271)
Petra Berenbrink (University of Hamburg)
Martin Hoefer (RWTH Aachen University)
Dominik Kaaser (TU Hamburg)
Marten Maack (University of Hamburg)
Malin Rau (Chalmers University of Technology)
Lisa Wilhelmi (RWTH Aachen University)

Speed vs Accuracy in Goal Recognition for Time-Sensitive Applications: A Game-Theoretic Approach (Page 280)
Sara Bernardini (University of Oxford)
Fabio Fagnani (Politecnico di Torino)
Santiago Franco (Royal Holloway University of London)

To Spend or to Gain: Online Learning in Repeated Karma Auctions (Page 289)
Damien Berriaud (ETH Zürich)
Ezzat Elokda (ETH Zürich)
Devansh Jalota (Stanford University)
Emilio Frazzoli (ETH Zürich)
Marco Pavone (Stanford University)
Florian Dörfler (ETH Zürich)

Return to top

Towards Envy-Freeness Relaxations for General Nonmonotone Valuations (Page 298)
Umang Bhaskar (Tata Institute of Fundamental Research)
Gunjan Kumar (Indian Institute of Technology Kanpur)
Yeshwant Pandit (Tata Institute of Fundamental Research)
Rakshitha (Indian Institute of Technology Delhi)

Maximizing Value in Challenge the Champ Tournaments (Page 307)
Umang Bhaskar (Tata Institute of Fundamental Research)
Juhi Chaudhary (Tata Institute of Fundamental Research)
Palash Dey (IIT Kharagpur)

Agent-based Modeling and Simulation of Ambiguity in Catastrophe Insurance Markets (Page 316)
Yu Bi (King's College London)
Lingxiao Zhao (King's College London)
Jinyun Tong (King's College London)
Zhe Feng (Ki Insurance)
Carmine Ventre (King's College London)

Equilibrium Analysis in Markets with Asymmetric Utility Functions (Page 325)
Martin Bichler (Technical University of Munich)
Markus Ewert (Technical University of Munich)
Axel Ockenfels (University of Cologne & Max Planck Institute for Research on Collective Goods)

Temporal Network Creation Games: The Impact of Non-Locality and Terminals (Page 334)
Davide Bilò (University of L'Aquila)
Sarel Cohen (Hasso Plattner Institute)
Tobias Friedrich (Hasso Plattner Institute)
Hans Gawendowicz (Hasso Plattner Institute)
Nicolas Klodt (Hasso Plattner Institute)
Pascal Lenzner (University of Augsburg)
George Skretas (Hasso Plattner Institute)

Return to top

Minimizing Rosenthal's Potential in Monotone Congestion Games (Page 343)
Vittorio Bilò (University of Salento)
Angelo Fanelli (Université Paris-Dauphine, Université PSL, CNRS, LAMSADE)
Laurent Gourvès (Université Paris-Dauphine, Université PSL, CNRS, LAMSADE)
Christos Tsoufis (Université Paris-Dauphine, Université PSL, CNRS, LAMSADE)
Cosimo Vinci (University of Salento)

Synergistic Traffic Assignment (Page 352)
Thomas Bläsius (Karlsruhe Institute of Technology)
Adrian Feilhauer (Karlsruhe Institute of Technology)
Markus Jung (Karlsruhe Institute of Technology)
Moritz Laupichler (Karlsruhe Institute of Technology)
Peter Sanders (Karlsruhe Institute of Technology)
Michael Zündorf (Karlsruhe Institute of Technology)

EnEnv 1.0: Energy Grid Environment for Multi-Agent Reinforcement Learning Benchmarking (Page 361)
Dominik Jacek Bogucki (Institute of Fundamental Technological Research, Polish Academy of Sciences & IDEAS NCBR)
Lukasz Lepak (Institute of Computer Science, Warsaw University of Technology)
Sonam Parashar (IDEAS NCBR)
Bartlomiej Blachowski (Institute of Fundamental Technological Research, Polish Academy of Sciences)
Pawel Wawrzynski (IDEAS NCBR)

Monte Carlo Tree Search with Velocity Obstacles for Safe and Efficient Motion Planning in Dynamic Environments (Page 371)
Lorenzo Bonanni (University of Verona)
Daniele Meli (University of Verona)
Alberto Castellini (University of Verona)
Alessandro Farinelli (University of Verona)

Feature Engineering for Agents: An Adaptive Cognitive Architecture for Interpretable ML Monitoring (Page 381)
Gusseppe Bravo-Rocca (Barcelona Supercomputing Center)
Peini Liu (Barcelona Supercomputing Center)
Jordi Guitart (Barcelona Supercomputing Center & Universitat Politècnica de Catalunya)
Rodrigo M. Carrillo-Larco (Emory University)
Ajay Dholakia (Lenovo Infrastructure Solutions)
David Ellison (Lenovo Infrastructure Solutions)

Computing Efficient Envy-Free Partial Allocations of Indivisible Goods (Page 390)
Robert Bredereck (Institut für Informatik, TU Clausthal)
Andrzej Kaczmarczyk (Department of Computer Science, The University of Chicago)
Junjie Luo (School of Mathematics and Statistics, Beijing Jiaotong University)
Bin Sun (Institut für Informatik, TU Clausthal)

Compositional Shielding and Reinforcement Learning for Multi-Agent Systems (Page 399)
Asger Horn Brorholt (Aalborg University)
Kim Guldstrand Larsen (Aalborg University)
Christian Schilling (Aalborg University)

Return to top

Scalable Offline Reinforcement Learning for Mean Field Games (Page 408)
Axel Brunnbauer (TU Wien & DatenVorsprung GmbH)
Julian Lemmel (TU Wien & DatenVorsprung GmbH)
Zahra Babaiee (TU Wien & DatenVorsprung GmbH)
Sophie A. Neubauer (DatenVorsprung GmbH)
Radu Grosu (TU Wien)

Welfare Approximation in Additively Separable Hedonic Games (Page 418)
Martin Bullinger (University of Oxford)
Vaggos Chatziafratis (University of California, Santa Cruz)
Parnian Shahkar (University of California, Irvine)

Towards Fair and Efficient Public Transportation: A Bus Stop Model (Page 427)
Martin Bullinger (University of Oxford)
Edith Elkind (Northwestern University)
Mohamad Latifian (University of Edinburgh)

Who Am I Dealing With? Explaining the Designer's Hidden Intentions (Page 436)
Turgay Caglar (Colorado State University)
Sarath Sreedharan (Colorado State University)
Mor Vered (Monash University)

Emit As You Go: Enumerating Edges of a Spanning Tree (Page 445)
Katrin Casel (Humboldt Universität Berlin)
Stefan Neubert (Hasso Plattner Institute, University of Potsdam)

On the Fairness of Additive Welfarist Rules (Page 454)
Karen Frilya Celine (National University of Singapore)
Warut Suksompong (National University of Singapore)
Sheung Man Yuen (National University of Singapore)

Game-Theoretically Secure Distributed Protocols for Fair Allocation in Coalitional Games (Page 463)
T-H. Hubert Chan (The University of Hong Kong)
Qipeng Kuang (The University of Hong Kong)
Quan Xue (The University of Hong Kong)

Return to top

Fair Division in a Variable Setting (Page 472)
Harish Chandramouleeswaran (Chennai Mathematical Institute)
Prajakta Nimbhorkar (Chennai Mathematical Institute)
Nidhi Rathi (Max Planck Institute for Informatics, SIC)

Human-Agent Coordination in Games under Incomplete Information via Multi-Step Intent (Page 481)
Shenghui Chen (The University of Texas at Austin)
Ruihan Zhao (The University of Texas at Austin)
Sandeep Chinchali (The University of Texas at Austin)
Ufuk Topcu (The University of Texas at Austin)

Azorus: Commitments over Protocols for BDI Agents (Page 490)
Amit K. Chopra (Lancaster University)
Matteo Baldoni (Università degli Studi di Torino)
Samuel H. Christie (North Carolina State University)
Munindar P. Singh (North Carolina State University)

On the Limits of Agency in Agent-based Models (Page 500)
Ayush Chopra (Massachusetts Institute of Technology)
Shashank Kumar (Massachusetts Institute of Technology)
Nurullah Giray Kuru (Massachusetts Institute of Technology)
Ramesh Raskar (Massachusetts Institute of Technology)
Arnau Quera-Bofarull (University of Oxford)

Computing Efficient and Envy-Free Allocations under Dichotomous Preferences using SAT (Page 510)
Ari Conati (University of Helsinki)
Andreas Niskanen (University of Helsinki)
Ronald de Haan (University of Amsterdam)
Matti Järvisalo (University of Helsinki)

Byzantine Game Theory: Sun Tzu's Boxes (Page 519)
Andrei Constantinescu (ETH Zürich)
Roger Wattenhofer (ETH Zürich)

Selfish Behavior and Resource Competition in Multi-Agent Systems (Page 529)
Costas Courcoubetis (Chinese University of Hong Kong)
Antonis Dimakis (Athens University of Economics and Business)

Return to top

Approximation Algorithms for Connected Maximum Coverage (Page 538)
Gianlorenzo D'Angelo (Gran Sasso Science Institute (GSSI))
Esmaeil Delfaraz (University of L’Aquila)

Bayesian Collaborative Bandits with Thompson Sampling for Improved Outreach in Maternal Health (Page 547)
Arpan Dasgupta (Google DeepMind)
Gagan Jain (Google DeepMind)
Arun Suggala (Google DeepMind)
Karthikeyan Shanmugam (Google Deepmind)
Milind Tambe (Harvard University & Google DeepMind)
Aparna Taneja (Google DeepMind)

Greedy ABA Learning for Case-Based Reasoning (Page 556)
Emanuele De Angelis (IASI-CNR)
Maurizio Proietti (IASI-CNR)
Francesca Toni (Imperial)

More Efficient Sybil Detection Mechanisms Leveraging Resistance of Users to Attack Requests (Page 565)
Ali Safarpoor Dehkordi (Australian National University)
Ahad N. Zehmakan (Australian National University)

Composing Reinforcement Learning Policies, with Formal Guarantees (Page 574)
Florent Delgrange (Vrije Universiteit Brussel)
Guy Avni (University of Haifa)
Anna Lukina (TU Delft)
Christian Schilling (Aalborg University)
Ann Nowé (Vrije Universiteit Brussel)
Guillermo A. Pérez (University of Antwerp)

Parameterized Algorithms for Multiagent Pathfinding on Trees (Page 584)
Argyrios Deligkas (Royal Holloway, University of London)
Eduard Eiben (Royal Holloway, University of London)
Robert Ganian (TU Wien)
Iyad Kanj (DePaul University)
M. S. Ramanujan (University of Warwick)

From Natural Language to Extensive-Form Game Representations (Page 593)
Shilong Deng (University of Liverpool)
Yongzhao Wang (The Alan Turing Institute & University of Liverpool)
Rahul Savani (The Alan Turing Institute & University of Liverpool)

Return to top

Safe Pareto Improvements for Expected Utility Maximizers in Program Games (Page 602)
Anthony DiGiovanni (Center on Long-Term Risk)
Jesse Clifton (Center on Long-Term Risk)
Nicolas Macé (Center on Long-Term Risk)

Hitchhiker's Guide to Patrolling: Path-Finding for Energy-Sharing Drone-UGV Teams (Page 611)
Jonathan Diller (Colorado School of Mines)
Qi Han (Colorado School of Mines)
Robert Byers (Colorado School of Mines)
James Dotterweich (DEVCOM Army Research Laboratory)
James Humann (DEVCOM Army Research Laboratory)

Learning Graph Representation of Agent Diffusers (Page 620)
Youcef Djenouri (University South-Easter Norway & Norwegian Research Centre)
Nassim Belmecheri (Simula Research Laboratory)
Tomasz Michalak (University of Warsaw)
Jan Dubinski (IDEAS NCBR)
Ahmed Nabil Belbachir (Norwegian Research Centre)
Anis Yazidi (University of Oslo)

Selecting Interlacing Committees (Page 630)
Chris Dong (Technical University of Munich)
Martin Bullinger (University of Oxford)
Tomasz Was (University of Oxford)
Larry Birnbaum (Northwestern University)
Edith Elkind (Northwestern University)

Simulating and Evaluating Generative Modeling and Collaborative Filtering in Complex Social Networks (Page 639)
Wen Dong (Air Force Research Laboratory)
Fairul Mohd-Zaid (Air Force Research Laboratory)

Fast UCB-type Algorithms for Stochastic Bandits with Heavy and Super Heavy Symmetric Noise (Page 649)
Yuriy Dorn (MSU Institute for Artificial Intelligence, Moscow Institute of Physics and Technology)
Aleksandr Katrutsa (Skoltech, AIRI)
Ilgam Latypov (MSU Institute for Artificial Intelligence, Moscow Institute of Physics and Technology)
Andrey Pudovikov (MSU Institute for Artificial Intelligence)

Why Instant-Runoff Voting Is So Resilient to Coalitional Manipulation: Phase Transitions in the Perturbed Culture (Page 658)
François Durand (Nokia Bell Labs France)

Return to top

Boosting Sortition via Proportional Representation (Page 667)
Soroush Ebadian (University of Toronto)
Evi Micha (University of Southern California)

Temporal Fair Division of Indivisible Items (Page 676)
Edith Elkind (Northwestern University)
Alexander Lam (Hong Kong Polytechnic University)
Mohamad Latifian (University of Edinburgh)
Tzeh Yuan Neoh (IHPC, CFAR, A*STAR)
Nicholas Teh (University of Oxford)

A Simple Integration of Epistemic Logic and Reinforcement Learning (Page 686)
Thorsten Engesser (TU Wien)
Thibaut Le Marre (ENS Rennes, ENS de Lyon, CNRS, Université Claude Bernard Lyon 1, Inria, LIP, UMR 5668)
Emiliano Lorini (IRIT, CNRS, Toulouse University)
François Schwarzentruber (ENS de Lyon, CNRS, Université Claude Bernard Lyon 1, Inria, LIP, UMR 5668)
Bruno Zanuttini (Université Caen Normandie, ENSICAEN, CNRS, Normandie Univ, GREYC UMR6072)

Mitigating Value Conflicts with Computational Theory of Mind (Page 695)
Emre Erdogan (Utrecht University)
Hüseyin Aydin (Utrecht University & Middle East Technical University)
Frank Dignum (Umeå University)
Rineke Verbrugge (University of Groningen)
Pinar Yolum (Utrecht University)

Learning Real-Life Approval Elections (Page 704)
Piotr Faliszewski (AGH University)
Lukasz Janeczko (AGH University)
Andrzej Kaczmarczyk (Department of Computer Science, The University of Chicago)
Marcin Kurdziel (AGH University)
Grzegorz Pierczynski (AGH University)
Stanislaw Szufa (CNRS, LAMSADE, Université Paris Dauphine – PSL)

FedRLHF: A Convergence-Guaranteed Federated Framework for Privacy-Preserving and Personalized RLHF (Page 713)
Flint Xiaofeng Fan (National University of Singapore)
Cheston Tan (CFAR, A*STAR)
Yew-Soon Ong (CFAR, A*STAR)
Roger Wattenhofer (ETH Zurich)
Wei-Tsang Ooi (National University of Singapore)

Automatic Verification of Linear Integer Planning Programs via Forgetting in LIAUPF (Page 722)
Liangda Fang (Jinan University & Pazhou Lab)
Shikang Chen (Jinan University)
Xiaoman Wang (Jinan University)
Xiaoyou Lin (Jinan University)
Chenyi Zhang (University of Canterbury)
Qingliang Chen (Jinan University)
Quanlong Guan (Jinan University)
Kaile Su (Yantai University)

Return to top

Consistency Policy with Categorical Critic for Autonomous Driving (Page 731)
Xing Fang (Institute of Automation, CASIA & School of Artificial Intelligence, UCAS)
Qichao Zhang (Institute of Automation, CASIA & School of Artificial Intelligence, UCAS)
Haoran Li (Institute of Automation, CASIA & School of Artificial Intelligence, UCAS)
Dongbin Zhao (Institute of Automation, CASIA & School of Artificial Intelligence, UCAS)

Translating Multi-Agent Modal Logics of Knowledge and Belief into Decidable First-Order Fragments (Page 740)
Qihui Feng (RWTH Aachen University)
Hannah Wilk (University of Amsterdam & RWTH Aachen University)
Shakil M. Khan (University of Regina)
Gerhard Lakemeyer (RWTH Aachen University)

Eliminating Majority Illusion (Page 749)
Foivos Fioravantes (Czech Technical University of Prague)
Abhiruk Lahiri (Heinrich Heine University)
Antonio Lauerbach (Julius-Maximilians-University)
Lluís Sabater (Charles University)
Marie Diana Sieper (Julius-Maximilians-University)
Samuel Wolf (Julius-Maximilians-University)

On the Hardness of Fair Allocation under Ternary Valuations (Page 758)
Zack Fitzsimmons (College of the Holy Cross)
Vignesh Viswanathan (University of Massachusetts)
Yair Zick (University of Massachusetts)

Non-obvious Manipulability in Hedonic Games with Friends Appreciation Preferences (Page 767)
Michele Flammini (Gran Sasso Science Institute)
Maria Fomenko (Gran Sasso Science Institute)
Giovanna Varricchio (University of Calabria)

Higher-Order Belief in Incomplete Information MAIDs (Page 776)
Jack Foxabbott (University of Oxford)
Rohan Subramani (Columbia University)
Francis Rhys Ward (Imperial College London)

The Metric Distortion of Randomized Social Choice Functions: C1 Maximal Lottery Rules and Simulations (Page 785)
Fabian Frank (Technical University of Munich)
Patrick Lederer (University of New South Wales)

Return to top

Order Symmetry: A New Fairness Criterion for Assignment Mechanisms (Page 794)
Rupert Freeman (University of Virginia)
Geoffrey Pritchard (University of Auckland)
Mark C. Wilson (University of Massachusetts)

Learning Collusion in Episodic, Inventory-Constrained Markets (Page 803)
Paul Friedrich (University of Zurich, ETH AI Center)
Barna Pásztor (ETH AI Center, ETH Zurich)
Giorgia Ramponi (University of Zurich, ETH AI Center)

Global Behavior of Learning Dynamics in Zero-Sum Games with Memory Asymmetry (Page 813)
Yuma Fujimoto (CyberAgent)
Kaito Ariu (CyberAgent)
Kenshi Abe (CyberAgent)

Optimising Expectation with Guarantees for Window Mean Payoff in Markov Decision Processes (Page 820)
Pranshu Gaba (Tata Institute of Fundamental Research)
Shibashis Guha (Tata Institute of Fundamental Research)

Changing the Rules of the Game: Reasoning About Dynamic Phenomena in Multi-Agent Systems (Page 829)
Rustam Galimullin (University of Bergen)
Maksim Gladyshev (Utrecht University)
Munyque Mittelmann (University of Naples Federico II)
Nima Motamed (Utrecht University)

Fairly Allocating Goods in Parallel (Page 839)
Rohan Garg (Purdue University)
Alexandros Psomas (Purdue University)

Voter Model Meets Rumour Spreading: A Study of Consensus Protocols on Graphs with Agnostic Nodes (Page 848)
Marcelo Matheus Gauy (São Paulo State University)
Anna Abramishvili (King's College London)
Eduardo Colli (University of São Paulo)
Tiago Madeira (University of São Paulo)
Frederik Mallmann-Trenn (King's College London)
Vinícius Franco Vasconcelos (University of São Paulo)
David Kohan Marzagao (King's College London)

Return to top

On Learning Informative Trajectory Embeddings for Imitation, Classification and Regression (Page 858)
Zichang Ge (Singapore Management University)
Changyu Chen (Singapore Management University)
Arunesh Sinha (Rutgers University)
Pradeep Varakantham (Singapore Management University)

MOSMAC: A Multi-agent Reinforcement Learning Benchmark on Sequential Multi-Objective Tasks (Page 867)
Minghong Geng (Singapore Management University)
Shubham Pateria (Singapore Management University)
Budhitama Subagdja (Singapore Management University)
Ah-Hwee Tan (Singapore Management University)

Certified Guidance for Planning with Deep Generative Models (Page 877)
Francesco Giacomarra (University of Trieste)
Mehran Hosseini (King's College London)
Nicola Paoletti (King’s Colledge London)
Francesca Cairoli (University of Trieste)

Predictability Awareness for Efficient and Robust Multi-Agent Coordination (Page 886)
Román Chiva Gil (Delft University of Technology)
Daniel Jarne Ornia (University of Oxford)
Khaled A. Mustafa (Delft University of Technology)
Javier Alonso Mora (Delft University of Technology)

Simplifying Imperfect Recall Games (Page 895)
Hugo Gimbert (LaBRI, CNRS, Université de Bordeaux)
Soumyajit Paul (University of Liverpool)
B. Srivathsan (Chennai Mathematical Institute, CNRS, ReLaX, IRL 2000)

Policy Graphs and Intention: Answering 'Why' and 'How' from a Telic Perspective (Page 904)
Victor Gimenez-Abalos (Barcelona Supercomputing Center)
Sergio Alvarez-Napagao (Universidad Politécnica de Cataluna & Barcelona Supercomputing Center)
Adrián Tormos (Barcelona Supercomputing Center)
Ulises Cortés (Universidad Politécnica de Cataluna & Barcelona Supercomputing Center)
Javier Vázquez-Salceda (Universidad Politécnica de Cataluna)

Approximating One-Sided and Two-Sided Nash Social Welfare With Capacities (Page 914)
Salil Gokhale (IIT Delhi)
Harshul Sagar (IIT Delhi)
Rohit Vaish (IIT Delhi)
Jatin Yadav (IIT Delhi)

Return to top

Fairness and Optimality in Routing (Page 923)
Sreenivas Gollapudi (Google Research)
Kostas Kollias (Google Research)
Alkmini Sgouritsa (Athens University of Economics and Business, and Archimedes/Athena RC)
Ali Kemal Sinop (Google Research)

Extending Consensus-based Task Allocation Algorithms with Bid Intercession to Foster Mixed-Initiative (Page 932)
Victor Guillet (DTIS, ONERA, Université de Toulouse)
Charles Lesire (DTIS, ONERA, Université de Toulouse)
Gauthier Picard (DTIS, ONERA, Université de Toulouse)
Christophe Grand (DTIS, ONERA, Université de Toulouse)

On the Power of Temporal Locality on Online Routing Problems (Page 941)
Swapnil Guragain (Kent State University)
Gokarna Sharma (Kent State University)

Coherence-Driven Multimodal Safety Dialogue with Active Learning for Embodied Agents (Page 950)
Sabit Hassan (University of Pittsburgh)
Hye-Young Chung (Northeastern University)
Xiang Zhi Tan (Northeastern University)
Malihe Alikhani (Northeastern University)

Tackling Uncertainties in Multi-Agent Reinforcement Learning through Integration of Agent Termination Dynamics (Page 960)
Somnath Hazra (IIT Kharagpur)
Pallab Dasgupta (Synopsys)
Soumyajit Dey (IIT Kharagpur)

Learning in Games with Progressive Hiding (Page 969)
Benjamin Heymann (Criteo AI Lab)
Marc Lanctot (Google DeepMind)

LTL Verification of Memoryful Neural Agents (Page 978)
Mehran Hosseini (King's College London)
Alessio Lomuscio (Imperial College London)
Nicola Paoletti (King's College London)

Return to top

Automating Curriculum Learning for Reinforcement Learning using a Skill-Based Bayesian Network (Page 988)
Vincent Hsiao (NRC Postdoctoral Fellow, Naval Research Laboratory)
Mark Roberts (Naval Research Laboratory)
Laura M. Hiatt (Naval Research Laboratory)
George Konidaris (Brown University)
Dana S. Nau (University of Maryland)

PMAT: Optimizing Action Generation Order in Multi-Agent Reinforcement Learning (Page 997)
Kun Hu (National University of Defense Technology)
Muning Wen (Shanghai Jiao Tong University)
Xihuai Wang (Shanghai Jiao Tong University)
Shao Zhang (Shanghai Jiao Tong University)
Yiwei Shi (University of Bristol)
Minne Li (Intelligent Game and Decision Lab)
Minglong Li (National University of Defense Technology)
Ying Wen (Shanghai Jiao Tong University)

Truthful Mechanisms for Linear Bandit Games with Private Contexts (Page 1006)
Yiting Hu (Singapore University of Technology and Design)
Lingjie Duan (Singapore University of Technology and Design)

CAMP: Collaborative Attention Model with Profiles for Vehicle Routing Problems (Page 1015)
Chuanbo Hua (KAIST & Omelet)
Federico Berto (KAIST & Omelet)
Jiwoo Son (Omelet)
Seunghyun Kang (Omelet)
Changhyun Kwon (KAIST & Omelet)
Jinkyoo Park (KAIST & Omelet)

Human-Aligned Skill Discovery: Balancing Behaviour Exploration and Alignment (Page 1025)
Maxence Hussonnois (A2I2, Deakin University)
Thommen George Karimpanal (School of IT, Deakin University)
Santu Rana (A2I2, Deakin University)

Responsible Uplift Modeling (Page 1034)
Lihi Idan (Texas A&M University)
Ming Li (Nanjing University)

Taming Multi-Agent Reinforcement Learning with Estimator Variance Reduction (Page 1042)
Taher Jafferjee (Huawei R&D)
Juliusz Ziomek (Oxford University)
Tianpei Yang (Nanjing University)
Zipeng Dai (Beijing Institute of Technology)
Jianhong Wang (Bristol University)
Matthew E. Taylor (University of Alberta)
Kun Shao (Huawei R&D)
Jun Wang (University College London)
David Mguni (Queen Mary University London)

Return to top

Probabilistic Timed ATL (Page 1051)
Wojciech Jamroga (Institute of Computer Science, Polish Academy of Sciences & SnT, University of Luxembourg)
Marta Kwiatkowska (Institute of Computer Science, PAS & Department of Computer Science, University of Oxford)
Wojciech Penczek (Institute of Computer Science, Polish Academy of Sciences)
Laure Petrucci (LIPN, CNRS UMR 7030, Université Sorbonne Paris Nord)
Teofil Sidoruk (Institute of Computer Science, Polish Academy of Sciences)

Tackling Sparsity in Designated Driver Dispatch with Multi-Agent Reinforcement Learning (Page 1060)
Jiaxuan Jiang (Tsinghua University & Shanghai Qi Zhi Institute)
Ling Pan (Hong Kong University of Science and Technology)
Lin Zhou (DiDi Chuxing Technology Co.)
Longbo Huang (Tsinghua University)
Zhixuan Fang (Tsinghua University & Shanghai Qi Zhi Institute)

Full Proportional Justified Representation (Page 1070)
Yusuf Hakan Kalayci (University of Southern California)
Jiasen Liu (University of Southern California)
David Kempe (University of Southern California)

A View of the Certainty-Equivalence Method for PAC RL as an Application of the Trajectory Tree Method (Page 1079)
Shivaram Kalyanakrishnan (Indian Institute of Technology Bombay)
Sheel Shah (Indian Institute of Technology Bombay)
Santhosh Kumar Guguloth (Indian Institute of Technology Bombay)

Game of Thoughts: Iterative Reasoning in Game-Theoretic Domains with Large Language Models (Page 1088)
Benjamin Kempinski (Radboud University)
Ian Gemp (Google DeepMind)
Kate Larson (Google DeepMind & University of Waterloo)
Marc Lanctot (Google DeepMind)
Yoram Bachrach (Meta)
Tal Kachman (Radboud University)

Causes and Strategies in Multiagent Systems (Page 1098)
Sylvia S. Kerkhove (Utrecht University)
Natasha Alechina (Open University & Utrecht University)
Mehdi Dastani (Utrecht University)

GUIDE-CoT: Goal-driven and User-Informed Dynamic Estimation for Pedestrian Trajectory using Chain-of-Thought (Page 1107)
Sungsik Kim (Kookmin University)
Janghyun Baek (Korea University)
Jinkyu Kim (Korea University)
Jaekoo Lee (Kookmin University)

Return to top

Practical Abstractions for Model Checking Continuous-Time Multi-Agent Systems (Page 1117)
Yan Kim (Interdisciplinary Centre for Security, Reliability, and Trust, SnT, University of Luxemburg)
Wojciech Jamroga (Institute of Computer Science, PAS & Interdisciplinary Centre for Security, Reliability, and Trust, SnT, University of Luxembourg)
Wojciech Penczek (Institute of Computer Science, Polish Academy of Science)
Laure Petrucci (LIPN, CNRS UMR 7030, Université Sorbonne Paris Nord)

k-ApprovalVeto: A Spectrum of Voting Rules Balancing Metric Distortion and Minority Protection (Page 1127)
Fatih Erdem Kizilkaya (University of Southern California)
David Kempe (University of Southern California)

Robustness of Epistemic Gossip Protocols Against Data Loss (Page 1136)
Yoshikatsu Kobayashi (Department of Computer Science, Univesity of Tsukuba)
Koji Hasebe (Department of Computer Science, Univesity of Tsukuba)

Ranking Joint Policies in Dynamic Games using Evolutionary Dynamics (Page 1145)
Natalia Koliou (University of Piraeus)
George Vouros (University of Piraeus)

Uncertain Machine Ethics Planning (Page 1154)
Simon Kolker (University of Manchester)
Louise A. Dennis (University of Manchester)
Ramon Fraga Pereira (University of Manchester)
Mengwei Xu (Newcastle University)

Policy Abstraction and Nash Refinement in Tree-Exploiting PSRO (Page 1163)
Christine Konicki (Michigan Tech Research Institute)
Mithun Chakraborty (University of Michigan)
Michael P. Wellman (University of Michigan)

Free Argumentative Exchanges for Explaining Image Classifiers (Page 1172)
Avinash Kori (Imperial College London)
Antonio Rago (Imperial College London)
Francesca Toni (Imperial College London)

Return to top

Offline Multi-Agent Preference-based Reinforcement Learning with Agent-aware Direct Preference Optimization (Page 1181)
Qian Kou (National Key Laboratory of Human-Machine Hybrid Augmented Intelligence, National Engineering Research Center for Visual Information and Application Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University)
Mingyang Li (National Key Laboratory of Human-Machine Hybrid Augmented Intelligence, National Engineering Research Center for Visual Information and Application Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University)
Zeyang Liu (National Key Laboratory of Human-Machine Hybrid Augmented Intelligence, National Engineering Research Center for Visual Information and Application Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University)
Long Qian (National Key Laboratory of Human-Machine Hybrid Augmented Intelligence, National Engineering Research Center for Visual Information and Application Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University)
Zhuoran Chen (National Key Laboratory of Human-Machine Hybrid Augmented Intelligence, National Engineering Research Center for Visual Information and Application Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University)
Lipeng Wan (National Key Laboratory of Human-Machine Hybrid Augmented Intelligence, National Engineering Research Center for Visual Information and Application Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University)
Xingyu Chen (National Key Laboratory of Human-Machine Hybrid Augmented Intelligence, National Engineering Research Center for Visual Information and Application Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University)
Xuguang Lan (National Key Laboratory of Human-Machine Hybrid Augmented Intelligence, National Engineering Research Center for Visual Information and Application Institute of Artificial Intelligence and Robotics, Xi'an Jiaotong University)

Game Theory with Simulation in the Presence of Unpredictable Randomisation (Page 1191)
Vojtech Kovarík (Czech Technical Univeresity in Prague)
Nathaniel Sauerberg (University of Texas at Austin)
Lewis Hammond (University of Oxford)
Vincent Conitzer (Carnegie Mellon University)

Tighter Value-Function Approximations for POMDPs (Page 1200)
Merlijn Krale (Radboud University)
Wietze Koops (Lund University & University of Copenhagen)
Sebastian Junges (Radboud University)
Thiago D. Simão (Eindhoven University of Technology)
Nils Jansen (Ruhr-Universität Bochum)

The Bakers and Millers Game with Restricted Locations (Page 1209)
Simon Krogmann (Hasso Plattner Institute, University of Potsdam)
Pascal Lenzner (Institute of Computer Science, University of Augsburg)
Alexander Skopalik (Mathematics of Operations Research, University of Twente)

Near-Linear Time Leader Election in Multiagent Networks (Page 1218)
Ajay D. Kshemkalyani (University of Illinois at Chicago)
Manish Kumar (Indian Institute of Technology Madras)
Anisur Rahaman Molla (Indian Statistical Institute Kolkata)
Gokarna Sharma (Kent State University)

Dynamic Coalition Structure Detection in Natural-Language-based Interactions (Page 1227)
Abhishek N. Kulkarni (University of Texas at Austin)
Andy Liu (Carnegie Mellon University)
Jean-Raphaël Gaglione (University of Texas at Austin)
Daniel Fried (Carnegie Mellon University)
Ufuk Topcu (University of Texas at Austin)

Emergence of Recursive Language through Bootstrapping and Iterated Learning (Page 1235)
Vikas Kumar (TCS Research)
Ajin George Joseph (Indian Institute of Technology Tirupati)

Return to top

AdaCred: Adaptive Causal Decision Transformers with Feature Crediting (Page 1244)
Hemant Kumawat (Georgia Institute of Technology)
Saibal Mukhopadhyay (Georgia Institute of Technology)

Soft Condorcet Optimization for Ranking of General Agents (Page 1253)
Marc Lanctot (Google DeepMind)
Kate Larson (Google DeepMind & University of Waterloo)
Michael Kaisers (Google DeepMind)
Quentin Berthet (Google DeepMind)
Ian Gemp (Google DeepMind)
Manfred Diaz (MIla & University of Montreal)
Roberto-Rafael Maura-Rivero (Google DeepMind, LSE)
Yoram Bachrach (Meta)
Anna Koop (Google DeepMind)
Doina Precup (Google DeepMind)

MacLight: Multi-scene Aggregation Convolutional Learning for Traffic Signal Control (Page 1263)
Sunbowen Lee (College of Science Hubei Province Key Laboratory of System Science in Metallurgical Process, Wuhan University of Science and Technology)
Hongqin Lyu (State Key Lab of Processors, Institute of Computing Technology, Chinese Academy of Sciences & University of Chinese Academy of Sciences)
Yicheng Gong (College of Science Hubei Province Key Laboratory of System Science in Metallurgical Process, Wuhan University of Science and Technology)
Yingying Sun (College of Science, Wuhan University of Science and Technology)
Chao Deng (School of Automobile and Traffic Engineering, Wuhan University of Science and Technology)

Timed Obstruction Logic: A Timed Approach to Dynamic Game Reasoning (Page 1272)
Jean Leneutre (Télécom Paris, Institut Polytechnique de Paris)
Vadim Malvone (Télécom Paris, Institut Polytechnique de Paris)
James Ortiz (Télécom Paris, Institut Polytechnique de Paris)

Curiosity-Driven Partner Selection Accelerates Convention Emergence in Language Games (Page 1282)
Chin-wing Leung (University of Warwick)
Paolo Turrini (University of Warwick)
Ann Nowé (Vrije Universiteit Brussel)

Self-Supervised Multi-Agent Diversity with Nonparametric Entropy Maximization (Page 1291)
Tianxu Li (College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics)
Kun Zhu (College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics)

OGS-SLAM: Hybrid ORB-Gaussian Splatting SLAM (Page 1300)
Xiaohan Li (University of Science and Technology of China)
Wenxiang Shen (Tongji University)
Dong Liu (University of Science and Technology of China)
Jun Wu (Fudan University)

Return to top

Rational Capability in Concurrent Games (Page 1309)
Yinfeng Li (IRIT, CNRS, University of Toulouse)
Emiliano Lorini (IRIT, CNRS, University of Toulouse)
Munyque Mittelmann (University of Naples Federico II)

Nucleolus Credit Assignment for Effective Coalitions in Multi-agent Reinforcement Learning (Page 1318)
Yugu Li (University of South Australia)
Zehong Cao (University of South Australia)
Jianglin Qiao (University of South Australia)
Siyi Hu (University of South Australia)

Dynamic Sight Range Selection in Multi-Agent Reinforcement Learning (Page 1327)
Wei-Chen Liao (Department of Computer Science, National Yang Ming Chiao Tung University)
Ti-Rong Wu (Institute of Information Science, Academia Sinica)
I-Chen Wu (Department of Computer Science, National Yang Ming Chiao Tung University)

Adaptive Bi-Level Multi-Robot Task Allocation and Learning under Uncertainty with Temporal Logic Constraints (Page 1336)
Xiaoshan Lin (University of Minnesota, Twin Cities)
Roberto Tron (Boston University)

Reinforcement Learning-based Approach for Vehicle-to-Building Charging with Heterogeneous Agents and Long Term Rewards (Page 1345)
Fangqi Liu (Vanderbilt University)
Rishav Sen (Vanderbilt University)
Jose Paolo Talusan (Vanderbilt University)
Ava Pettet (Nissan Advanced Technology Center - Silicon Valley)
Aaron Kandel (Nissan Advanced Technology Center - Silicon Valley)
Yoshinori Suzue (Nissan Advanced Technology Center - Silicon Valley)
Ayan Mukhopadhyay (Vanderbilt University)
Abhishek Dubey (Vanderbilt University)

Efficient and Optimal Policy Gradient Algorithm for Corrupted Multi-armed Bandits (Page 1354)
Jiayuan Liu (Carnegie Mellon University)
Siwei Wang (Microsoft Research Asia)
Zhixuan Fang (Tsinghua University & Shanghai Qi Zhi Institute)

Teamwork Makes the Defense Work: Comprehensive Vulnerability Defense Resource Allocation (Page 1362)
Siyu Liu (Arizona State University)
Rida Bazzi (Arizona State University)
Fei Fang (Carnegie Mellon University)
Tiffany Bao (Arizona State University)

Return to top

Games in Public Announcement: How to Reduce System Losses in Optimistic Blockchain Mechanisms (Page 1371)
Siyuan Liu (School of Software and Microelectronics, Peking University)
Yulong Zeng (Beijing YeeZTech Ltd)

Data Pricing for Graph Neural Networks without Pre-purchased Inspection (Page 1380)
Yiping Liu (The University of Auckland)
Mengxiao Zhang (The University of Auckland)
Jiamou Liu (The University of Auckland)
Song Yang (The University of Auckland)

Leveraging Score-based Models for Generating Penalization in Model-based Offline Reinforcement Learning (Page 1389)
Zeyuan Liu (Tsinghua Shenzhen International Graduate School, Tsinghua University)
Zhirui Fang (Tsinghua Shenzhen International Graduate School, Tsinghua University)
Jiafei Lyu (Tsinghua Shenzhen International Graduate School, Tsinghua University)
Xiu Li (Tsinghua Shenzhen International Graduate School, Tsinghua University)

MAGNET: A Multi-Agent Graph Neural Network for Efficient Bipartite Task Assignment (Page 1399)
Donald Loveland (University of Michigan)
James Usevitch (Brigham Young University)
Zachary Serlin (MIT Lincoln Laboratory)
Danai Koutra (University of Michigan)
Rajmonda Caceres (MIT Lincoln Laboratory)

Multi-Ship Future Interaction Trajectory Prediction via Pre-Initializer Diffusion Model (Page 1408)
Kun Ma (Harbin Engineering University)
Qilong Han (Harbin Engineering University)
Jingzheng Yao (Harbin Engineering University)

Minimizing Makespan with Conflict-Based Search for Optimal Multi-Agent Path Finding (Page 1418)
Amir Maliah (Ben-Gurion University)
Dor Atzmon (Bar-Ilan University)
Ariel Felner (Ben-Gurion University)

Beyond Goal Recognition: A Reinforcement Learning-based Approach to Inferring Agent Behaviour (Page 1427)
Sheryl Mantik (RMIT University)
Michael Dann (viewa.com)
Minyi Li (jahan.ai)
Huong Ha (RMIT University)
Julie Porteous (RMIT University)

Return to top

Multi-agent Multi-armed Bandits with Minimum Reward Guarantee Fairness (Page 1436)
Piyushi Manupriya (IIT Hyderabad)
Himanshu (IIT Hyderabad)
SakethaNath Jagarlapudi (IIT Hyderabad)
Ganesh Ghalme (IIT Hyderabad)

On Stateful Value Factorization in Multi-Agent Reinforcement Learning (Page 1445)
Enrico Marchesini (Massachusetts Institute of Technology)
Andrea Baisero (Northeastern University)
Rupali Bhati (Northeastern University)
Christopher Amato (Northeastern University)

ApproxED: Approximate Exploitability Descent via Learned Best Responses (Page 1454)
Carlos Martin (Carnegie Mellon University)
Tuomas Sandholm (Carnegie Mellon University, Strategy Robot, Inc., Optimized Markets, Inc., & Strategic Machine, Inc.)

Improving Policy Optimization via ε-Retrain (Page 1464)
Luca Marzari (University of Verona)
Priya L. Donti (Massachusetts Institute of Technology)
Changliu Liu (Carnegie Mellon University)
Enrico Marchesini (Massachusetts Institute of Technology)

Discovery and Deployment of Emergent Robot Swarm Behaviors via Representation Learning and Real2Sim2Real Transfer (Page 1473)
Connor Mattson (University of Utah)
Varun Raveendra (University of Utah)
Ricardo Vega (George Mason University)
Cameron Nowzari (George Mason University)
Daniel S. Drew (University of Hawaii at Manoa)
Daniel S. Brown (University of Utah)

Generalised BDI Planning (Page 1483)
Felipe Meneguzzi (University of Aberdeen & PUCRS)
Ramon Fraga Pereira (University of Manchester & UFRGS)
Nir Oren (University of Aberdeen)

Multi-agent Reinforcement Learning in the All-or-Nothing Public Goods game on Networks (Page 1492)
Benedikt Valentin Meylahn (University of Amsterdam)

Return to top

Leveraging Large Language Models for Effective and Explainable Multi-Agent Credit Assignment (Page 1501)
Kartik Nagpal (University of California, Berkeley)
Dayi Dong (University of California, Berkeley)
Negar Mehr (University of California, Berkeley)

Explaining Facial Expression Recognition (Page 1511)
Sanjeev Nahulanthran (Monash University)
Leimin Tian (CSIRO Robotics)
Dana Kulic (Monash University)
Mor Vered (Monash University)

Evaluation-Time Policy Switching for Offline Reinforcement Learning (Page 1520)
Natinael Solomon Neggatu (University of Warwick)
Jeremie Houssineau (Nanyang Technological University)
Giovanni Montana (University of Warwick)

Resource Task Games (Page 1529)
Jessica L. Newman (University of Southampton)
Enrico Gerding (University of Southampton)
Enrico Marchioni (University of Southampton)
Baharak Rastegari (University of Southampton)

Personality-Driven Decision Making in LLM-Based Autonomous Agents (Page 1538)
Lewis Newsham (Lancaster University)
Daniel Prince (Lancaster University)

Contrastive Explainable Clustering with Differential Privacy (Page 1548)
DungXXX Nguyen (Department of Computer Science, and Biocomplexity Institute, University of Virginia)
Ariel Vetzler (Department of Computer Science, Bar-Ilan University)
Sarit Kraus (Department of Computer Science, Bar-Ilan University)
Anil Vullikanti (Department of Computer Science, and Biocomplexity Institute, University of Virginia)

DUPRE: Data Utility Prediction for Efficient Data Valuation (Page 1557)
Kieu Thao Nguyen Nguyen (National University of Singapore)
Rachael Hwee Ling Sim (National University of Singapore)
Quoc Phong Nguyen (A2I2, Deakin University)
See-Kiong Ng (National University of Singapore)
Bryan Kian Hsiang Low (National University of Singapore)

Return to top

Counterfactual Explanations for Model Ensembles Using Entropic Risk Measures (Page 1566)
Erfaun Noorani (University of Maryland)
Pasan Dissanayake (University of Maryland)
Faisal Hamman (University of Maryland)
Sanghamitra Dutta (University of Maryland)

Conformal Set-based Human-AI Complementarity with Multiple Experts (Page 1576)
Helbert Paat (The Hong Kong Polytechnic University)
Guohao Shen (The Hong Kong Polytechnic University)

Together We Rise: Optimizing Real-Time Multi-Robot Task Allocation using Coordinated Heterogeneous Plays (Page 1586)
Aritra Pal (TCS Research)
Anandsingh Chauhan (TCS Research)
Mayank Baranwal (TCS Research)

Smooth Information Gathering in Two-Player Noncooperative Games (Page 1595)
Fernando Palafox (University of Texas at Austin)
Jesse Milzman (DEVCOM Army Research Laboratory)
Dong Ho Lee (University of Texas at Austin)
Ryan Park (University of Texas at Austin)
David Fridovich-Keil (University of Texas at Austin)

Hierarchical Learning-based Graph Partition for Large-scale Vehicle Routing Problems (Page 1604)
Yuxin Pan (The Hong Kong University of Science and Technology)
Ruohong Liu (University of Oxford)
Yize Chen (University of Alberta)
Zhiguang Cao (Singapore Management University)
Fangzhen Lin (The Hong Kong University of Science and Technology)

An Extended Benchmarking of Multi-Agent Reinforcement Learning Algorithms in Complex Fully Cooperative Tasks (Page 1613)
George Papadopoulos (University of Piraeus)
Andreas Kontogiannis (NTUA & Archimedes AI)
Foteini Papadopoulou (Radboud University)
Chaido Poulianou (University of Piraeus)
Ioannis Koumentis (University of Piraeus)
George Vouros (University of Piraeus)

Enhancing Graph-based Coordination with Evolutionary Algorithms for Episodic Multi-agent Reinforcement Learning (Page 1623)
Kexing Peng (School of Computer Science, Nanjing University of Information Science & Technology)
Pengyi Li (College of Intelligence and Computing, Tianjin University)
Jianye Hao (College of Intelligence and Computing, Tianjin University)

Return to top

Multi-objective Reinforcement Learning with Nonlinear Preferences: Provable Approximation for Maximizing Expected Scalarized Return (Page 1632)
Nianli Peng (Harvard University)
Muhang Tian (Duke University)
Brandon Fain (Duke University)

ShipNaviSim: Data-Driven Simulation for Real-World Maritime Navigation (Page 1641)
Quang Anh Pham (Singapore Management University)
Janaka Chathuranga Brahmanage (Singapore Management University)
Akshat Kumar (Singapore Management University)

Artificial Agents Mitigate The Punishment Dilemma of Indirect Reciprocity (Page 1650)
Alexandre S. Pires (University of Amsterdam)
Fernando P. Santos (University of Amsterdam)

Anytime Fairness Guarantees in Stochastic Combinatorial MABs: A Novel Learning Framework (Page 1660)
Subham Pokhriyal (Indian Institute of Technology Ropar)
Shweta Jain (Indian Institute of Technology Ropar)
Ganesh Ghalme (Indian Institute of Technology Hyderabad)
Vaneet Aggarwal (Purdue University)

Indifferential Privacy: A New Paradigm and Its Applications to Optimal Matching in Dark Pool Auctions (Page 1670)
Antigoni Polychroniadou (J.P. Morgan AI Research, J.P. Morgan AlgoCRYPT CoE)
T-H. Hubert Chan (University of Hong Kong)
Adya Agrawal (J.P. Morgan Chase)

EconoJax: A Fast & Scalable Economic Simulation in JAX (Page 1679)
Koen Ponse (LIACS, Leiden University)
Aske Plaat (LIACS, Leiden University)
Niki van Stein (LIACS, Leiden University)
Thomas M. Moerland (LIACS, Leiden University)

Decentralized Planning Using Probabilistic Hyperproperties (Page 1688)
Francesco Pontiggia (TU Wien)
Filip Macák (Brno University of Technology)
Roman Andriushchenko (Brno University of Technology)
Michele Chiari (TU Wien)
Milan Češka (Brno University of Technology)

Return to top

Uncertainty Expression for Human-Robot Task Communication (Page 1698)
David Porfirio (U.S. Naval Research Laboratory)
Mark Roberts (U.S. Naval Research Laboratory)
Laura M. Hiatt (U.S. Naval Research Laboratory)

Combining Planning and Reinforcement Learning for Solving Relational Multiagent Domains (Page 1708)
Nikhilesh Prabhakar (The University of Texas at Dallas)
Ranveer Singh (The University of Texas at Dallas)
Harsha Kokel (IBM Research)
Sriraam Natarajan (The University of Texas at Dallas)
Prasad Tadepalli (Oregon State University)

Reinforcement Learning Based Simulated Annealing (Page 1718)
Nathan Qiu (Stony Brook University)
Daniel Liang (Stony Brook University)

Planning, Scheduling, and Execution on the Moon: The CADRE Technology Demonstration Mission (Page 1727)
Gregg Rabideau (Jet Propulsion Laboratory - California Institute of Technology)
Joseph Russino (Jet Propulsion Laboratory - California Institute of Technology)
Andrew Branch (Jet Propulsion Laboratory - California Institute of Technology)
Nihal Dhamani (Jet Propulsion Laboratory - California Institute of Technology)
Tiago Stegun Vaquero (Jet Propulsion Laboratory - California Institute of Technology)
Steve Chien (Jet Propulsion Laboratory - California Institute of Technology)
Jean-Pierre de la Croix (Jet Propulsion Laboratory - California Institute of Technology)
Federico Rossi (Jet Propulsion Laboratory - California Institute of Technology)

Reputation-Filtered Reward Reshaping: Encouraging Cooperation in High Dimensional Semi-Cooperative Multi-agent Settings (Page 1736)
Hassan Raissouni (Ai Movement, Mohammed VI Polytechnic University)
Wissal Bekhti (Ai Movement, Mohammed VI Polytechnic University)
Btissam El Khamlichi (Ai Movement, Mohammed VI Polytechnic University)
Amal El Fallah Seghrouchni (Ai Movement, Mohammed VI Polytechnic University)

Bottom-Up Reputation Promotes Cooperation with Multi-Agent Reinforcement Learning (Page 1745)
Tianyu Ren (University of Manchester)
Xuan Yao (Southeast University)
Yang Li (University of Manchester)
Xiao-Jun Zeng (University of Manchester)

The Effect of Agent-based Feedback on Prosociality in Social Dilemmas (Page 1755)
Jennifer Renoux (Örebro University)
Filipa Correia (Interactive Technologies Institute)
Joana Campos (INESC-ID and Instituto Superior Técnico, University of Lisbon)
Lucas Morillo-Mendez (Örebro University)
Neziha Akalin (Jönköping University)
Fernando P. Santos (University of Amsterdam)
Ana Paiva (INESC-ID and Instituto Superior Técnico, University of Lisbon)

Return to top

Real-World Testing Matters in Reinforcement Learning for Education (Page 1764)
Anna Riedmann (Socially Interactive Agents, University of Würzburg)
Carlo D'Eramo (Center for Artificial Intelligence and Data Science, University of Würzburg & Technical University of Darmstadt)
Birgit Lugrin (Socially Interactive Agents, University of Würzburg)

Divide and Conquer: Provably Unveiling the Pareto Front with Multi-Objective Reinforcement Learning (Page 1774)
Willem Röpke (Vrije Universiteit Brussel)
Mathieu Reymond (Mila - Quebec Artificial Intelligence Institute & Vrije Universiteit Brussel)
Patrick Mannion (University of Galway)
Diederik M. Roijers (City of Amsterdam & Vrije Universiteit Brussel)
Ann Nowé (Vrije Universiteit Brussel)
Roxana RadulescuXXX (Utrecht University & Vrije Universiteit Brussel)

On Some Fundamental Problems for Multi-Agent Systems Over Multilayer Networks (Page 1784)
Daniel J. Rosenkrantz (University of Virginia)
Madhav V. Marathe (University of Virginia)
Zirou Qiu (University of Virginia)
S. S. Ravi (University of Virginia)
Richard E. Stearns (University of Virginia)

Factorised Active Inference for Strategic Multi-Agent Interactions (Page 1793)
Jaime Ruiz-Serra (Centre for Complex Systems, The University of Sydney)
Patrick Sweeney (Centre for Complex Systems, The University of Sydney)
Michael S. Harré (Centre for Complex Systems, The University of Sydney)

Multi-Objective Planning with Contextual Lexicographic Reward Preferences (Page 1803)
Pulkit Rustagi (Oregon State University)
Yashwanthi Anand (Oregon State University)
Sandhya Saisubramanian (Oregon State University)

Gricean Norms as a Basis for Effective Collaboration (Page 1812)
Fardin Saad (North Carolina State University)
Pradeep K. Murukannaiah (Delft University of Technology)
Munindar P. Singh (North Carolina State University)

Surprise! Surprise! Learn and Adapt (Page 1821)
Huma Samin (University of Exeter)
Dylan Walton (Durham University)
Nelly Bencomo (Durham University)

Return to top

Training Language Models for Social Deduction with Multi-Agent Reinforcement Learning (Page 1830)
Bidipta Sarkar (Stanford University)
Warren Xia (Stanford University)
C. Karen Liu (Stanford University)
Dorsa Sadigh (Stanford University)

Formalising Overdetermination in a Labelled Transition System (Page 1840)
Camilo Sarmiento (Lip6, Sorbonne Université)
Gauvain Bourgne (Lip6, Sorbonne Université)
Jean-Gabriel Ganascia (Lip6, Sorbonne Université)

Ensemble Value Functions for Efficient Exploration in Multi-Agent Reinforcement Learning (Page 1849)
Lukas Schäfer (University of Edinburgh)
Oliver Slumbers (University College London)
Stephen McAleer (Carnegie Mellon University)
Yali Du (King's College London)
Stefano V. Albrecht (University of Edinburgh)
David Mguni (Queen Mary University, London)

Candidate Nomination for Condorcet-consistent Voting Rules (Page 1858)
Ildikó Schlotter (HUN-REN Centre for Economic and Regional Studies)
Katarína Cechlárová (P.J. Šafárik University)

The Strong Core of Housing Markets with Partial Order Preferences (Page 1867)
Ildikó Schlotter (HUN-REN Centre for Economic and Regional Studies)
Lydia Mirabel Mendoza-Cadena (MTA-ELTE Matroid Optimization Research Group, Department of Operations Research, Eötvös Lorand University)

$Socratic:$ Enhancing Human Teamwork via AI-enabled Coaching (Page 1876)
Sangwon Seo (Rice University)
Bing Han (Rice University)
Rayan E. Harari (Harvard Medical School)
Roger D. Dias (Harvard Medical School)
Marco A. Zenati (Harvard Medical School)
Eduardo Salas (Rice University)
Vaibhav Unhelkar (Rice University)

Hierarchical Imitation Learning of Team Behavior from Heterogeneous Demonstrations (Page 1886)
Sangwon Seo (Rice University)
Vaibhav Unhelkar (Rice University)

Return to top

Towards Efficient Online Goal Recognition through Deep Learning (Page 1895)
Lorenzo Serina (Università degli Studi di Brescia)
Mattia Chiari (Università degli Studi di Brescia)
Alfonso Emilio Gerevini (Università degli Studi di Brescia)
Luca Putelli (Università degli Studi di Brescia)
Ivan Serina (Università degli Studi di Brescia)

Learning Symbolic Task Decompositions for Multi-Agent Teams (Page 1904)
Ameesh Shah (UC Berkeley)
Niklas Lauffer (UC Berkeley)
Thomas Chen (UC Berkeley)
Nikhil Pitta (UC Berkeley)
Sanjit A. Seshia (UC Berkeley)

Learning with Limited Shared Information in Multi-agent Multi-armed Bandit (Page 1914)
Junning Shao (Tsinghua University & Shanghai Qi Zhi Institute)
Siwei Wang (Microsoft Resea)
Zhixuan Fang (Tsinghua University & Shanghai Qi Zhi Institute)

Incentivizing Truth Exploration and Honest Reporting: A Contract Design Approach (Page 1923)
Yuming Shao (Tsinghua University)
Zhixuan Fang (Tsinghua University & Shanghai Qi Zhi Institute)

xSRL: Safety-Aware Explainable Reinforcement Learning - Safety as a Product of Explainability (Page 1932)
Risal Shahriar Shefin (Wake Forest University)
Md Asifur Rahman (Wake Forest University)
Thai Le (Indiana University)
Sarra Alqahtani (Wake Forest University)

Modeling the Centaur: Human-Machine Synergy in Sequential Decision Making (Page 1941)
David Shoresh (The Edmond and Lily Safra Center for Brain Sciences, Hebrew University)
Yonatan Loewenstein (The Edmond and Lily Safra Center for Brain Sciences Departments of Neurobiology and Cognitive Sciences and the Federmann Center for the Study of Rationality, Hebrew University)

Tackling Temporal Deontic Challenges with Equilibrium Logic (Page 1950)
Davide Soldà (TU Wien)
Pedro Cabalar (University of A Coruña)
Agata Ciabattoni (TU Wien)
Emery Neufeld (TU Wien)

Return to top

Housing Market on Networks (Page 1959)
Xinwei Song (Key Laboratory of Intelligent Perception and Human-Machine Collaboration, ShanghaiTech University)
Tianyi Yang (Key Laboratory of Intelligent Perception and Human-Machine Collaboration, ShanghaiTech University)
Dengji Zhao (Key Laboratory of Intelligent Perception and Human-Machine Collaboration, ShanghaiTech University)

An Organizationally-Oriented Approach to Enhancing Explainability and Control in Multi-Agent Reinforcement Learning (Page 1968)
Julien Soulé (Univ. Grenoble Alpes)
Jean-Paul Jamont (Univ. Grenoble Alpes)
Michel Occello (Univ. Grenoble Alpes)
Louis-Marie Traonouez (Thales Land and Air Systems, BU IAS)
Paul Théron (AICA IWG)

Revisiting Communication Efficiency in Multi-Agent Reinforcement Learning from the Dimensional Analysis Perspective (Page 1977)
Chuxiong Sun (National Key Laboratory of Space Integrated Information System, Institute of Software, Chinese Academy of Sciences)
Peng He (Beijing University of Posts and Telecommunications)
Rui Wang (National Key Laboratory of Space Integrated Information System, Institute of Software, Chinese Academy of Sciences & State Key Laboratory of Intelligent Game)
Changwen Zheng (National Key Laboratory of Space Integrated Information System, Institute of Software, Chinese Academy of Sciences)

Salience-Invariant Consistent Policy Learning for Generalization in Visual Reinforcement Learning (Page 1987)
Jingbo Sun (Institute of Automation, CASIA, Pengcheng Laboratory, & School of Artificial Intelligence, UCAS)
Songjun Tu (Institute of Automation, CASIA, Pengcheng Laboratory, & School of Artificial Intelligence, UCAS)
Qichao Zhang (Institute of Automation, CASIA & School of Artificial Intelligence, UCAS)
Ke Chen (Pengcheng Laboratory)
Dongbin Zhao (Institute of Automation, CASIA & School of Artificial Intelligence, UCAS)

The Many Challenges of Human-Like Agents in Virtual Game Environments (Page 1996)
Maciej Świechowski (QED Software)
Dominik Ślęzak (University of Warsaw)

Value Iteration for Learning Concurrently Executable Robotic Control Tasks (Page 2006)
Sheikh A. Tahmid (University of Waterloo)
Gennaro Notomista (University of Waterloo)

Ready, Bid, Go! On-Demand Delivery Using Fleets of Drones with Unknown, Heterogeneous Energy Storage Constraints. (Page 2015)
Mohamed S. Talamali (The University of Sheffield)
Genki Miyauchi (The University of Sheffield)
Thomas Watteyne (Inria)
Micael S. Couceiro (Ingeniarius, Ltd.)
Roderich Groß (Technical University of Darmstadt)

Return to top

The Degree of (Extended) Justified Representation and Its Optimization (Page 2024)
Biaoshuai Tao (Shanghai Jiao Tong University)
Chengkai Zhang (Shanghai Jiao Tong University)
Houyu Zhou (UNSW Sydney)

Logic of Knowledge and Cognitive Ability (Page 2033)
Jia Tao (Lafayette College)
Xinran Zhang (University of Illinois Urbana-Champaign)

EduQate: Generating Adaptive Curricula through RMABs in Education Settings (Page 2042)
Sidney Tio (Singapore Management University)
Dexun Li (Singapore Management University)
Pradeep Varakantham (Singapore Management University)

Large Language Models for Virtual Human Gesture Selection (Page 2051)
Parisa Ghanad Torshizi (Northeastern University)
Laura B. Hensel (University of Glasgow)
Ari Shapiro (FlawlessAI)
Stacy C. Marsella (Northeastern University)

Conditional Max-Sum for Asynchronous Multiagent Decision Making (Page 2060)
Dimitrios Troullinos (Technical University of Crete)
Georgios Chalkiadakis (Technical University of Crete)
Ioannis Papamichail (Technical University of Crete)
Markos Papageorgiou (Technical University of Crete)

Online Preference-based Reinforcement Learning with Self-augmented Feedback from Large Language Model (Page 2069)
Songjun Tu (Institute of Automation, CASIA, Pengcheng Laboratory, & School of Artificial Intelligence, UCAS)
Jingbo Sun (Institute of Automation, CASIA, Pengcheng Laboratory, & School of Artificial Intelligence, UCAS)
Qichao Zhang (Institute of Automation, CASIA & School of Artificial Intelligence, UCAS)
Xiangyuan Lan (Pengcheng Laboratory & Pazhou Laboratory (Huangpu))
Dongbin Zhao (Institute of Automation, CASIA & School of Artificial Intelligence, UCAS)

Maximizing Truth Learning in a Social Network is NP-hard (Page 2078)
Filip Úradník (Charles University Prague)
Amanda Wang (Princeton University)
Jie Gao (Rutgers University)

Return to top

Networked Agents in the Dark: Team Value Learning under Partial Observability (Page 2087)
Guilherme S. Varela (Instituto Superior Técnico, INESC-ID)
Alberto Sardinha (PUC-Rio)
Francisco S. Melo (Instituto Superior Técnico, INESC-ID)

HAVA: Hybrid Approach to Value-Alignment through Reward Weighing for Reinforcement Learning (Page 2096)
Kryspin Varys (University of Southampton)
Federico Cerutti (University of Brescia)
Adam Sobey (The Alan Turing Institute & University of Southampton)
Timothy J. Norman (University of Southampton)

A Minimax Approach to Ad Hoc Teamwork (Page 2105)
Victor Villin (Université de Neuchâtel)
Thomas Kleine Buening (The Alan Turing Institute)
Christos Dimitrakakis (Université de Neuchâtel)

Implicit Repair with Reinforcement Learning in Emergent Communication (Page 2115)
Fábio Vital (INESC-ID & Instituto Superior Técnico)
Alberto Sardinha (INESC-ID & PUC-Rio)
Francisco S. Melo (INESC-ID & Instituto Superior)

FLIGHT: Facility Location Integrating Generalized, Holistic Theory of Welfare (Page 2125)
Avyukta Manjunatha Vummintala (International Institute of Information Technology)
Shivam Gupta (Indian Institute of Technology Ropar)
Shweta Jain (Indian Institute of Technology)
Sujit Gujar (International Institute of Information Technology)

InCLET: Large Language Model In-context Learning can Improve Embodied Instruction-following (Page 2134)
Peng-Yuan Wang (National Key Laboratory for Novel Software Technology, School of Artificial Intelligence, Nanjing University & Polixir.ai)
Jing-Cheng Pang (National Key Laboratory for Novel Software Technology, School of Artificial Intelligence, Nanjing University & Polixir.ai)
Chen-Yang Wang (National Key Laboratory for Novel Software Technology, School of Artificial Intelligence, Nanjing University)
Xuhui Liu (National Key Laboratory for Novel Software Technology, School of Artificial Intelligence, Nanjing University)
Tian-Shuo Liu (National Key Laboratory for Novel Software Technology, School of Artificial Intelligence, Nanjing University & Polixir.ai)
Si-Hang Yang (National Key Laboratory for Novel Software Technology, School of Artificial Intelligence, Nanjing University & Polixir.ai)
Hong Qian (Shanghai Institute of AI for Education and School of Computer Science and Technology, East China Normal University)
Yang Yu (National Key Laboratory for Novel Software Technology, School of Artificial Intelligence, Nanjing University & Polixir.ai)

On Diffusion Models for Multi-Agent Partial Observability: Shared Attractors, Error Bounds, and Composite Flow (Page 2143)
Tonghan Wang (Harvard University)
Heng Dong (Tsinghua University)
Yanchen Jiang (Harvard University)
David C. Parkes (Harvard University)
Milind Tambe (Harvard University)

Return to top

ReSCOM: Reward-Shaped Curriculum for Efficient Multi-Agent Communication Learning (Page 2153)
Xinghai Wei (Beijing University of Posts and Telecommunications)
Tingting Yuan (University of Göttingen)
Jie Yuan (Beijing University of Posts and Telecommunications)
Dongxiao Liu (Beijing University of Posts and Telecommunications)
Xiaoming Fu (University of Göttingen)

Goal Recognition via Variational Causality (Page 2162)
Jiaqi Wen (University of Houston)
Leonardo Amado (University of Aberdeen)

A Scoresheet for Explainable AI (Page 2171)
Michael Winikoff (Victoria University of Wellington)
John Thangarajah (RMIT University)
Sebastian Rodriguez (RMIT University)

FGLight: Learning Neighbor-level Information for Traffic Signal Control (Page 2181)
Hang Xiao (School of Software, Northwest Polytechnical University)
Huale Li (School of Software, Northwest Polytechnical University & Yangtze River Delta Research Institute of NPU)
Shuhan Qi (School of Computer Science and Technology, Harbin Insitute of Technology, Shenzhen)
Jiajia Zhang (School of Computer Science and Technology, Harbin Institute of Technology Shenzhen)
DingZhong Cai (School of Software, Northwestern Polytechnical University)

ACORN: Acyclic Coordination with Reachability Network to Reduce Communication Redundancy in Multi-Agent Systems (Page 2190)
Yi Xie (FAET, Fudan University)
Ziqing Zhou (FAET, Fudan University)
Chun Ouyang (FAET, Fudan University)
Siao Liu (FAET, Fudan University)
Linqiang Hu (FAET, Fudan University)
Zhongxue Gan (FAET, Fudan University)

Finite-Horizon Single-Pull Restless Bandits: An Efficient Index Policy For Scarce Resource Allocation (Page 2199)
Guohjun Xiong (Harvard University)
Haichuan Wang (Harvard University)
Yuqi Pan (Harvard University)
Saptarshi Mandal (University of Illinois Urbana-Champaign)
Sanket Shah (Harvard University)
Niclas Boehmer (Harvard University)
Milind Tambe (Harvard University)

On the Effective Horizon of Inverse Reinforcement Learning (Page 2208)
Yiqing Xu (School of Computing, National University of Singapore)
Finale Doshi-Velez (Department of Computer Science, Harvard University)
David Hsu (School of Computing, Smart System Institute, National University of Singapore)

Return to top

Uncertainty-Aware Opponent Modeling for Deep Reinforcement Learning (Page 2217)
Likun Yang (School of Artificial Intelligence, University of Chinese Academy of Sciences & Institute of Automation, Chinese Academy of Sciences)
Pei Xu (School of Artificial Intelligence, University of Chinese Academy of Sciences & Institute of Automation, Chinese Academy of Sciences)
Shiyue Cao (School of Artificial Intelligence, University of Chinese Academy of Sciences & Institute of Automation, Chinese Academy of Sciences)
Yongjian Ren (School of Artificial Intelligence, University of Chinese Academy of Sciences & Institute of Automation, Chinese Academy of Sciences)
Xiaotang Chen (School of Artificial Intelligence, University of Chinese Academy of Sciences & Institute of Automation, Chinese Academy of Sciences)
Kaiqi Huang (School of Artificial Intelligence, University of Chinese Academy of Sciences, Institute of Automation, Chinese Academy of Sciences, & CAS Center for Excellence in Brain Science and Intelligence Technology)

Dual Ensembled Multiagent Q-Learning with Hypernet Regularizer (Page 2226)
Yaodong Yang (Department of CSE, CUHK)
Guangyong Chen (Zhejiang Lab)
Hongyao Tang (Mila, University of Montreal)
Furui Liu (Zhejiang Lab)
Danruo Deng (Department of CSE, CUHK)
Pheng-Ann Heng (Department of CSE, CUHK)

Self-Interpretable Reinforcement Learning via Rule Ensembles (Page 2235)
Yue Yang (Monash University)
Fan Yang (Monash University)
Yu Bai (Monash University)
Hao Wang (Monash University)

Asymptotic Existence of Class Envy-free Matchings (Page 2244)
Tomohiko Yokoyama (The University of Tokyo)
Ayumi Igarashi (The University of Tokyo)

Adaptive Episode Length Adjustment for Multi-agent Reinforcement Learning (Page 2253)
Byunghyun Yoo (Electronics and Telecommunications Research Institute (ETRI))
Younghwan Shin (Electronics and Telecommunications Research Institute (ETRI))
Hyunwoo Kim (Electronics and Telecommunications Research Institute (ETRI))
Euisok Chung (Electronics and Telecommunications Research Institute (ETRI))
Jeongmin Yang (Electronics and Telecommunications Research Institute (ETRI))

Task-Agnostic Contrastive pre-Training for Inter-Agent Communication (Page 2262)
Peihong Yu (University of Maryland)
Manav Mishra (IISER Bhopal)
Syed Zaidi (University of Maryland)
Pratap Tokekar (University of Maryland)

Imitation from Diverse Behaviors: Wasserstein Quality Diversity Imitation Learning with Single-Step Archive Exploration (Page 2271)
Xingrui Yu (CFAR, IHPC, Agency for Science, Technology and Research)
Zhenglin Wan (School of Data Science, The Chinese University of Hong Kong, Shenzhen)
David Mark Bossens (CFAR, IHPC, Agency for Science, Technology and Research)
Yueming Lyu (CFAR, IHPC, Agency for Science, Technology and Research)
Qing Guo (CFAR, IHPC, Agency for Science, Technology and Research)
Ivor W. Tsang (CFAR, IHPC, Agency for Science, Technology and Research & College of Computing and Data Science, NTU)

Return to top

Insights Regarding the Success of Damping in Improving Belief Propagation (Page 2281)
Uriel Zaed (Ben Gurion University)
Omer Lev (Ben Gurion University)
Roie Zivan (Ben Gurion University)

Enhancing Sub-Optimal Trajectory Stitching: Spatial Composition RvS for Offline RL (Page 2290)
Sheng Zang (Nanyang Technological University & Institute for Infocomm Research, A*STAR)
Zhiguang Cao (Singapore Management University)
Bo An (Nanyang Technological University & Skywork AI)
Senthilnath Jayavelu (Institute for Infocomm Research, A*STAR)
Xiaoli Li (Institute for Infocomm Research, A*STAR & Nanyang Technological University)

Loss of Plasticity: A New Perspective on Solving Multi-Agent Exploration for Sparse Reward Tasks (Page 2299)
Zehua Zang (University of Chinese Academy of Sciences & Institute of Software Chinese Academy of Sciences)
Chuxiong Sun (Institute of Software Chinese Academy of Sciences)
Lixiang Liu (Institute of Software Chinese Academy of Sciences)
Fuchun Sun (Tsinghua University & Institute of Software Chinese Academy of Sciences)
Changwen Zheng (Institute of Software Chinese Academy of Sciences)

On the Structure of EFX Orientations on Graphs (Page 2309)
Jinghan A. Zeng (University of Illinois Urbana-Champaign)
Ruta Mehta (University of Illinois Urbana-Champaign)

β-DQN: Improving Deep Q-Learning By Evolving the Behavior (Page 2317)
Hongming Zhang (University of Alberta & Amii)
Fengshuo Bai (Shanghai Jiao Tong University)
Chenjun Xiao (CUHK-Shenzhen)
Chao Gao (Edmonton Research Center, Huawei)
Bo Xu (CASIA)
Martin Müller (University of Alberta & Amii)

Incentives for Early Arrival in Cost Sharing (Page 2327)
Junyu Zhang (ShanghaiTech University)
Yao Zhang (Kyushu University)
Yaoxin Ge (ShanghaiTech University)
Dengji Zhao (ShanghaiTech University)
Hu Fu (Shanghai University of Finance and Economics)
Zhihao Gavin Tang (Shanghai University of Finance and Economics)
Pinyan Lu (Shanghai University of Finance and Economics)

Offline Goal-Conditioned Reinforcement Learning with Elastic-Subgoal Diffused Policy Learning (Page 2336)
Yaocheng Zhang (Institute of Automation, Chinese Academy of Sciences & School of Artificial Intelligence, University of Chinese Academy of Sciences)
Yuanheng Zhu (Institute of Automation, Chinese Academy of Sciences & School of Artificial Intelligence, University of Chinese Academy of Sciences)
Yuqian Fu (Institute of Automation, Chinese Academy of Sciences & School of Artificial Intelligence, University of Chinese Academy of Sciences)
Songjun Tu (Institute of Automation, Chinese Academy of Sciences & Pengcheng Laboratory)
Dongbin Zhao (Institute of Automation, Chinese Academy of Sciences & School of Artificial Intelligence, University of Chinese Academy of Sciences)

Return to top

Unveiling Decision Intention for Cooperative Multi-Agent Reinforcement Learning (Page 2345)
Zeren Zhang (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences)
Zhiwei Xu (School of Artificial Intelligence, Shandong University)
Guangchong Zhou (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences & School of Artificial Intelligence, University of Chinese Academy of Sciences)
Dapeng Li (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences & School of Artificial Intelligence, University of Chinese Academy of Sciences)
Bin Zhang (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences & School of Artificial Intelligence, University of Chinese Academy of Sciences)
Guoliang Fan (The Key Laboratory of Cognition and Decision Intelligence for Complex Systems, Institute of Automation, Chinese Academy of Sciences)

Agent-Based Analysis of Green Disclosure Policies and Their Market-Wide Impact on Firm Behavior (Page 2355)
Lingxiao Zhao (King's College London)
Maria Polukarov (King's College London)
Carmine Ventre (King's College London)

Mean Field Correlated Imitation Learning (Page 2364)
Zhiyu Zhao (Institute of Automation, CAS & School of Artificial Intelligence, UCAS)
Chengdong Ma (Institute for Artificial Intelligence, Peking University)
Qirui Mi (Institute of Automation, CAS & School of Artificial Intelligence, UCAS)
Ning Yang (Institute of Automation, CAS & School of Artificial Intelligence, UCAS)
Xue Yan (Institute of Automation, CAS & School of Artificial Intelligence, UCAS)
Mengyue Yang (University of Bristol)
Haifeng Zhang (Institute of Automation, CAS & School of Artificial Intelligence, UCAS)
Jun Wang (University College London)
Yaodong Yang (Institute for Artificial Intelligence, Peking University)

Offline-to-Online Multi-Agent Reinforcement Learning with Offline Value Function Memory and Sequential Exploration (Page 2373)
Hai Zhong (IIIS, Tsinghua University)
Xun Wang (IIIS, Tsinghua University)
Zhuoran Li (IIIS, Tsinghua University)
Longbo Huang (IIIS, Tsinghua University)

Single-Agent Planning in a Multi-Agent System: A Unified Framework for Type-Based Planners (Page 2382)
Fengming Zhu (The Hong Kong University of Science and Technology)
Fangzhen Lin (The Hong Kong University of Science and Technology)

Robust Policy Learning for Multi-UAV Collision Avoidance with Causal Feature Selection (Page 2392)
Jiafan Zhuang (Shantou University)
Gaofei Han (Shantou University)
Zihao Xia (Shantou University)
Che Lin (Shantou University)
Boxi Wang (Shantou University)
Dongliang Wang (Shantou University)
Wenji Li (Shantou University)
Zhifeng Hao (Shantou University)
Ruichu Cai (Guangdong University of Technology)
Zhun Fan (University of Electronic Science and Technology of China)

Extended Abstracts

Decision-Making in Evolving Environments: A Bayesian Multi-Agent Bandit Framework (Page 2402)
Mohammad Essa Alsomali (Lancaster University)
Leandro Soriano Marcolino (Lancaster University)
Barry Porter (Lancaster University)
Roberto Rodrigues-Filho (Federal University of Santa Catarina)

Return to top

Combining LLMs with a Logic-Based Framework to Explain MCTS (Page 2405)
Ziyan An (Vanderbilt University)
Xia Wang (Vanderbilt University)
Hendrik Baier (Eindhoven University of Technology)
Zirong Chen (Vanderbilt University)
Abhishek Dubey (Vanderbilt University)
Taylor T. Johnson (Vanderbilt University)
Jonathan Sprinkle (Vanderbilt University)
Ayan Mukhopadhyay (Vanderbilt University)
Meiyi Ma (Vanderbilt University)

Adaptive Multi-Round Influence Maximization with Limited Information (Page 2408)
Vincenzo Auletta (Università degli Studi di Salerno)
Francesco Carbone (Università degli Studi di Salerno)
Diodato Ferraioli (Università degli Studi di Salerno)
Cosimo Vinci (Università del Salento)

Safe Entropic Agents under Team Constraints (Page 2411)
Ayhan Alp Aydeniz (Oregon State University)
Enrico Marchesini (Massachusetts Institute of Technology)
Robert Loftin (University of Sheffield)
Christopher Amato (Northeastern University)
Kagan Tumer (Oregon State University)

Group Fairness in Multi-period Mobile Facility Location Problems (Page 2414)
Haris Aziz (UNSW Sydney)
Hau Chan (University of Nebraska-Lincoln)
Xingchen Sha (Columbia University)
Toby Walsh (UNSW Sydney)
Lirong Xia (Rutgers University)

Weighted Envy-free Allocation with Subsidy (Page 2417)
Haris Aziz (UNSW)
Xin Huang (Kyushu University)
Kei Kimura (Kyushu University)
Indrajit Saha (Kyushu University)
Zhaohong Sun (Kyushu University)
Mashbat Suzuki (UNSW)
Makoto Yokoo (Kyushu University)

Neighborhood Stability in Assignments on Graphs (Page 2420)
Haris Aziz (UNSW Sydney)
Grzegorz Lisowski (AGH University)
Mashbat Suzuki (UNSW Sydney)
Jeremy Vollen (UNSW Sydney)

On the Distortion of Multi-Winner Elections on the Line Metric (Page 2423)
Negar Babashah (Sharif University of Technology)
Hasti Karimi (Sharif University of Technology)
Masoud Seddighin (Tehran Institute for Advanced Studies (TeIAS), Khatam University)
Golnoosh Shahkarami (Max Planck Institut für Informatik, Universität des Saarlandes)

Return to top

Interaction Protocols in an Imperative Agent-Oriented Programming Language: the case of BSPL and SARL (Page 2426)
Matteo Baldoni (Dipartimento di Informatica, Università degli Studi di Torino)
Cristina Baroglio (Dipartimento di Informatica, Università degli Studi di Torino)
Stéphane Galland (Université de Technologie de Belfort Montbéliard, UTBM, CIAD UR 7533)
Roberto Micalizio (Dipartimento di Informatica, Università degli Studi di Torino)
Fatma Outay (College of Technological Innovation, Zayed University)
Stefano Tedeschi (Università della Valle d'Aosta - Université de la Vallée d'Aoste)

Multi-Agent Pickup and Delivery with Batteries (Page 2428)
Marcello Bavaro (Politecnico di Milano)
Francesco Amigoni (Politecnico di Milano)

Efficient Multi-Agent Delegated Search (Page 2431)
Curtis Bechtel (University of Southern California)
Shaddin Dughmi (University of Southern California)

Bridging the Gap between Partially Observable Stochastic Games and Sparse POMDP Methods (Page 2434)
Tyler Becker (University of Colorado Boulder)
Zachary Sunberg (University of Colorado Boulder)

Robust Strategies for Stochastic Multi-Agent Systems (Page 2437)
Raphaël Berthon (RWTH Aachen University)
Joost-Pieter Katoen (RWTH Aachen University)
Munyque Mittelmann (University of Naples Federico II)
Aniello Murano (University of Naples Federico II)

Multiplayer Games With Incomplete Information for Hyperproperty Verification (Page 2440)
Raven Beutner (CISPA Helmholtz Center for Information Security)
Bernd Finkbeiner (CISPA Helmholtz Center for Information Security)

Planning for Temporally Extended Goals based on alpha-CTL (Page 2443)
Viviane Bonadia dos Santos (Universidade de São Paulo)
Leliane Nunes de Barros (Universidade de São Paulo)
Maria Viviane de Menezes (Universidade Federal do Ceará)
Silvio do Lago Pereira (Faculdade de Tecnologia de São Paulo)

Return to top

Formal Verification of Manipulation Dialogues (Page 2446)
Andreas Brännström (Umeå University)
Chiaki Sakama (Wakayama University)
Juan Carlos Nieves (Umeå University)

(Submodular) Hedonic Games with Common Ranking Property (Page 2449)
Bugra Caskurlu (New Uzbekistan University)
Ali Eser (Colby College)

Agreement Games in Multi-Agent Systems (Page 2452)
Davide Catta (Université Sorbonne Paris Nord CNRS, LIPN, F-93430)
Angelo Ferrando (University of Modena and Reggio Emilia)
Vadim Malvone (Télécom Paris, Institut Polytechnique de Paris)

The Costly Bargain: Economic Impacts of Price-Seeking Behavior in Aging Populations (Page 2455)
Fuguang Chen (Carleton University)
Alan Tsang (Carleton University)

Dynamic Conservative Degree Allocation for Offline Multi-Agent Reinforcement Learning (Page 2457)
Haosheng Chen (East China Normal University)
Yun Hua (East China Normal University)
Junjie Sheng (East China Normal University)
Wenhao Li (Tongji University)
Bo Jin (Tongji University)
Xiangfeng Wang (East China Normal University & Shanghai Formal-Tech Information Technology Co., Lt)

Hierarchical Multi-Agent Framework for Dynamic Macroeconomic Modelling Using Large Language Models (Page 2460)
Zhixun Chen (University of Technology Sydney)
Zijing Shi (University of Technology Sydney)
Yaodong Yang (Peking University)
Meng Fang (University of Liverpool)
Yali Du (King's College London)

Traffic Anomaly Detection through Generative Modeling of Multi-Agent Interactions in Traffic Flow (Page 2463)
Zhuojun Chen (ASTRI)
Tacitus Hui (ASTRI)
Xinghua Zhu (ASTRI)
Dongzhe Su (ASTRI)

Return to top

Optimal Mechanism Design for Crowdfunding of Public Goods (Page 2466)
Yukun Cheng (School of Business, Jiangnan University)
Xiaotie Deng (CFCS, School of Computer Science, Peking University)
Baqiao Quan (School of Mathematical Sciences, Peking University)

Fairness in Cooperative Multi-agent Multi-objective Reinforcement Learning using the Expected Scalarized Return (Page 2469)
Farès Chouaki (LIP6, Sorbonne Université, CNRS)
Aurélie Beynier (LIP6, Sorbonne Université, CNRS)
Nicolas Maudet (LIP6, Sorbonne Université, CNRS)
Paolo Viappiani (LAMSADE, CNRS, Université Paris Dauphine - PSL)

Open-World Classification with Bayesian Gaussian Mixture Models (Page 2472)
Justin Clarke (University of Massachusetts)
Przemyslaw Grabowicz (University College Dublin)
David Jensen (University of Massachusetts)

Egalitarianism in Online Coalition Formation (Page 2475)
Saar Cohen (Department of Computer Science, Bar Ilan University)
Noa Agmon (Department of Computer Science, Bar Ilan University)

Resolving Multiple-Dynamic Model Uncertainty in Hypothesis-Driven Belief-MDPs (Page 2478)
Ofer Dagan (Aerospace Engineering Sciences, University of Colorado, Boulder)
Tyler Becker (Aerospace Engineering Sciences, University of Colorado, Boulder)
Zachary N. Sunberg (Aerospace Engineering Sciences, University of Colorado, Boulder)

Multi-Agent Reinforcement Learning with Selective State-Space Models (Page 2481)
Jemma Daniel (InstaDeep)
Ruan John de Kock (InstaDeep)
Louay Ben Nessir (InstaDeep)
Sasha Abramowitz (InstaDeep)
Omayma Mahjoub (InstaDeep)
Wiem Khlifi (InstaDeep)
Juan Claude Formanek (InstaDeep)
Arnu Pretorius (InstaDeep)

Voter Participation Control in Online Polls (Page 2484)
Koustav De (IIT Kharagpur)
Palash Dey (IIT Kharagpur)
Swagato Sanyal (University of Sheffield)

Return to top

Managing an Agent's Changing Intentions Using LTL_fSynthesis (Page 2487)
Giuseppe De Giacomo (University of Oxford & University of Rome 'La Sapienza')
Yves Lespérance (York University)
Gianmarco Parretti (University of Rome 'La Sapienza')
Fabio Patrizi (University of Rome 'La Sapienza')
Renzo Schram (Utrecht University)

Is an Exponentially Growing Action Space Really that Bad? Validating a Core Assumption for using Multi-Agent RL (Page 2490)
Ruan de Kock (University of Cape Town)
Arnu Pretorius (InstaDeep)
Jonathan Shock (University of Cape Town & Institut National de la Recherche Scientifique)

Symplex: Learning Social Norm Hierarchies by Combining Autonomous Exploration and Expert Imitation (Page 2493)
Oliver Deane (University of Bristol)
Oliver Ray (University of Bristol)

Asynchronous Cooperative Multi-Agent Reinforcement Learning with Limited Communication (Page 2496)
Sydney Dolan (Massachusetts Institute of Technology)
Siddharth Nayak (Massachusetts Institute of Technology)
Jasmine Jerry Aloor (Massachusetts Institute of Technology)
Hamsa Balakrishnan (Massachusetts Institute of Technology)

Parameterized Complexity of Hedonic Games with Enemy-Oriented Preferences (Page 2499)
Martin Durand (TU Wien)
Laurin Erlacher (TU Wien)
Johanne Müller Vistisen (TU Wien & Technical University of Denmark)
Sofia Simola (TU Wien)

Distributed Adaptive Macroscopic Ensemble Task Allocation of Heterogeneous Robot Teams in Dynamic Environments (Page 2502)
Victoria Edwards (The GRASP Laboratory, University of Pennsylvania)
M. Ani Hsieh (The GRASP Laboratory, University of Pennsylvania)

Weighted Envy Freeness With Bounded Subsidies (Page 2504)
Noga Klein Elmalem (The Open University of Israel)
Rica Gonen (The Open University of Israel)
Erel Segal-Halevi (Ariel University)

Return to top

Agential AI for Integrated Continual Learning, Deliberative Behavior, and Comprehensible Models (Page 2507)
Zeki Doruk Erden (École Polytechnique Fédérale de Lausanne)
Boi Faltings (École Polytechnique Fédérale de Lausanne)

ADAGE: A Generic Two-layer Framework for Adaptive Agent based Modelling (Page 2510)
Benjamin Patrick Evans (JP Morgan AI Research)
Sihan Zeng (JP Morgan AI Research)
Sumitra Ganesh (JP Morgan AI Research)
Leo Ardon (JP Morgan AI Research)

Participatory Budgeting Project Strength via Candidate Control (Page 2514)
Piotr Faliszewski (AGH University)
Lukasz Janeczko (AGH University)
Dušan Knop (Czech Technical University in Prague)
Jan Pokorný (Czech Technical University in Prague)
Šimon Schierreich (Czech Technical University in Prague)
Mateusz Sluszniak (AGH University)
Krzysztof Sornat (AGH University)

Quantitative Operational Monitoring for BDI Agents (Page 2517)
Marie Farrell (The University of Manchester)
Angelo Ferrando (University of Modena and Reggio Emilia)
Mengwei Xu (Newcastle University)

Bidirectional Distillation: A Mixed-Play Framework for Multi-Agent Generalizable Behaviors (Page 2520)
Lang Feng (Zhejiang University)
Jiahao Lin (Zhejiang University)
Dong Xing (Zhejiang University)
Li Zhang (Zhejiang University)
De Ma (Zhejiang University)
Gang Pan (Zhejiang University)

Action-Dependent Optimality-Preserving Reward Shaping (Page 2523)
Grant C. Forbes (North Carolina State University)
Jianxun Wang (North Carolina State University)
Leonardo Villalobos-Arias (North Carolina State University)
Arnav Jhala (North Carolina State University)
David I. Roberts (North Carolina State University)

Learning Flexible Heterogeneous Coordination With Capability-Aware Shared Hypernetworks (Page 2526)
Kevin Fu (Georgia Institute of Technology)
Pierce Howell (Georgia Institute of Technology)
Shalin Jain (Georgia Institute of Technology)
Harish Ravichandar (Georgia Institute of Technology)

Return to top

Nash Equilibrium and Learning Dynamics in Three-Player Matching m-Action Games (Page 2529)
Yuma Fujimoto (CyberAgent)
Kaito Ariu (CyberAgent)
Kenshi Abe (CyberAgent)

Adaptive Budget Optimization for Multichannel Advertising Using Combinatorial Bandits (Page 2532)
Briti Gangopadhyay (Sony)
Zhao Wang (Sony)
Alberto Silvio Chiappa (Sony & EPFL)
Shingo Takamatsu (Sony)

Matching Markets with Chores (Page 2535)
Jugal Garg (University of Illinois at Urbana-Champaign)
Thorben Tröbst (University of California, Irvine)
Vijay V. Vazirani (University of California, Irvine)

Learning Bayesian Game Families, with Application to Mechanism Design (Page 2538)
Madelyn Gatchel (University of Michigan)
Michael P. Wellman (University of Michigan)

ChatBDI: Think BDI, Talk LLM (Page 2541)
Andrea Gatti (DIBRIS – University of Genoa)
Viviana Mascardi (DIBRIS – University of Genoa)
Angelo Ferrando (DSFIM – University of Modena-Reggio Emilia)

Satisfactory Budget Division (Page 2544)
Laurent Gourvès (Université Paris-Dauphine, Université PSL, CNRS, LAMSADE)
Michael Lampis (Université Paris-Dauphine, Université PSL, CNRS, LAMSADE)
Nikolaos Melissinos (Czech Technical University of Prague)
Aris Pagourtzis (National Technical University of Athens & Archimedes/Athena RC)

Social Ranking for Feature Selection (Page 2547)
Laurent Gourvès (LAMSADE, CNRS, Université Paris-Dauphine, Université PSL)
Stefano Moretti (LAMSADE, CNRS, Université Paris-Dauphine, Université PSL)
Satya Tamby (LAMSADE, CNRS, Université Paris-Dauphine, Université PSL)

Return to top

Can you see how I learn? Human Observers' Inferences about Reinforcement Learning Agents' Learning Processes (Page 2550)
Bernhard Hilpert (Leiden University)
Muhan Hou (Vrije Universiteit Amsterdam)
Kim Baraka (Vrije Universiteit Amsterdam)
Joost Broekens (Leiden University)

Making Universal Policies Universal (Page 2553)
Niklas Hoepner (University of Amsterdam)
David Kuric (University of Amsterdam)
Herke van Hoof (University of Amsterdam)

Prompt Tuning with Diffusion for Few-Shot Pre-trained Policy Generalization (Page 2556)
Shengchao Hu (Shanghai Jiao Tong University)
Wanru Zhao (University of Cambridge)
Weixiong Lin (Shanghai Jiao Tong University)
Li Shen (Sun Yat-sen University)
Ya Zhang (Shanghai Jiao Tong University)
Dacheng Tao (Nanyang Technological University)

Fair Assignment on Multi-Stage Graphs (Page 2559)
Vibulan J (IIITDM Kancheepuram)
Swapnil Dhamal (Indian Institute of Technology Ropar)
Shweta Jain (Indian Institute of Technology Ropar)
Ojassvi Kumar (Indian Institute of Technology Ropar)
Aman Kumar (Indian Institute of Technology Ropar)
Harpreet Singh (Indian Institute of Technology Ropar)

Decoding Negotiation Dynamics: The Impact of Opponent Identity and Privacy on Strategy, Deception, and Emotional Transparency in Human-Agent Interaction (Page 2562)
Nusrath Jahan (University of Central Florida)
Johnathan Mell (University of Central Florida)

Predicting Team Performance from Communications in Simulated Search-and-Rescue (Page 2565)
Ali Jalal-Kamali (University of Southern California)
Nikolos M. Gurney (University of Southern California)
David V. Pynadath (Rice University)

FedHPD: Heterogeneous Federated Reinforcement Learning via Policy Distillation (Page 2568)
Wenzheng Jiang (National University of Defense Technology)
Ji Wang (National University of Defense Technology)
Xiongtao Zhang (National University of Defense Technology)
Weidong Bao (National University of Defense Technology)
Cheston Tan (CFAR, A*STAR)
Flint Xiaofeng Fan (National University of Singapore)

Return to top

When to Stop Getting Tested: The Theory of Diagnostic Tests (Page 2571)
Anson Kahng (University of Rochester)
Joseph Saber (University of Rochester)

Evaluating and Improving Graph-based Explanation Methods for Multi-Agent Coordination (Page 2574)
Siva Kailas (Georgia Institute of Technology)
Shalin Jain (Georgia Institute of Technology)
Harish Ravichandar (Georgia Institute of Technology)

Resource Allocation under the Latin Square Constraint (Page 2577)
Yasushi Kawase (The University of Tokyo)
Bodhayan Roy (Indian Institute of Technology Kharagpur)
Mohammad Azharuddin Sanpui (Indian Institute of Technology Kharagpur)

RallyDiffuser: A Representation-Guided Diffusion Model Framework for Strategic Planning in Badminton (Page 2579)
Bing-Zhi Ke (Department of Computer Science, National Yang Ming Chiao Tung University)
Kuang-Da Wang (Department of Computer Science, National Yang Ming Chiao Tung University)
Wen-Chih Peng (Department of Computer Science, National Yang Ming Chiao Tung University)

Adaptive Microtolling in Competitive Online Congestion Games via Multiagent Reinforcement Learning (Page 2582)
Behrad Koohy (University of Southampton)
Sebastian Stein (University of Southampton)
Enrico Gerding (University of Southampton)

Compensating Latent Nonlinear Dynamics for Practical Consensus Control (Page 2585)
Krzysztof Kowalczyk (Wroclaw University of Science and Technology)
Dominik Baumann (Aalto University)
Cristian R. Rojas (KTH Royal Institute of Technology)
Pawel Wachel (Wroclaw University of Science and Technology)

Online Competitive Information Gathering for Partially Observable Trajectory Games (Page 2588)
Mel Krusniak (Vanderbilt University)
Hang Xu (Vanderbilt University)
Parker Palermo (Vanderbilt University)
Forrest Laine (Vanderbilt University)

Return to top

DECAF: Learning to be Fair in Multi-agent Resource Allocation (Page 2591)
Ashwin Kumar (Washington University in St. Louis)
William Yeoh (Washington University in St. Louis)

Truman: A Large Language Model-based Multi-agent Simulator for Synthetic Money Laundering Data Generation (Page 2594)
Dattatray Vishnu Kute (The University of New South Wales)
Zihao Xu (The University of New South Wales)
Yuekang Li (The University of New South Wales)
Fethi Rabhi (The University of New South Wales)

Knowledge Transfer in Model-Based Reinforcement Learning Agents for Efficient Multi-Task Learning (Page 2597)
Dmytro Kuzmenko (National University of Kyiv-Mohyla Academy)
Nadiya Shvai (National University of Kyiv-Mohyla Academy & Cyclope.ai)

Model of the Influence of External Signals on the Trust of the Agent in Multi Agent System (Page 2600)
Frédérique Lalieu (Complex Cyber Infrastructure, Informatics Institute, Faculty of Science, University of Amsterdam)
Tomasz Zurek (Complex Cyber Infrastructure, Informatics Institute, Faculty of Science, University of Amsterdam)
Tom van Engers (University of Amsterdam & TNO / Leibniz Institute)

To Stand on the Shoulders of Giants: Should We Protect Initial Discoveries in Multi-Agent Exploration? (Page 2603)
Hodaya Lampert (State Comptroller Office)
Reshef Meir (Technion—Israel Institute of Technology)
Kinneret Teodorescu (Technion—Israel Institute of Technology)

Equilibrium Selection via Communication Partition (Page 2606)
Wei-Chen Lee (University of Oxford)
Alessandro Abate (University of Oxford)
Michael Wooldridge (University of Oxford)

Observer-Aware Probabilistic Planning under Partial Observability (Page 2609)
Salomé Lepers (Univ. de Lorraine, CNRS, Inria, Loria)
Vincent Thomas (Univ. de Lorraine, CNRS, Inria, Loria)
Olivier Buffet (Univ. de Lorraine, CNRS, Inria, Loria)

Return to top

Offline Meta Reinforcement Learning with Weighted Policy Constraints and Proximal Context Collection (Page 2612)
Haorui Li (State Key Laboratory of Multimodal Artificial Intelligence Systems, Institute of Automation, CAS & School of Artificial Intelligence, UCAS)
Jiaqi Liang (State Key Laboratory of Multimodal Artificial Intelligence Systems, Institute of Automation, CAS)
Linjing Li (State Key Laboratory of Multimodal Artificial Intelligence Systems, Institute of Automation, CAS & School of Artificial Intelligence, UCAS)
Daniel Zeng (State Key Laboratory of Multimodal Artificial Intelligence Systems, Institute of Automation, CAS & School of Artificial Intelligence, UCAS)

Group-fair Facility Location Games with Externalities (Page 2615)
Minming Li (City University of Hong Kong)
Cheng Peng (Shanghai Jiao Tong University)
Ying Wang (City University of Hong Kong & Columbia University)
Houyu Zhou (UNSW Sydney)

Lite-DIO Is Actually What You Need for Efficient Inertial Localization (Page 2618)
Yan Li (The School of Systems Science and Engineering, Sun Yat-Sen University)
Meng Liu (College of Intelligent Systems Science and Engineering, Harbin Engineering University)
Zhongchen Shi (Defense Innovation Institute, Academy of Military Sciences (AMS))
Yanqing Hou (The School of Systems Science and Engineering, Sun Yat-Sen University)
Liang Xie (Defense Innovation Institute, National University of Defense Technology & Tsinghua University)
Hongbo Chen (The School of Systems Science and Engineering, Sun Yat-Sen University)
Erwei Yin (Defense Innovation Institute, Academy of Military Sciences (AMS))

Diversity-seeking Swap Games in Networks (Page 2621)
Yaqiao Li (Faculty of Comp. Sci. and Control Eng., Shenzhen University of Advanced Technology)
Lata Narayanan (Dept of Computer Science and Software Engineering, Concordia University)
Jaroslav Opatrny (Dept of Computer Science and Software Engineering, Concordia University)
Yi Tian Xu (Independent Researcher)

Fusing Physical and Cognitive Stimuli: An Eye Movement Emotion Recognition Framework Based on Hierarchical Attention Mechanism (Page 2624)
Zhilin Li (Key Lab of Education Blockchain and Intelligent Technology, Ministry of Education & Guangxi Key Lab of Multi-Source Information Mining and Security, Guangxi Normal University)
Xiaomei Tao (Key Lab of Education Blockchain and Intelligent Technology, Ministry of Education & Guangxi Key Lab of Multi-Source Information Mining and Security, Guangxi Normal University)

What Is a Counterfactual Cause in Action Theories? (Page 2627)
Daxin Liu (Nanjing University)
Vaishak Belle (The University of Edinburgh)

Tacit Learning with Adaptive Information Selection for Cooperative Multi-Agent Reinforcement Learning (Page 2630)
Lunjun Liu (College of Electrical and Information Engineering , Hunan University & Greater Bay Area Institute for Innovation, Hunan University)
Weilai Jiang (College of Electrical and Information Engineering , Hunan University & Greater Bay Area Institute for Innovation, Hunan University)
Yaonan Wang (College of Electrical and Information Engineering , Hunan University & Greater Bay Area Institute for Innovation, Hunan University)

Return to top

Policies with Sparse Inter-Agent Dependencies in Dynamic Games: A Dynamic Programming Approach (Page 2633)
Xinjie Liu (The University of Texas at Austin)
Jingqi Li (University of California, Berkeley)
Filippos Fotiadis (The University of Texas at Austin)
Mustafa O. Karabag (The University of Texas at Austin)
Jesse Milzman (Army Research Laboratory)
David Fridovich-Keil (The University of Texas at Austin)
Ufuk Topcu (The University of Texas at Austin)

Adaptive Offline Data Replay in Offline-to-Online Reinforcement Learning (Page 2636)
Xu Liu (Shanghai Jiao Tong University)
Tong Yu (Adobe Research)
Shuai Li (Shanghai Jiao Tong University)

RainbowArena: A Multi-Agent Toolkit for Reinforcement Learning and Large Language Models in Competitive Tabletop Games (Page 2639)
Yingzhuo Liu (Beijing University of Posts and Telecommunications)
Shuodi Liu (Beijing University of Posts and Telecommunications)
Hongsong Tang (Beijing University of Posts and Telecommunications)
Yubing Ma (Beijing University of Posts and Telecommunications)
Zikang Li (Beijing University of Posts and Telecommunications)
Junge Zhang (Institute of Automation, Chinese Academy of Science)
Liuyu Xiang (Beijing University of Posts and Telecommunications)
Zhaofeng He (Beijing University of Post and Telecommunication)

CDSA: Conservative Denoising Score-based Algorithm for Offline Reinforcement Learning (Page 2642)
Zeyuan Liu (Tsinghua Shenzhen International Graduate School, Tsinghua University)
Kai Yang (Tsinghua Shenzhen International Graduate School, Tsinghua University)
Jiafei Lyu (Tsinghua Shenzhen International Graduate School, Tsinghua University)
Xiu Li (Tsinghua Shenzhen International Graduate School, Tsinghua University)

Tools in the Loop: Quantifying Uncertainty of LLM Question Answering Systems That Use Tools (Page 2645)
Panagiotis Lymperopoulos (Tufts University)
Vasanth Sarathy (Tufts University)

Mitigating Non-Stationarity in Deep Reinforcement Learning with Clustering Orthogonal Weight Modification (Page 2648)
Guoqing Ma (Institute of automation, Chinese Academy of Sciences & School of Future Technology, University of Chinese Academy of Sciences)
Yuhan Zhang (Institute of automation, Chinese Academy of Sciences & School of Future Technology, University of Chinese Academy of Sciences)
Yuming Dai (Institute of automation, Chinese Academy of Sciences & School of Future Technology, University of Chinese Academy of Sciences)
Guangfu Hao (Institute of automation, Chinese Academy of Sciences & School of Future Technology, University of Chinese Academy of Sciences)
Yang Chen (Institute of Automation, Chinese Academy of Sciences & Key Laboratory of Brain Cognition and Brain-inspired Intelligence Technology, Chinese Academy of Sciences)
Shan Yu (Institute of Automation, Chinese Academy of Sciences, School of Future Technology, University of Chinese Academy of Sciences, and Key Laboratory of Brain Cognition and Brain-inspired Intelligence Technology, Chinese Academy of Sciences)

DyLam: A Dynamic Reward Weighting Framework for Reinforcement Learning Algorithms (Page 2651)
Mateus Machado (Centro de Informática - UFPE)
Hansenclever Bassani (Centro de Informática - UFPE)

Return to top

IBGP: Imperfect Byzantine Generals Problem for Zero-Shot Robustness in Communicative Multi-Agent Systems (Page 2654)
Yihuan Mao (Institute for Interdisciplinary Information Sciences, Tsinghua University)
Yipeng Kang (State Key Laboratory of General Artificial Intelligence, BIGAI)
Peilun Li (Shanghai Tree Graph Blockchain Research Institute)
Ning Zhang (Washington University in St. Louis)
Wei Xu (Institute for Interdisciplinary Information Sciences, Tsinghua University)
Chongjie Zhang (Washington University in St. Louis)

AlphaZeroES: Direct Score Maximization Outperforms Planning Loss Minimization (Page 2657)
Carlos Martin (Carnegie Mellon University)
Tuomas Sandholm (Carnegie Mellon University, Strategy Robot, Inc., Optimized Markets, Inc., & Strategic Machine, Inc.)

Learning Fair and Preferable Allocations through Neural Network (Page 2660)
Ryota Maruo (Kyoto University)
Koh Takeuchi (Kyoto University)
Hisashi Kashima (Kyoto University)

Rethinking Explainable AI: Explanations can be Deceiving (Page 2663)
Peta Masters (King's College London)
Daniel Gallagher (Monash University)
Luc Moreau (University of Sussex)
Mor Vered (Monash University)

Where is the Nearest EV Charging Station? Evolutionary Optimization of the Gas/charging Stations Topology (Page 2666)
Enrique Mateos-Melero (Universidad Carlos III de Madrid)
Javier Moralejo-Piñas (Universidad Carlos III de Madrid)
Ángela Durán-Pinto (Universidad Carlos III de Madrid)
Francisco Martinez-Gil (Universidad de Valencia)
María Soriano (REPSOL Technology Lab)
Fernando Fernández (Universidad Carlos III de Madrid)

Predictive Improvement through Latent Space Optimisation (Page 2669)
Alexander McCaffrey (City, University of London)
Eduardo Alonso (City, University of London)
Esther Mondragon (City, University of London)

Dynamic Option Creation in Option-Critic Reinforcement Learning (Page 2672)
Mateus B. Melchiades (Universidade Vale do Rio dos Sinos)
Gabriel de O. Ramos (Universidade Vale do Rio dos Sinos)
Bruno C. da Silva (University of Massachusetts, Amherst)

Return to top

Adapting Beyond the Depth Limit: Counter Strategies in Large Imperfect Information Games (Page 2675)
David Milec (AI Center, FEE, CTU in Prague)
Vojtĕch Kovařík (AI Center, FEE, CTU in Prague)
Viliam Lisý (AI Center, FEE, CTU in Prague)

Context Adaptive Memory-Efficient LLM Inference for Edge Multi-Agent Systems (Page 2678)
Hamza Mohammed (Samsung Research America)
Hang Yin (Samsung Research America)
Sai Chand Boyapati (Samsung Research America)

Learning Heterogeneous Agent Collaboration in Decentralized Multi-Agent Systems via Intrinsic Motivation (Page 2681)
Jahir Sadik Monon (University of Dhaka)
Deeparghya Dutta Barua (University of Dhaka)
Md Mosaddek Khan (University of Dhaka)

Improving the Effectiveness of Potential-based Reward Shaping in Reinforcement Learning (Page 2684)
Henrik Müller (L3S Research Center)
Daniel Kudenko (L3S Research Center)

Boosting Robustness in Preference-Based Reinforcement Learning with Dynamic Sparsity (Page 2687)
Calarina Muslimani (University of Alberta)
Bram Grooten (Eindhoven University of Technology)
Deepak R.S. Mamillapalli (University of Alberta)
Mykola Pechenizkiy (Eindhoven University of Technology)
Decebal C. Mocanu (University of Luxemburg)
Matthew E. Taylor (University of Alberta & Alberta Machine Intelligence Institute)

A Minimalist Approach to Augmentation-based Self-supervised Representation Learning for On-policy Reinforcement Learning (Page 2690)
Nasik Muhammad Nafi (Kansas State University)
William Hsu (Kansas State University)

Navigating Social Dilemmas with LLM-based Agents via Consideration of Future Consequences (Page 2693)
Dung Nguyen (Applied Artificial Intelligence Institute (A2I2), Deakin University)
Hung Le (Applied Artificial Intelligence Institute (A2I2), Deakin University)
Kien Do (Applied Artificial Intelligence Institute (A2I2), Deakin University)
Sunil Gupta (Applied Artificial Intelligence Institute (A2I2), Deakin University)
Svetha Venkatesh (Applied Artificial Intelligence Institute (A2I2), Deakin University)
Truyen Tran (Applied Artificial Intelligence Institute (A2I2), Deakin University)

Return to top

Stochastic $k$-Submodular Bandits with Full Bandit Feedback (Page 2696)
Guanyu Nie (Iowa State University)
Vaneet Aggarwal (Purdue University)
Christopher John Quinn (Iowa State University)

Reasoning and Planning with Dynamic Social Norms (Page 2699)
Taylor Olson (Northwestern University)
Roberto Salas-Damian (Northwestern University)
Kenneth D. Forbus (Northwestern University)

Multi-Objective Reinforcement Learning for Water Management (Page 2702)
Zuzanna Osika (Delft University of Technology)
Roxana Rădulescu (Utrecht University)
Jazmin Zatarain-Salazar (Delft University of Technology)
Frans A. Oliehoek (Delft University of Technology)
Pradeep K. Murukannaiah (Delft University of Technology)

Decentralized Deep Reinforcement Learning for Cooperative Multi-Agent Flight Trajectory Planning in Adverse Weather (Page 2705)
Bizhao Pang (Air Traffic Management Research Institute, Nanyang Technological University)
Xinting Hu (Air Traffic Management Research Institute, Nanyang Technological University)
Mingcheng Zhang (Air Traffic Management Research Institute, Nanyang Technological University)
Sameer Alam (Air Traffic Management Research Institute, Nanyang Technological University)
Guglielmo Lulli (Dept of Informatics, Systems and Communication, University of Milano-Bicocca)

Learning to Explore when Mistakes are Not Allowed (Page 2708)
Charly Pecqueux-Guézénec (Sorbonne Université, CNRS, ISIR)
Stéphane Doncieux (Sorbonne Université, CNRS, ISIR)
Nicolas Perrin-Gilbert (Sorbonne Université, CNRS, ISIR)

Enhancing Lifelong Multi-Agent Path-finding by Using Artificial Potential Fields (Page 2711)
Arseniy Pertzovsky (Ben-Gurion University of the Negev)
Roni Stern (Ben-Gurion University of the Negev)
Ariel Felner (Ben-Gurion University of the Negev)
Roie Zivan (Ben-Gurion University of the Negev)

Diverse Heterogeneous Graph Conditioned Diffusion for Multi-Agent Teaming (Page 2714)
Luis Pimentel (Georgia Institute of Technology)
Sean Ye (Georgia Institute of Technology)
James Ellis Grant Pagan (Sandia National Laboratories)
Matthew Gombolay (Georgia Institute of Technology)

Return to top

Enhancing Robot Navigation Policies with Task-Specific Uncertainty Management (Page 2717)
Gokul Puthumanaillam (University of Illinois Urbana-Champaign)
Paulo Padrao (Florida International University)
Jose Fuentes (Florida International University)
Leonardo Bobadilla (Florida International University)
Melkior Ornik (University of Illinois Urbana-Champaign)

Transformer Guided Coevolution: Improved Team Formation in Multiagent Adversarial Games (Page 2720)
Pranav Rajbhandari (Carnegie Mellon University)
Prithviraj Dasgupta (Naval Research Laboratory)
Donald Sofge (Naval Research Laboratory)

Shapley Value-based Approach for Distributing Revenue of Matchmaking of Private Transactions in Blockchains (Page 2723)
Rasheed (IIIT Hyderabad)
Parth Nimish Desai (IIIT Hyderabad)
Yash Chaurasia (IIIT Hyderabad)
Sujit Gujar (IIIT Hyderabad)

Requirements-based Explainability for Multi Agent Systems (Page 2726)
Sebastian Rodriguez (RMIT University)
John Thangarajah (RMIT University)
Michael Winikoff (Victoria University of Wellington)

Towards Automating the Design of Value-Aligned Clinical Protocols (Page 2729)
Manel Rodriguez-Soto (Artificial Intelligence Research Institute (IIIA-CSIC))
Nardine Osman (Artificial Intelligence Research Institute (IIIA-CSIC))
Carles Sierra (Artificial Intelligence Research Institute (IIIA-CSIC))
Rocio Cintas-Garcia (Hospital del Mar Research Institute (IMIM))
Cristina Farriols-Danes (Hospital del Mar Research Institute (IMIM))
Montserrat Garcia-Retortillo (Hospital del Mar Research Institute (IMIM))
Silvia Minguez-Maso (Hospital del Mar Research Institute (IMIM))
Jordi Martinez-Roldan (Hospital Sant Joan de Deu (SJD))

Liquid Welfare and Revenue Monotonicity in Adaptive Clinching Auctions (Page 2732)
Ryosuke Sato (Keio University)

On the Existence of EFX Allocations in Multigraphs (Page 2735)
Alkmini Sgouritsa (Athens University of Economics and Business, and Archimedes/Athena RC)
Minas Marios Sotiriou (National and Kapodistrian University of Athens, and National Technical University of Athens, and Athens University of Economics and Business)

Return to top

Environmental Policies within Cournot Oligopoly (Page 2738)
Liang Shan (Renmin University of China)
Zhengyang Liu (Beijing Institute of Technology)
Haoqiang Huang (Hong Kong University of Science and Technology)
Zihe Wang (Renmin University of China)

Negotiated Reasoning: On Provably Addressing Relative Over-Generalization (Page 2741)
Junjie Sheng (East China Normal University)
Wenhao Li (Tongji University)
Bo Jin (Tongji University)
Hongyuan Zha (The Chinese University of Hong Kong, Shenzhen)
Jun Wang (East China Normal University)
Xiangfeng Wang (East China Normal University & Shanghai Formal-Tech Information Technology Co., Lt)

Towards Fair and Efficient Policy Learning in Cooperative Multi-Agent Reinforcement Learning (Page 2744)
Umer Siddique (University of Texas San Antonio)
Peilang Li (University of Texas San Antonio)
Yongcan Cao (University of Texas San Antonio)

Hierarchical Multi-agent Reinforcement Learning for Cyber Network Defense (Page 2747)
Aditya Vikram Singh (Northeastern University)
Ethan Rathbun (Northeastern University)
Emma Graham (Dartmouth College)
Lisa Oakley (Northeastern University)
Simona Boboila (Northeastern University)
Peter Chin (Dartmouth College)
Alina Oprea (Northeastern University)

PANDA: Priority-Based Collision Avoidance Framework for Heterogeneous UAVs Navigating in Dense Airspace (Page 2750)
Agamdeep Singh (IISER Bhopal)
Jaskirat Singh (University of Petroleum and Energy Studies)
P.B. Sujit (IISER Bhopal)

Modeling the Collaborative Edge Data Caching Problem via a Dynamic DCOP (Page 2753)
Ziyang Song (College of Computer Science, Chongqing University)
Ziyu Chen (College of Computer Science, Chongqing University)
Jinhui Huang (College of Computer Science, Chongqing University)
Cheng Zhang (College of Computer Science, Chongqing University)
Jingyuan He (College of Computer Science, Chongqing University)

Pure Nash Equilibrium and Strong Nash Equilibrium Computation in Additive Aggregate Games (Page 2756)
Jared Soundy (The Beacom College of Computer & Cyber Sciences, Dakota State University)
Mohammad T. Irfan (Department of Computer Science, Bowdoin College)
Hau Chan (School of Computing, University of Nebraska-Lincoln)

Return to top

Coordinating Competing Electric Vehicle Fleets: An Agent-Based Charging Capacity Market (Page 2759)
Lennard Sund (University of Cologne)
Janik Muires (University of Cologne)
Ramin Ahadi (University of Cologne)
Konstantina Valogianni (IE University)
Wolfgang Ketter (University of Cologne)

Regret Guarantees for a UCB-based Algorithm for Volatile Combinatorial Bandits (Page 2762)
Abhishek Kumar (International Institute of Information Technology, Hyderabad)
Andra Siva Sai Teja (Indian Institute of Technology Hyderabad)
Ganesh Ghalme (Indian Institute of Technology Hyderabad)
Sujit Gujar (International Institute of Information Technology, Hyderabad)
Y. Narahari (Indian Institute of Science)

Practical Comparisons of Reservoir Topology Performance and Input Distribution in Digital Reservoir Computers (Page 2765)
Lewis Thelen (University of Cincinnati)
Vikram Ravindra (University of Cincinnati)

Dynamic Reward Sharing to Enhance Learning in the Context of Multiagent Teams (Page 2768)
Kyle Tilbury (University of Waterloo)
David Radke (Chicago Blackhawks)

Cultural Evolution of Cooperation among LLM Agents (Page 2771)
Aron Vallinder (PIBBSS)
Edward Hughes (Google DeepMind)

Distributed Value Decomposition Networks with Networked Agents (Page 2774)
Guilherme S. Varela (Instituto Superior Técnico, INESC-ID)
Alberto Sardinha (PUC-Rio)
Francisco S. Melo (Instituto Superior Técnico, INESC-ID)

Shifting Power: Leveraging LLMs to Simulate Human Aversion in ABMs of Bilateral Financial Exchanges, A bond market study (Page 2777)
Alicia Vidler (UNSW)
Toby Walsh (UNSW)

Return to top

Trading-off Accuracy and Communication Cost in Federated Learning (Page 2780)
Mattia Jacopo Villani (King's College London)
Emanuele Natale (Université Côte d’Azur)
Frederik Mallmann-Trenn (King's College London)

Leveraging Fully-Observable Solutions for Improved Partially-Observable Offline Reinforcement Learning (Page 2783)
Chulabhaya Wijesundara (Northeastern University, STR)
Andrea Baisero (Northeastern University)
Gregory Castañón (STR)
Alan Carlin (STR)
Robert Platt (Northeastern University)
Christopher Amato (Northeastern University)

Will Systems of LLM Agents Lead to Cooperation: An Investigation into a Social Dilemma (Page 2786)
Richard Willis (King's College London)
Yali Du (King's College London)
Joel Z. Leibo (Google DeepMind)

Combining Normative Ethics Principles to Learn Prosocial Behaviour (Page 2789)
Jessica Woodgate (University of Bristol)
Nirav Ajmeri (University of Bristol)

On-Policy Reinforcement Learning From Failure via Sparse Reward Densification (Page 2792)
Mingkang Wu (University of Texas at San Antonio)
Yongcan Cao (University of Texas at San Antonio)

Integrating Large Language Models with Reinforcement Learning for Generalization in Strategic Card Games (Page 2795)
Wannian Xia (School of Artificial Intelligence, University of Chinese Academy of Sciences)
Meng Fang (University of Liverpool)
Zihao Guo (King's College London)
Yali Du (King's College London)
Bo Xu (Institute of Automation, Chinese Academy of Sciences)

Heuristics-Assisted Experience Replay Strategy for Cooperative Multi-Agent Reinforcement Learning (Page 2798)
Yi Xie (FAET, Fudan University)
Ziqing Zhou (FAET, Fudan University)
Chun Ouyang (FAET, Fudan University)
Siao Liu (Fudan University)
Linqiang Hu (Fudan University)
Zhongxue Gan (Fudan University)

Return to top

Empowering Generalization for Deep Reinforcement Learning via Symbolic Planning (Page 2801)
Tianpei Yang (Nanjing University)
Srijita Das (University of Michigan - Dearborn)
Christabel Wayllace (New Mexico State University)
Matthew E. Taylor (University of Alberta and Amii)

Efficient Model Checking with Semantically-Equivalent Models for vGOAL (Page 2804)
Yi Yang (imec-DistriNet, KU Leuven)
Tom Holvoet (imec-DistriNet, KU Leuven)

Using Assistance Rewards Without Introducing Bias: Overcoming Sparse Rewards in Multi-Agent Reinforcement Learning (Page 2807)
Yue Yang (Monash University)
Bernd Meyer (Monash University)
Frits de Nijs (Monash University)

CPE: A New Paradigm for Policy Extraction in Offline Reinforcement Learning (Page 2810)
Zhaohui Yang (Institute of Automation, Chinese Academy of Sciences)
Xiaoxuan Wang (Institute of Automation, Chinese Academy of Sciences)
Linjing Li (Institute of Automation, Chinese Academy of Sciences)

Learning Pre-Trained Tacit Behavior for Efficient Multi-Agent Adversarial Coordination (Page 2813)
Shiqing Yao (Tsinghua Shenzhen International Graduate School, Tsinghua University)
Jiajun Chai (Institute of Automation, Chinese Academy of Sciences)
Haixin Yu (Tsinghua Shenzhen International Graduate School, Tsinghua University)
Yongzhe Chang (Tsinghua Shenzhen International Graduate School, Tsinghua University)
Yuanheng Zhu (Institute of Automation, Chinese Academy of Sciences)
Xueqian Wang (Tsinghua Shenzhen International Graduate School, Tsinghua University)

Local Anomaly Detection with Partial Observation in Multi-agent Systems as a Data Matching Game (Page 2816)
Zixin Ye (University of Melbourne)
Tansu Alpcan (University of Melbourne)
Christopher Leckie (University of Melbourne)

Fast Adaption by Policy Deviation Integral Meta-reinforcement Learning with Applications to High-speed Trains Operation (Page 2819)
Haotong Zhang (Chongqing Jiaotong University)
Wanyuan Wang (Southeast University)

Return to top

Enhancing Offline Safe Reinforcement Learning with Trajectory-Constrained Diffusion Planning (Page 2822)
Hengrui Zhang (Beijing Jiaotong University, Beijing Key Laboratory of Traffic Data Mining and Embodied Intelligence)
Youfang Lin (Beijing Jiaotong University, Beijing Key Laboratory of Traffic Data Mining and Embodied Intelligence)
Shuo Shen (Interactive Entertainment Group, Tencent)
Hanfeng Lin (Beijing Jiaotong University, Beijing Key Laboratory of Traffic Data Mining and Embodied Intelligence)
Peng Cheng (Beijing Jiaotong University, Beijing Key Laboratory of Traffic Data Mining and Embodied Intelligence)
Sheng han (Beijing Jiaotong University , Beijing Key Laboratory of Traffic Data Mining and Embodied Intelligence)
Kai Lv (Beijing Jiaotong University, Beijing Key Laboratory of Traffic Data Mining and Embodied Intelligence)

SFedRec: A Federated Learning Framework for Dynamic Session-based Recommendation (Page 2825)
Hexiao Zhang (School of Computer and Information Science, Southwest University)
Yanni Tang (University of Auckland)
Jiamou Liu (University of Auckland)
Wu Chen (School of Computer and Information Science, Southwest University)

Experience-replay Innovative Dynamics (Page 2829)
Tuo Zhang (University of Birmingham)
Leonardo Stella (University of Birmingham)
Julian Barreiro-Gomez (Khalifa University)

Efficient Training of Generalizable Visuomotor Policies via Control-Aware Augmentation (Page 2832)
Yinuo Zhao (Beijing Institute of Technology)
Kun Wu (Beijing Innovation Center of Humanoid Robotics)
Tianjiao Yi (Beijing Institute of Technology)
Zhiyuan Xu (Beijing Innovation Center of Humanoid Robotics)
Zhengping Che (Beijing Innovation Center of Humanoid Robotics)
Chi Harold Liu (Beijing Institute of Technology)
Jian Tang (Beijing Innovation Center of Humanoid Robotics)

Multi-Agent Systems for Bullying Intervention (Page 2835)
Luis Zhinin-Vera (University of Castilla-La Mancha)
José J. González-García (University of Castilla-La Mancha)
Víctor López-Jaquero (University of Castilla-La Mancha)
Elena Navarro (University of Castilla-La Mancha)
Pascual González (University of Castilla-La Mancha)

CADP: Towards Better Centralized Learning for Decentralized Execution in MARL (Page 2838)
Yihe Zhou (Zhejiang University)
Shunyu Liu (Nanyang Technological University)
Yunpeng Qing (Zhejiang University)
Tongya Zheng (Big Graph Center, Hangzhou City University)
Kaixuan Chen (State Key Laboratory of BC&DS, Zhejiang University)
Jie Song (State Key Laboratory of BC&DS, Zhejiang University)
Mingli Song (State Key Laboratory of BC&DS, Zhejiang University)

Reducing Variance Caused by Communication in Decentralized Multi-agent Deep Reinforcement Learning (Page 2841)
Changxi Zhu (Utrecht University)
Mehdi Dastani (Utrecht University)
Shihan Wang (Utrecht University)

Blue Sky Ideas

Return to top

Multimodal Agentic Model Predictive Control (Page 2844)
Saptarashmi Bandyopadhyay (Department of Computer Science, University of Maryland)
John (Jack) Cole (Department of Computer Science, University of Maryland)
Tom Goldstein (Department of Computer Science, University of Maryland)
David Jacobs (Department of Computer Science, University of Maryland)

Safe Systems with Unsafe Agents: Challenges and Opportunities (Page 2849)
Jeremy Bellay (Battelle Memorial Institute)
J. Timothy Balint (Battelle Memorial Institute)
Stephen A. Boxwell (Battelle Memorial lnstitute)
Jeffrey Geppert (Battelle Memorial Institute)

Contesting Black-Box AI Decisions (Page 2854)
Virginia Dignum (Umeå University)
Loizos Michael (Open University of Cyprus & CYENS Center of Excellence)
Juan Carlos Nieves (Umeå University)
Marija Slavkovik (University of Bergen)
Julliett Suarez (University of Granada)
Andreas Theodorou (Universitat Politècnica de Catalunya)

The Next Level of Long-Term Agent Autonomy -- Proactively Acquiring Knowledge and Abilities (Page 2859)
Hermine J. Grosinger (Örebro University)

Tyranny of the Minority in Social Choice: a Call to Arms (Page 2865)
Reshef Meir (Technion-Israel Institute of technology)

Tackling the Protocol Problem in Automated Negotiation (Page 2870)
Yasser Mohammad (NEC CORPORATION)

Grounding Agent Reasoning in Image Schemas: A Neurosymbolic Approach to Embodied Cognition (Page 2875)
Francois Olivier (CRIL CNRS & Artois University)
Zied Bouraoui (CRIL CNRS & Artois University)

Return to top

Market-based Architectures in RL and Beyond (Page 2880)
Abhimanyu Pallavi Sudhir (University of Warwick)
Long Tran-Thanh (University of Warwick)

Empirical Hardness in Multi-Agent Pathfinding: Research Challenges and Opportunities (Page 2885)
Jingyao Ren (University of Southern California)
Eric Ewing (Brown University)
T. K. Satish Kumar (University of Southern California)
Sven Koenig (University of California, Irvine)
Nora Ayanian (Brown University)

Multi-Agent Reinforcement Learning Simulation for Environmental Policy Synthesis (Page 2890)
James Rudd-Jones (Centre for Artificial Intelligence, Department of Computer Science, University College London)
Mirco Musolesi (Centre for Artificial Intelligence, Department of Computer Science , University College London & Department of Computer Science and Engineering, University of Bologna)
María Pérez-Ortiz (Centre for Artificial Intelligence, Department of Computer Science, University College London)

Unlocking the Potential of Decentralized LLM-based MAS: Privacy Preservation and Monetization in Collective Intelligence (Page 2896)
Yingxuan Yang (Shanghai Jiao Tong University)
Qiuying Peng (OPPO Research Institute)
Jun Wang (OPPO Research Institute)
Ying Wen (Shanghai Jiao Tong University & SII)
Weinan Zhang (Shanghai Jiao Tong University & SII)

Towards Foundation-model-based Multiagent System to Accelerate AI for Social Impact (Page 2901)
Yunfan Zhao (Harvard University & GE Healthcare)
Niclas Boehmer (Harvard University & Hasso Plattner Institute)
Aparna Taneja (Google Deepmind)
Milind Tambe (Harvard University & Google Deepmind)

Doctoral Consortium

Responsible Autonomy for Hybrid Intelligence (Page 2911)
Anastasia S. Apeiron (Utrecht University)

Return to top

Learning Diverse Multiagent Behaviors (Page 2914)
Ayhan Alp Aydeniz (Collaborative Robotics and Intelligent Systems Institute, Oregon State University)

Role of State in Partially Observable Reinforcement Learning (Page 2917)
Andrea Baisero (Northeastern University)

Balancing Fairness and Efficiency in the Allocation of Indivisible Goods (Page 2920)
Karen Frilya Celine (National University of Singapore)

Human Influences on Decision Making in Multi-Agent Systems (Page 2923)
Daniel E. Collins (University of Bristol)

Collective Decision Making via Automated Reasoning (Page 2926)
Ari Conati (University of Helsinki)

Game-Family Learning for Simulation-Based Games (Page 2929)
Madelyn Gatchel (University of Michigan)

Return to top

Hierarchical Frameworks for Scaling-up Multi-agent Coordination (Page 2932)
Minghong Geng (Singapore Management University)

Influence Based Reward Shaping in Multiagent Systems (Page 2935)
Everardo Gonzalez (Oregon State University)

Extending Consensus-based Task Allocation Algorithms with Bid Intercession to Foster Mixed-Initiative (Page 2938)
Victor Guillet (DTIS, ONERA, Université de Toulouse)

Informed Decision-Making via Voting (Page 2941)
Qishen Han (Rutgers University)

Causality in Multi-Agent Systems (Page 2944)
Sylvia S. Kerkhove (Utrecht University)

Efficient Offline Reinforcement Learning Through Dataset Characterization and Reduction (Page 2950)
Enrique Mateos-Melero (Universidad Carlos III de Madrid)

Environment-Centered Design of Ethical Environments (Page 2953)
Arnau Mayoral-Macau (Artificial Intelligence Research Institute (IIIA-CSIC))

Modeling and Optimizing Agent-Based Model of Conflict-Induced Forced Migration (Page 2956)
Zakaria Mehrab (University of Virginia)

Return to top

Safe Multi-Agent Learning via Shielding in Decentralized Environments (Page 2959)
Daniel Melcer (Northeastern University)

Agent-Based Modeling of Smart Sustainable Mobility Services, Markets, and Policy (Page 2965)
Janik Muires (University of Cologne)

Humanlike Emergent Language in Multi-Agent Systems (Page 2971)
Jannik Peters (University of Wuppertal)

The Impact of Artificial Agents in Human Cooperation Through Indirect Reciprocity (Page 2974)
Alexandre S. Pires (University of Amsterdam)

Bi-Level Reinforcement Learning for Multi-Robot Systems (Page 2977)
Arjun Prakash (Brown University)

Multi-Agent Multi-Objective Planning with Contextual Lexicographic Reward Preferences (Page 2982)
Pulkit Rustagi (Oregon State University)

Return to top

Deep Learning approaches to Goal Recognition (Page 2985)
Lorenzo Serina (Information Engineering, Università degli Studi di Brescia)

Different Models for Fair and Efficient Resource Allocation (Page 2988)
Bin Sun (Institut für Informatik, TU Clausthal)

Ethical Decision-Making in Multi-Agent Systems (Page 2991)
Jessica Woodgate (University of Bristol)

Learning with Less Effort: Efficient Training and Generalization in (Multi-)Robot Systems (Page 2994)
Peihong Yu (University of Maryland)

Demo Track

FindMe: A Prototype Videogame AI based on CTL with an Optimized Synthesis Algorithm (Page 2997)
Marco Aruta (University of Naples Federico II)
Vadim Malvone (Télécom Paris)
Aniello Murano (University of Naples Federico II)
Vincenzo Pio Palma (University of Naples Federico II)
Salvatore Romano (University of Naples Federico II)

[COMP24] The Automated Negotiating Agents Competition (ANAC) 2024 Challenges and Results (Page 3000)
Reyhan Aydogan (Özyegin Üniversity and Delft University of Technology)
Tim Baarslag (Centrum Wiskunde & Informatica (CWI) and Eindhoven University of Technology)
Tamara C.P. Florijn (Centrum Wiskunde & Informatica (CWI) and Utrecht University)
Katsuhide Fujita (Tokyo University of Agriculture and Technology & National Institute for Advanced Industrial Science and Technology)
Catholijn M. Jonker (Delft University of Technology and Leiden University)
Yasser Mohammad (NEC CORPORATION & National Institute for Advanced Industrial Science and Technology)

A JAX-Accelerated Simulation Framework for Multi-Agent Energy Management in Energy Communities (Page 3003)
Hicham Azmani (Vrije Universiteit Brussel)
Andries Rosseau (Vrije Universiteit Brussel)
Marjon Blondeel (Vrije Universiteit Brussel)
Ann Nowé (Vrije Universiteit Brussel)

Orpheus: Programming Protocol-Based BDI Agents (Page 3006)
Matteo Baldoni (University of Turin)
Samuel H. Christie (North Carolina State University)
Munindar P. Singh (North Carolina State University)
Amit K. Chopra (University of Lancaster)

LUNAR: A Runtime Verification Tool for Anomaly Detection in Gas Networks (Page 3009)
Julius Gasson (Imperial College)
Francesco Belardinelli (Imperial College)

BitML2MCMAS: Strategic Reasoning for Bitcoin Smart Contracts (Page 3012)
Luigi Bellomarini (Bank of Italy)
Marco Favorito (Bank of Italy)
Giuseppe Galano (Bank of Italy)

Return to top

Recommending Green Routes for Pedestrians to Reduce the Exposure to Air Pollutants in Barcelona (Page 3015)
Filippo Bistaffa (IIIA-CSIC)
Sergio Calo Oliveira (Pompeu Fabra University)

Serious Games for Ethical Preference Elicitation (Page 3018)
Jayati Deshmukh (University of Southampton)
Zijie Liang (University of Southampton)
Vahid Yazdanpanah (University of Southampton)
Sebastian Stein (University of Southampton)
Savapali D. Ramchurn (University of Southampton)

VITAMIN: VerIficaTion of A MultI ageNt system (Page 3023)
Angelo Ferrando (University of Modena and Reggio Emilia)
Vadim Malvone (LTCI, Télécom Paris, Institut Polytechnique de Paris)

CRLLK: Constrained Reinforcement Learning for Lane Keeping in Autonomous Driving (Page 3026)
Xinwei Gao (Nanyang Technological University)
Arambam James Singh (Nanyang Technological University)
Gangadhar Royyuru (Indian Institute of Technology)
Michael Yuhas (Nanyang Technological University)
Arvind Easwaran (Nanyang Technological University)

Leveraging Graph Structures and Large Language Models for End-to-End Synthetic Task-Oriented Dialogues (Page 3029)
Maya Medjad (UCBL, CNRS, Centrale Lyon, INSA Lyon, Univ. Lumière Lyon 2, LIRIS, UMR5205 69622 Villeurbanne, France)
Hugo Imbert (Reecall)
Bruno Yun (UCBL, CNRS, Centrale Lyon, INSA Lyon, Univ. Lumière Lyon 2, LIRIS, UMR5205 69622 Villeurbanne, France)
Raphaël Szymocha (Reecall)
Frédéric Armetta (UCBL, CNRS, Centrale Lyon, INSA Lyon, Univ. Lumière Lyon 2, LIRIS, UMR5205 69622 Villeurbanne, France)

Personalized Language Learning: A Multi-Agent System Leveraging LLMs for Teaching Luxembourgish. (Page 3032)
Tebourbi Hedi (University of Luxemburg)
Sana Nouzri (University of Luxemburg)
Yazan Mualla (Université de Technologie de Belfort Montbéliard, UTBM, CIAD UR 7533)
Amro Najjar (Luxembourg Institute of Science and Technology)

Eva: An LLM-based Multilingual Voice-agent Network for Restaurant Operations (Page 3035)
Zhiwei (Tony) Qin (foreva.ai (Eva))
Jianming Zhou (foreva.ai (Eva))

Simulating Tracking Data to Advance Sports Analytics Research (Page 3038)
David Radke (Chicago Blackhawks)
Kyle Tilbury (University of Waterloo)

Chat4Elderly: A Multi-Agent System for Personalized Wellness Using Generative AI and Wearable Technology (Page 3041)
Vítor Crista (GECAD, Polytechnic of Porto)
Diogo Martinho (GECAD, Polytechnic of Porto)
Goreti Marreiros (GECAD, Polytechnic of Porto)

Return to top

The Game Academy: Learn while playing, and play while learning! (Page 3044)
Simon Rey (ILLC, University of Amsterdam)
Ulle Endriss (ILLC, University of Amsterdam)

Simulating Blockchain Applications in Large-Value Payment Systems through Agent-Based Modeling (Page 3047)
Kenneth See (National University of Singapore)
Nicholas MacGregor Garcia (National University of Singapore)
Xiaofan Li (National University of Singapore)

UAV Marketplace Simulation Tool for BVLOS Operations (Page 3050)
Kivanç Şerefoğlu (Ozyegin University)
Önder Gürcan (NORCE, Norwegian Research Center AS)
Reyhan Aydoğan (Özyegin Űniversity and Delft University of Technology)

SmartPilot:Agent-Based CoPilot for Intelligent Manufacturing (Page 3053)
Chathurangi Shyalika (Artificial Intelligence Institute, University of South Carolina)
Renjith Prasad (Artificial Intelligence Institute, University of South Carolina)
Alaa Al Ghazo (Artificial Intelligence Institute, University of South Carolina)
Darssan L. Eswaramoorthi (Artificial Intelligence Institute, University of South Carolina)
Sara Shree Muthuselvam (Artificial Intelligence Institute, University of South Carolina)
Amit Sheth (Artificial Intelligence Institute, University of South Carolina)

Pabuviz.org: A Visualisation Platform to Explore Participatory Budgeting Elections (Page 3056)
Markus Utke (Eindhoven University of Technology)
Simon Rey (ILLC, University of Amsterdam)
Ulle Endriss (ILLC, University of Amsterdam)

MapBot: A Multi-Modal Agent for Geospatial Analysis (Page 3059)
Martin Weiss (Mila, Quebec AI Institute & Polytechnique Montreal)
Nasim Rahaman (Mila, Quebec AI Institute & Max Planck Institute for Intelligent Systems)
Chris Pal (Mila, Quebec AI Institute & Polytechnique Montreal)

Intention Recognition in Real-Time Interactive Navigation Maps (Page 3062)
Peijie Zhao (University of Manchester & CUHK)
Zunayed Arefin (University of Manchester)
Felipe Meneguzzi (University of Aberdeen & PUCRS)
Ramon Fraga Pereira (University of Manchester & UFRGS)

JAAMAS Track

When Is It Acceptable to Break the Rules? Knowledge Representation of Moral Judgements Based on Empirical Data (Extended Abstract) (Page 3065)
Edmond Awad (University of Exeter)
Sydney Levine (Massachusetts Institute of Technology)
Andrea Loreggia (University of Brescia)
Nicholas Mattei (Tulane University)
Iyad Rahwan (Center for Humans & Machines, Max Planck Institute for Human Development)
Francesca Rossi (IBM Research)
Kartik Talamadupula (Wand AI)
Joshua Tenenbaum (Massachusetts Institute of Technology)
Max Kleiman-Weiner (University of Washington)

Beyond the Echo Chamber: Modelling Open-Mindedness in Citizens' Assemblies (Page 3068)
Jake Barrett (University of Edinburgh)
Kobi Gal (University of Edinburgh & Ben-Gurion University)
Loizos Michael (Open University of Cyprus)
Dan Vilenchik (Ben-Gurion University)

Return to top

Contest Partitioning in Binary Contests: Costly, yet Beneficial (Page 3071)
Priel Levy (Bar-Ilan University)
Yonatan Aumann (Bar-Ilan University)
David Sarne (Bar-Ilan University)

A summary of: Tackling School Segregation with Transportation Network Interventions -- An Agent-Based Modelling Approach (Page 3074)
Dimitris Michailidis (University of Amsterdam)
Mayesha Tasnim (University of Amsterdam)
Sennay Ghebreab (University of Amsterdam)
Fernando P. Santos (University of Amsterdam)

Epistemic Selection of Costly Alternatives: The Case of Participatory Budgeting (Extended Abstract) (Page 3077)
Simon Rey (ILLC, University of Amsterdam)
Ulle Endriss (ILLC, University of Amsterdam)

Strategic Manipulation of Preferences in the Rank Minimization Mechanism (Page 3080)
Mayesha Tasnim (University of Amsterdam)
Youri Weesie (Vrije Universiteit Amsterdam)
Sennay Ghebreab (University of Amsterdam)
Max Baak (ING Bank)

Carbon Trading Supply Chain Management Based on Constrained Deep Reinforcement Learning (Page 3083)
Qinghao Wang (Institute for Artificial Intelligence, Peking University)
Yaodong Yang (Institute for Artificial Intelligence, Peking University)

Navigating in a Space of Game Views (extended abstract) (Page 3087)
Michael P. Wellman (University of Michigan)
Katherine Mayo (University of Michigan)

Resolving Social Dilemmas with Minimal Reward Transfer - Extended Abstract (Page 3089)
Richard Willis (King's College London)
Yali Du (King's College London)
Joel Z. Leibo (Google DeepMind)
Michael Luck (University of Sussex)