Skip to content

ISAA Reinforcement Learning System

Übersicht

Das RL-System (isaa_mod/base/rl/) ermöglicht Agent-Training durch Reinforcement Learning.

Komponenten

Komponente Datei Beschreibung
Training training.py Haupttraining Loop
DataCollection data_collection.py Experience Sammlung
DatasetBuilder dataset_builder.py Trainings-Dataset
RewardFunctions reward_functions.py Reward-Berechnung
AgentTools agent_tools.py Tools für RL-Agents

Training Flow

1. Agent führt Task aus
2. Environment gibt Reward
3. Experience wird gesammelt
4. Dataset wird aufgebaut
5. Policy wird aktualisiert

Usage

from isaa_mod.base.rl import Training, RewardFunctions

# Reward Function definieren
def my_reward(context):
    if context.success:
        return 1.0
    elif context.partial:
        return 0.5
    else:
        return -0.1

# Training starten
training = Training(
    agent=agent,
    reward_function=my_reward
)

await training.run(episodes=100)

Hardware Support

  • GPU Training - via hardware_config.py
  • Batch Processing - Mehrere Agents parallel
  • Distributed - Multi-GPU Support