ISAA Reinforcement Learning System¶

Übersicht¶

Das RL-System (isaa_mod/base/rl/) ermöglicht Agent-Training durch Reinforcement Learning.

Komponenten¶

Komponente	Datei	Beschreibung
`Training`	`training.py`	Haupttraining Loop
`DataCollection`	`data_collection.py`	Experience Sammlung
`DatasetBuilder`	`dataset_builder.py`	Trainings-Dataset
`RewardFunctions`	`reward_functions.py`	Reward-Berechnung
`AgentTools`	`agent_tools.py`	Tools für RL-Agents

Training Flow¶

1. Agent führt Task aus
2. Environment gibt Reward
3. Experience wird gesammelt
4. Dataset wird aufgebaut
5. Policy wird aktualisiert

Usage¶

from isaa_mod.base.rl import Training, RewardFunctions

# Reward Function definieren
def my_reward(context):
    if context.success:
        return 1.0
    elif context.partial:
        return 0.5
    else:
        return -0.1

# Training starten
training = Training(
    agent=agent,
    reward_function=my_reward
)

await training.run(episodes=100)

Hardware Support¶

GPU Training - via hardware_config.py
Batch Processing - Mehrere Agents parallel
Distributed - Multi-GPU Support