PA Bench : Évaluer les Agents Web sur des Workflows Réels d'Assistants Personnels
Découvre comment PA Bench redéfinit l'évaluation des agents web dans les workflows d'assistants personnels, en se concentrant sur des tâches complexes et multi-applications.
Lire l'article →