Bestärkendes Lernen

Intelligente Entscheidungsfindung für autonome Maschinen meistern

Fouad Sabry

EPUB
ca. 4,99
Amazon iTunes Thalia.de Hugendubel Bücher.de ebook.de kobo Osiander Google Books Barnes&Noble bol.com Legimi yourbook.shop Kulturkaufhaus ebooks-center.de
* Affiliatelinks/Werbelinks
Hinweis: Affiliatelinks/Werbelinks
Links auf reinlesen.de sind sogenannte Affiliate-Links. Wenn du auf so einen Affiliate-Link klickst und über diesen Link einkaufst, bekommt reinlesen.de von dem betreffenden Online-Shop oder Anbieter eine Provision. Für dich verändert sich der Preis nicht.

Eine Milliarde Sachkundig [German] img Link Publisher

Naturwissenschaften, Medizin, Informatik, Technik / Technik

Beschreibung

Im sich rasch entwickelnden Bereich der Robotik gilt Reinforcement Learning als eine der vielversprechendsten Methoden zum Aufbau autonomer Systeme. Dieses Buch, Reinforcement Learning, bietet eine eingehende Untersuchung dieser leistungsstarken Technik und führt die Leser von ihren Grundprinzipien bis hin zu ihren neuesten Fortschritten. Dieses Buch ist perfekt für Fachleute, Doktoranden und Enthusiasten gleichermaßen und bietet einen detaillierten und dennoch zugänglichen Ansatz zum Verständnis von Reinforcement Learning im Kontext der Robotik


Reinforcement Learning-Stellt das Kernkonzept von Reinforcement Learning vor und betont seine Rolle in autonomen Systemen


Markov-Entscheidungsprozess-Erklärt den mathematischen Rahmen für Entscheidungsfindung unter Unsicherheit, eine wichtige Grundlage für Reinforcement Learning


Zeitdifferenzlernen-Erforscht Methoden zum Lernen aus Erfahrung ohne ein Modell der Umgebung zu benötigen


Bellman-Gleichung-Erörtert die kritische rekursive Beziehung, die vielen Reinforcement-Learning-Algorithmen zugrunde liegt


Qlearning-Konzentriert sich auf einen Off-Policy-Reinforcement-Learning-Algorithmus, der optimale Aktionen ohne ein Modell der Umgebung lernt


Mehrarmiger Bandit-Behandelt ein einfacheres Problem des bestärkenden Lernens, das Entscheidungsfindung in unsicheren Umgebungen modelliert


Teilweise beobachtbarer Markow-Entscheidungsprozess-Erweitert traditionelle Markow-Entscheidungsprozesse durch die Einbeziehung verborgener Zustände


Gittins-Index-Führt eine Strategie zum Ausgleich von Exploration und Ausbeutung bei Problemen mit mehrarmigen Banditen ein


Zustand–Aktion–Belohnung–Zustand–Aktion-Befasst sich mit den zeitlichen Mustern des bestärkenden Lernens, die Entscheidungsfindungsstrategien beeinflussen


Protowertfunktion-Erforscht Methoden zur Annäherung von Wertfunktionen, die die Effizienz des Lernens unterstützen


Automatische Basisfunktionskonstruktion-Konzentriert sich auf automatische Methoden zur Konstruktion von Merkmalen zur Verbesserung der Lerneffizienz


Meanfield-Spieltheorie-Bespricht ein Framework zur Modellierung von Interaktionen in groß angelegten Multiagentensystemen


Multiagenten-Pfadfindung-Führt Algorithmen zur Koordination mehrerer Agenten ein, damit diese ihre Ziele effizient erreichen


Modellfrei (Verstärkendes Lernen)-Bespricht Methoden, die beim Lernen nicht auf ein Modell der Umgebung angewiesen sind


Tiefes verstärkendes Lernen-Kombiniert tiefes Lernen und verstärkendes Lernen, um komplexe, hochdimensionale Umgebungen zu handhaben


Multiagenten-verstärkendes Lernen-Konzentriert sich auf Strategien zum Lernen in Umgebungen mit mehreren interagierenden Agenten


Selbstspiel-Erforscht das Konzept von Agenten, die durch Wettbewerb mit sich selbst lernen, eine entscheidende Komponente fortgeschrittener Lernstrategien


Proximale Richtlinienoptimierung-Führt einen Algorithmus zur Optimierung von Richtlinien beim verstärkenden Lernen mit verbesserter Stabilität und Leistung ein


Explorations-/Ausbeutungsdilemma-Bespricht die grundlegende Herausforderung, die Erforschung neuer Strategien mit der Ausnutzung bekannter Strategien in Einklang zu bringen


Verstärkendes Lernen aus menschlichem Feedback-Untersucht Methoden zur Verbesserung des verstärkenden Lernens durch menschliche Eingaben


Imitationslernen-Konzentriert sich auf Techniken, bei denen Agenten lernen, indem sie die Aktionen menschlicher Experten nachahmen

Kundenbewertungen

Schlagwörter

Mehrarmiger Bandit, Bestärkendes Lernen, Markow-Entscheidungsprozess, Teilweise beobachtbarer Markow-Entscheidungsprozes, Zeitliches Differenzlernen, Bellman-Gleichung, Q-Lernen