Amazon iTunes Thalia.de Hugendubel Bücher.de ebook.de kobo Osiander Google Books Barnes&Noble bol.com Legimi yourbook.shop Kulturkaufhaus ebooks-center.de
* Affiliatelinks/Werbelinks

Bestärkendes Lernen

Name: Bestärkendes Lernen
Author: Fouad Sabry

Intelligente Entscheidungsfindung für autonome Maschinen meistern

Fouad Sabry

EPUB

ca. 4,99 €

Amazon iTunes Thalia.de Hugendubel Bücher.de ebook.de kobo Osiander Google Books Barnes&Noble bol.com Legimi yourbook.shop Kulturkaufhaus ebooks-center.de
* Affiliatelinks/Werbelinks

Eine Milliarde Sachkundig [German]

Naturwissenschaften, Medizin, Informatik, Technik / Technik

Beschreibung

Im sich rasch entwickelnden Bereich der Robotik gilt Reinforcement Learning als eine der vielversprechendsten Methoden zum Aufbau autonomer Systeme. Dieses Buch, Reinforcement Learning, bietet eine eingehende Untersuchung dieser leistungsstarken Technik und führt die Leser von ihren Grundprinzipien bis hin zu ihren neuesten Fortschritten. Dieses Buch ist perfekt für Fachleute, Doktoranden und Enthusiasten gleichermaßen und bietet einen detaillierten und dennoch zugänglichen Ansatz zum Verständnis von Reinforcement Learning im Kontext der Robotik

Reinforcement Learning-Stellt das Kernkonzept von Reinforcement Learning vor und betont seine Rolle in autonomen Systemen

Markov-Entscheidungsprozess-Erklärt den mathematischen Rahmen für Entscheidungsfindung unter Unsicherheit, eine wichtige Grundlage für Reinforcement Learning

Zeitdifferenzlernen-Erforscht Methoden zum Lernen aus Erfahrung ohne ein Modell der Umgebung zu benötigen

Bellman-Gleichung-Erörtert die kritische rekursive Beziehung, die vielen Reinforcement-Learning-Algorithmen zugrunde liegt

Qlearning-Konzentriert sich auf einen Off-Policy-Reinforcement-Learning-Algorithmus, der optimale Aktionen ohne ein Modell der Umgebung lernt

Mehrarmiger Bandit-Behandelt ein einfacheres Problem des bestärkenden Lernens, das Entscheidungsfindung in unsicheren Umgebungen modelliert

Teilweise beobachtbarer Markow-Entscheidungsprozess-Erweitert traditionelle Markow-Entscheidungsprozesse durch die Einbeziehung verborgener Zustände

Gittins-Index-Führt eine Strategie zum Ausgleich von Exploration und Ausbeutung bei Problemen mit mehrarmigen Banditen ein

Zustand–Aktion–Belohnung–Zustand–Aktion-Befasst sich mit den zeitlichen Mustern des bestärkenden Lernens, die Entscheidungsfindungsstrategien beeinflussen

Protowertfunktion-Erforscht Methoden zur Annäherung von Wertfunktionen, die die Effizienz des Lernens unterstützen

Automatische Basisfunktionskonstruktion-Konzentriert sich auf automatische Methoden zur Konstruktion von Merkmalen zur Verbesserung der Lerneffizienz

Meanfield-Spieltheorie-Bespricht ein Framework zur Modellierung von Interaktionen in groß angelegten Multiagentensystemen

Multiagenten-Pfadfindung-Führt Algorithmen zur Koordination mehrerer Agenten ein, damit diese ihre Ziele effizient erreichen

Modellfrei (Verstärkendes Lernen)-Bespricht Methoden, die beim Lernen nicht auf ein Modell der Umgebung angewiesen sind

Tiefes verstärkendes Lernen-Kombiniert tiefes Lernen und verstärkendes Lernen, um komplexe, hochdimensionale Umgebungen zu handhaben

Multiagenten-verstärkendes Lernen-Konzentriert sich auf Strategien zum Lernen in Umgebungen mit mehreren interagierenden Agenten

Selbstspiel-Erforscht das Konzept von Agenten, die durch Wettbewerb mit sich selbst lernen, eine entscheidende Komponente fortgeschrittener Lernstrategien

Proximale Richtlinienoptimierung-Führt einen Algorithmus zur Optimierung von Richtlinien beim verstärkenden Lernen mit verbesserter Stabilität und Leistung ein

Explorations-/Ausbeutungsdilemma-Bespricht die grundlegende Herausforderung, die Erforschung neuer Strategien mit der Ausnutzung bekannter Strategien in Einklang zu bringen

Verstärkendes Lernen aus menschlichem Feedback-Untersucht Methoden zur Verbesserung des verstärkenden Lernens durch menschliche Eingaben

Imitationslernen-Konzentriert sich auf Techniken, bei denen Agenten lernen, indem sie die Aktionen menschlicher Experten nachahmen

Weitere Titel von diesem Autor

示範程式設計

Fouad Sabry

4,99 €

모터 제어

Fouad Sabry

4,99 €

Schnelles Prototyping

Fouad Sabry

4,99 €

Programmieren durch Demonstration

Fouad Sabry

4,99 €

馬達控制

Fouad Sabry

4,99 €

快速原型製作

Fouad Sabry

4,99 €

奈米機器人

Fouad Sabry

4,99 €

Controllo motore

Fouad Sabry

4,99 €

Controle do motor

Fouad Sabry

4,99 €

Nanorobotik

Fouad Sabry

4,99 €

強化學習

Fouad Sabry

4,99 €

Motor Kontrolü

Fouad Sabry

4,99 €

パッシブダイナミクス

Fouad Sabry

4,99 €

Dinámica pasiva

Fouad Sabry

4,99 €

Microbótica

Fouad Sabry

4,99 €

Rapid Prototyping

Fouad Sabry

4,99 €

Nanorobotics

Fouad Sabry

4,99 €

Nanorobótica

Fouad Sabry

4,99 €

Reinforcement Learning

Fouad Sabry

4,99 €

モーター制御

Fouad Sabry

4,99 €

Prototipado rápido

Fouad Sabry

4,99 €

Passive Dynamik

Fouad Sabry

4,99 €

Motorsteuerung

Fouad Sabry

4,99 €

Passive Dynamics

Fouad Sabry

4,99 €

Dynamique passive

Fouad Sabry

4,99 €

Weitere Titel in dieser Kategorie

Bestärkendes Lernen

Fouad Sabry

4,99 €

Schnelles Prototyping

Fouad Sabry

4,99 €

Programmieren durch Demonstration

Fouad Sabry

4,99 €

Nanorobotik

Fouad Sabry

4,99 €

Passive Dynamik

Fouad Sabry

4,99 €

Motorsteuerung

Fouad Sabry

4,99 €

Mikrobotik

Fouad Sabry

4,99 €

KI Kafka: Das Flüstern der Maschinen

Stefan Wellmann

5,99 €

Adaptive Steuerung

Fouad Sabry

4,99 €

Roboterlernen

Fouad Sabry

4,99 €

Computer Vision

Fouad Sabry

4,99 €

Digitale Steuerung

Fouad Sabry

4,99 €

Laborrobotik

Fouad Sabry

4,99 €

Selbstfahrendes Auto

Fouad Sabry

4,99 €

Autonomer Forschungsroboter

Fouad Sabry

4,99 €

Bayesianisches Netzwerk

Fouad Sabry

4,99 €

Direkte Manipulationsschnittstelle

Fouad Sabry

4,99 €

Künstliche Intelligenz

Fouad Sabry

4,99 €

Künstliches neuronales Netzwerk

Fouad Sabry

4,99 €

Android-Wissenschaft

Fouad Sabry

4,99 €

Bionik

Fouad Sabry

4,99 €

Robotik

Fouad Sabry

4,99 €

Elektronische Stabilitätskontrolle

Fouad Sabry

4,99 €

Dimensionsreduzierung

Fouad Sabry

4,99 €

Industrielle Bildverarbeitung

Fouad Sabry

4,99 €

Schlagwörter

Mehrarmiger Bandit, Bestärkendes Lernen, Markow-Entscheidungsprozess, Teilweise beobachtbarer Markow-Entscheidungsprozes, Zeitliches Differenzlernen, Bellman-Gleichung, Q-Lernen

Bestärkendes Lernen

Fouad Sabry

Naturwissenschaften, Medizin, Informatik, Technik / Technik

Beschreibung

Kundenbewertungen