Amazon iTunes Thalia.de Hugendubel Bücher.de ebook.de kobo Osiander Google Books Barnes&Noble bol.com Legimi yourbook.shop Kulturkaufhaus ebooks-center.de
* Affiliatelinks/Werbelinks

Apprentissage par renforcement

Name: Apprentissage par renforcement
Author: Fouad Sabry

Maîtriser la prise de décision intelligente pour les machines autonomes

Fouad Sabry

EPUB

ca. 4,99 €

Amazon iTunes Thalia.de Hugendubel Bücher.de ebook.de kobo Osiander Google Books Barnes&Noble bol.com Legimi yourbook.shop Kulturkaufhaus ebooks-center.de
* Affiliatelinks/Werbelinks

Un Milliard De Personnes Informées [French]

Naturwissenschaften, Medizin, Informatik, Technik / Technik

Beschreibung

Dans le domaine en évolution rapide de la robotique, l'apprentissage par renforcement est l'une des méthodes les plus prometteuses pour construire des systèmes autonomes. Ce livre, Reinforcement Learning, propose une exploration approfondie de cette technique puissante, guidant les lecteurs à travers ses principes fondamentaux jusqu'à ses dernières avancées. Parfait pour les professionnels, les étudiants diplômés et les passionnés, ce livre offre une approche détaillée mais accessible pour comprendre l'apprentissage par renforcement dans le contexte de la robotique

Apprentissage par renforcement-présente le concept de base de l'apprentissage par renforcement, en soulignant son rôle dans les systèmes autonomes

Processus de décision de Markov-explique le cadre mathématique de la prise de décision dans l'incertitude, un fondement essentiel de l'apprentissage par renforcement

Apprentissage par différence temporelle-explore les méthodes d'apprentissage par l'expérience sans avoir besoin d'un modèle de l'environnement

Équation de Bellman-discute de la relation récursive critique qui sous-tend de nombreux algorithmes d'apprentissage par renforcement

Qlearning-se concentre sur un algorithme d'apprentissage par renforcement hors politique qui apprend des actions optimales sans modèle d'environnement

Bandit multi-bras-couvre un problème d'apprentissage par renforcement plus simple qui modélise la prise de décision dans des environnements incertains

Processus de décision de Markov partiellement observable-développe les processus de décision de Markov traditionnels en incorporant des états cachés

Indice de Gittins-présente une stratégie pour équilibrer l'exploration et l'exploitation dans les problèmes de bandit multi-bras

État–action–récompense–état–action-explore les modèles temporels de l'apprentissage par renforcement qui éclairent les stratégies de prise de décision

Fonction proto-valeur-explore les méthodes d'approximation des fonctions de valeur, contribuant à l'efficacité de l'apprentissage

Construction automatique de fonctions de base-se concentre sur les méthodes automatiques de construction de fonctionnalités pour améliorer l'efficacité de l'apprentissage

Théorie des jeux Meanfield-discute d'un cadre de modélisation des interactions dans les systèmes multi-agents à grande échelle

Recherche de chemin multi-agents-présente des algorithmes permettant de coordonner plusieurs agents pour atteindre efficacement leurs destinations

Sans modèle (apprentissage par renforcement)-présente des méthodes qui ne reposent pas sur un modèle de l'environnement pour l'apprentissage

Apprentissage par renforcement profond-combine l'apprentissage profond et l'apprentissage par renforcement pour gérer des environnements complexes et à haute dimension

Apprentissage par renforcement multi-agents-se concentre sur les stratégies d'apprentissage dans des environnements avec plusieurs agents en interaction

Jeu en soi-explore le concept d'agents apprenant par compétition avec eux-mêmes, un élément essentiel des stratégies d'apprentissage avancées

Optimisation de la politique proximale-présente un algorithme permettant d'optimiser les politiques dans l'apprentissage par renforcement avec une stabilité et des performances améliorées

Dilemme exploration-exploitation-discute du défi fondamental consistant à équilibrer l'exploration de nouvelles stratégies avec l'exploitation de stratégies connues

Apprentissage par renforcement à partir de commentaires humains-examine les méthodes permettant d'améliorer l'apprentissage par renforcement à l'aide de l'apport humain

Apprentissage par imitation-se concentre sur les techniques où les agents apprennent en imitant les actions d'experts humains

Weitere Titel von diesem Autor

Bina Otomasyonu

Fouad Sabry

4,99 €

Tecnologia assistiva

Fouad Sabry

4,99 €

Automazione degli edifici

Fouad Sabry

4,99 €

Ambient Intelligence

Fouad Sabry

4,99 €

Telepresenza

Fouad Sabry

4,99 €

Umgebungsintelligenz

Fouad Sabry

4,99 €

遠端呈現

Fouad Sabry

4,99 €

빌딩 자동화

Fouad Sabry

4,99 €

보조 기술

Fouad Sabry

4,99 €

주변 지능

Fouad Sabry

4,99 €

環境智能

Fouad Sabry

4,99 €

Intelligenza ambientale

Fouad Sabry

4,99 €

Uzaktan varlık

Fouad Sabry

4,99 €

Her Yerde Bilgisayar Kullanımı

Fouad Sabry

4,99 €

アンビエントインテリジェンス

Fouad Sabry

4,99 €

무선 센서 네트워크

Fouad Sabry

4,99 €

Yardımcı Teknoloji

Fouad Sabry

4,99 €

Inteligência Ambiental

Fouad Sabry

4,99 €

Çevresel Zeka

Fouad Sabry

4,99 €

Assistierende Technologie

Fouad Sabry

4,99 €

유비쿼터스 컴퓨팅

Fouad Sabry

4,99 €

유비쿼터스 로봇

Fouad Sabry

4,99 €

Kablosuz Sensör Ağı

Fouad Sabry

4,99 €

원격 존재

Fouad Sabry

4,99 €

Rete di sensori wireless

Fouad Sabry

4,99 €

Weitere Titel in dieser Kategorie

L'ethique et le genie quebecois

Mekhael Thomas Mekhael

36,07 €

Intelligence ambiante

Fouad Sabry

4,99 €

Téléprésence

Fouad Sabry

4,99 €

Capteur

Fouad Sabry

4,99 €

Technologie d'assistance

Fouad Sabry

4,99 €

Réseau de capteurs sans fil

Fouad Sabry

4,99 €

Dynamique passive

Fouad Sabry

4,99 €

Nanorobotique

Fouad Sabry

4,99 €

Programmation par démonstration

Fouad Sabry

4,99 €

Contrôle moteur

Fouad Sabry

4,99 €

Apprentissage par renforcement

Fouad Sabry

4,99 €

Prototypage rapide

Fouad Sabry

4,99 €

Microbotique

Fouad Sabry

4,99 €

Contrôle adaptatif

Fouad Sabry

4,99 €

Traitement d'images numériques

Fouad Sabry

4,99 €

Intelligence artificielle

Fouad Sabry

4,99 €

Contrôle numérique

Fouad Sabry

4,99 €

Réseau bayésien

Fouad Sabry

4,99 €

Contrôle électronique de stabilité

Fouad Sabry

4,99 €

Interface de manipulation directe

Fouad Sabry

4,99 €

Voiture autonome

Fouad Sabry

4,99 €

Robotique de laboratoire

Fouad Sabry

4,99 €

Bionique

Fouad Sabry

4,99 €

Réduction de la dimensionnalité

Fouad Sabry

4,99 €

Apprentissage robotique

Fouad Sabry

4,99 €

Schlagwörter

Bandit à plusieurs bras, Équation de Bellman, Processus de décision de Markov partiellement obse, Apprentissage des différences temporelles, Apprentissage Q, Processus de décision de Markov, Apprentissage par renforcement

Apprentissage par renforcement

Fouad Sabry

Naturwissenschaften, Medizin, Informatik, Technik / Technik

Beschreibung

Kundenbewertungen