Types

Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...
Guide pratique pour choisir

des algorithmes pour Azure
Machine Learning Studio
04/03/2019 • 32 minutes de lecture • Contributeurs
Dans cet article
Aide-mémoire d’algorithme Machine Learning
Types d'apprentissage automatique
Considérations lors du choix d'un algorithme
Notes de l'algorithme
Étapes suivantes
La réponse à la question « Quel algorithme d’apprentissage automatique

dois-je utiliser ? » est toujours « Cela dépend. ». Cela dépend de la taille, de la
qualité et de la nature des données. Cela dépend de ce que vous voulez faire
avec la réponse. Cela dépend de la conversion des calculs de l'algorithme en
instructions pour l'ordinateur que vous utilisez. Et cela dépend du temps que
vous avez. Même les scientifiques de données les plus expérimentés ne
peuvent pas savoir quel algorithme fonctionnera le mieux avant d’en essayer.
Machine Learning Studio fournit des algorithmes de pointe tels que les arbres
de décision optimisés évolutifs, les systèmes de recommandation bayésiens,
les réseaux neuronaux profonds et les jungles de décision développés chez
Microsoft Research. Des modules d’apprentissage automatique open source
évolutifs tels que Vowpal Wabbit sont également inclus. Machine
Learning Studio prend en charge les algorithmes d’apprentissage
automatique pour la classification, la régression et le clustering multiclasses et
binaires. Consultez la liste complète des Modules de Machine Learning. La
documentation fournit des informations sur chaque algorithme et sur la
manière de régler les paramètres afin d’optimiser votre utilisation de
l’algorithme choisi.
1 sur 22 26/03/2019 à 16:53

Aide-mémoire d’algorithme
Machine Learning
Le Microsoft Azure Machine Learning Studio aide-mémoire d’algorithme
vous permet de choisir le droit de l’ordinateur algorithme d’apprentissage
pour vos solutions d’analytique prédictive à partir d’Azure Machine Learning
Bibliothèque d’algorithmes de Studio. Cet article vous guide tout au long de
l’utilisation de cet aide-mémoire.
７ Notes
Pour télécharger l’aide-mémoire et suivre cet article, accédez à Aide-

mémoire d'algorithme Machine Learning pour Microsoft
Azure Machine Learning Studio.
Cet aide-mémoire est pensé pour un public très spécifique : un scientifique

des données débutant, avec une formation de premier cycle en apprentissage
automatique, qui tente de choisir un algorithme pour prendre en main
Azure Machine Learning Studio. Cela signifie qu’il comprend certaines
généralisations et simplifie trop, mais vous guide en toute sécurité. Cela
signifie également qu'il existe un grand nombre d'algorithmes non répertoriés
ici.
Ces recommandations sont des commentaires et des conseils compilés d’un

grand nombre de scientifiques de données et d’experts en apprentissage
automatique. Nous n’avez pas accepté sur tous les éléments, mais nous avons
essayé d’harmoniser les avis en un consensus. Notre désaccord est
généralement introduit par « Cela dépend... »
Utilisation de l’aide-mémoire
Lisez les chemins et les étiquettes d’algorithme sur l’aide-mémoire comme

« Pour <étiquette de chemin> utilisez <algorithm> ». Par exemple, « Pour
Vitesse, utilisez la régression logistique à deux classes ». Parfois, plusieurs
branches sont utiles. Parfois, aucune n’est parfaite. Ce sont des
recommandations générales, donc ne vous inquiétez pas de leur exactitude.
2 sur 22 26/03/2019 à 16:53

Plusieurs scientifiques de données que nous avons avec lesdites que la seule
façon de trouver le meilleur algorithme consiste à tous les essayer.
Voici un exemple tiré de Azure AI Gallery. Cette expérience teste plusieurs

algorithmes sur les mêmes données et compare les résultats : Compare Multi-
class Classifiers: Letter recognition (Comparer des classifieurs multiclasses :
reconnaissance de lettres).
 Conseil
Pour télécharger une vue d'ensemble infographique présentant de

manière simple les concepts de base du Machine Learning afin de vous
familiariser avec les algorithmes populaires utilisés pour répondre aux
questions les plus courantes concernant le Machine Learning, consultez
Principes de base du Machine Learning avec exemples d'algorithmes.
Types d'apprentissage automatique
Supervisé
Les algorithmes d'apprentissage supervisés font des prédictions basées sur un

ensemble d'exemples. Par exemple, historiques des cours peuvent être utilisés
pour faire des estimations sur les prix futurs. Chaque exemple utilisé pour
l'apprentissage est étiqueté avec la valeur d'intérêt : dans ce cas, le prix des
actions. Un algorithme d'apprentissage supervisé recherche des modèles dans
ces étiquettes de valeur. Il peut utiliser toutes les informations qui peuvent
être pertinentes (le jour de la semaine, la saison, les données financières de
l’entreprise, le type de secteur, l’existence d’événements géopolitiques
perturbateurs), et chaque algorithme recherche différents types de modèles.
Une fois que l'algorithme a trouvé le meilleur modèle possible, il l’utilise pour
élaborer des prédictions pour les données de test sans étiquette : les prix
futurs.
Il s’agit d’un type d’apprentissage automatique utile et apprécié. À une

exception près, tous les modules d’Azure Machine Learning Studio sont
supervisés. Plusieurs types spécifiques d'apprentissage supervisé sont
3 sur 22 26/03/2019 à 16:53

représentés dans Azure Machine Learning Studio : la classification, la

régression et la détection d’anomalies.
Classification. Lorsque les données sont utilisées pour prédire une

catégorie, l’apprentissage supervisé est également appelé classification.
C'est le cas lors de l'affectation d'une image en tant que photo d'un
« chat » ou d’un « chien ». Quand il n’y a que deux choix, on appelle cela
la classification à deux classes ou binomiale. Lorsqu'il existe plusieurs
catégories, comme lors de la prévision du gagnant du
championnat NCAA, ce problème est connu sous le nom de
classification à classes multiples.
Régression. Lorsque l’on prédit une valeur, comme le cours de la Bourse,
l’apprentissage surveillé est appelé régression.
Détection des anomalies. Parfois, l'objectif est d'identifier les points de
données qui sont simplement inhabituels. Dans le cas de la détection
des fraudes par exemple, toute dépense très étrange par carte de crédit
est suspecte. Les variations possibles sont si nombreuses et les exemples
de formation si rares, qu'il n'est pas possible de savoir à quoi ressemble
une activité frauduleuse. L’approche de détection des anomalies consiste
à simplement en savoir quelle activité normale ressemble (à l’aide de
l’historique des transactions non-frauduleuses) et identifier tout ce qui
est très différent.
Non supervisé
Dans l’apprentissage non supervisé, les points de données n’ont aucune

étiquette associée. En effet, l’objectif d’un algorithme d’apprentissage non
supervisé est d’organiser les données d’une certaine façon ou de décrire sa
structure. Cela peut signifier un regroupement en clusters ou la recherche de
différentes manières de visualisation des données complexes afin d’en
simplifier l’affichage ou de l’organiser plus efficacement.
Apprentissage par renforcement
Dans l’apprentissage par renforcement, l’algorithme choisit une action en

réponse à chaque point de données. L’algorithme d’apprentissage reçoit
également un signal de récompense quelques instants plus tard, qui indique
4 sur 22 26/03/2019 à 16:53

la qualité de la décision. En fonction de ce signal, l’algorithme modifie sa

stratégie pour atteindre la récompense la plus élevée. Il n'existe actuellement
aucun module d'apprentissage de renforcement dans
Azure Machine Learning Studio. L’apprentissage par renforcement est une
approche courante en robotique, où le jeu des lectures des capteurs à un
moment donné est un point de données et où l’algorithme doit choisir l’action
suivante du robot. Il est également adapté aux applications
d’Internet des objets.
Considérations lors du choix d'un

algorithme
Précision
L’obtention de la réponse la plus précise possible n'est pas toujours

nécessaire. Parfois, en fonction de votre utilisation, une approximation suffit.
Si tel est le cas, vous pourrez peut-être réduire le temps de traitement
considérablement en utilisant des méthodes plus approximatives. Un autre
avantage des méthodes plus approximatives est qu’ils ont naturellement
tendance à éviter le surajustement.
Durée d’apprentissage
Le nombre de minutes ou d'heures nécessaires pour l'apprentissage d'un

modèle varie beaucoup selon les algorithmes. La durée d’apprentissage est
souvent étroitement liée à la précision : l’une accompagne généralement
l'autre. En outre, certains algorithmes sont plus sensibles au nombre de points
de données que d'autres. Un temps limité peut guider le choix de
l'algorithme, en particulier lorsque le jeu de données est vaste.
Linéarité
Un grand nombre d'algorithmes d'apprentissage automatique utilisent la

linéarité. Les algorithmes de classification linéaire supposent que les classes
peuvent être séparées par une ligne droite (ou son analogie de dimension
supérieure). Ceux-ci incluent la régression logistique et les machines à
5 sur 22 26/03/2019 à 16:53

vecteurs de support (comme implémentées dans Azure Machine Learning

Studio). Les algorithmes de régression linéaire supposent que les tendances
des données suivent une ligne droite. Ces hypothèses ne sont pas erronées
pour certains problèmes, mais réduisent la précision pour d’autres.
Limite de classe non linéaire : utiliser un algorithme de classification linéaire

entraînerait une faible précision
Données avec une tendance non linéaire : une méthode de régression

linéaire entraînerait plus d’erreurs
Malgré leurs limitations, les algorithmes linéaires sont très populaires comme
première ligne d'attaque. Ils ont tendance à être des algorithmes simples et à
6 sur 22 26/03/2019 à 16:53

apprentissage rapide.
Nombre de paramètres
Les paramètres sont les boutons que les scientifiques des données règlent
lorsqu’ils configurent un algorithme. Ce sont des nombres qui affectent le
comportement de l'algorithme, comme la tolérance aux erreurs ou le nombre
d'itérations ou les variantes du comportement de l'algorithme. La durée
d’apprentissage et la précision de l'algorithme peuvent parfois dépendre
grandement du choix de paramètres appropriés. En règle générale, les
algorithmes avec un grand nombre de paramètres requièrent le plus d’essais
pour trouver la bonne combinaison.
Il existe également un bloc module de balayage de paramètre dans

Azure Machine Learning Studio qui essaie automatiquement toutes les
combinaisons de paramètres à la granularité que vous choisissez. Même si
c'est un excellent moyen de vous assurer que vous avez examiné l'espace de
paramétrage, le temps nécessaire pour former un modèle augmente de façon
exponentielle avec le nombre de paramètres.
Avoir de nombreux paramètres indique généralement qu'un algorithme a une

plus grande flexibilité. Il peut souvent obtenir une excellente précision, autant
vous pouvez trouver la bonne combinaison de valeurs de paramètre.
Nombre de fonctionnalités
Pour certains types de données, le nombre de fonctionnalités peut être très

important par rapport au nombre de points de données. C'est souvent le cas
avec les données génétiques ou textuelles. Le grand nombre de
fonctionnalités risque de ralentir certains algorithmes d'apprentissage et
atteindre une durée d’apprentissage inutilisable. Les machines à vecteurs de
support sont particulièrement bien adaptées à ce cas (voir ci-dessous).
Cas particuliers
Certains algorithmes d'apprentissage effectuent des hypothèses particulières

sur la structure des données ou les résultats souhaités. Si vous pouvez en
trouver un qui répond à vos besoins, il peut vous donner des résultats plus
7 sur 22 26/03/2019 à 16:53

pertinents, des prévisions plus précises ou des durées d'apprentissage plus

courtes.
Durée
Algorithme Précision d’apprentissage Linéarité Paramètres Remarques
Classification
double
classe.
régression ● ● 5.
logique
forêt de ● ○ 6.
décision
jungle de ● ○ 6. Faible
décision encombrement
de mémoire
arbre de ● ○ 6. Encombrement
décision de mémoire
optimisé important
réseau ● 9 Personnalisation
neuronal supplémentaire
possible
perceptron ○ ○ ● 4
moyenné
machines à ○ ● 5. Idéal pour les

vecteurs de ensembles de
support fonctionnalités
de grande taille
Machine à ○ 8 Idéal pour les

vecteurs de ensembles de
support fonctionnalités
localement de grande taille
profonde
8 sur 22 26/03/2019 à 16:53

Durée
Machine de ○ ● 3
point de
Bayes
Classification
multiclasse.
régression ● ● 5.
logique
décision
jungle de ● ○ 6. Faible
décision encombrement
de mémoire
possible
un contre - - - - Consultez les

tous propriétés de la
méthode à deux
classes
sélectionnée
Régression
linéaire ● ● 4
linéaire ○ ● 2
bayésienne
décision
arbre de ● ○ 5. Encombrement
9 sur 22 26/03/2019 à 16:53

Durée
décision de mémoire
optimisé important
quantile de ● ○ 9 Distributions
forêt rapide plutôt que
prédictions de
points
possible
Poisson ● 5. Techniquement
journal linéaire.
Pour les
décomptes
prévisionnels
ordinal 0 Pour la
prédiction de
rang
Détection
des
anomalies
machines à ○ ○ 2 Particulièrement
vecteurs de adapté aux
support ensembles de
caractéristiques
de grande taille
Détection ○ ● 3
des
anomalies
reposant sur
le PCA
10 sur 22 26/03/2019 à 16:53

Durée
K-moyennes ○ ● 4 Un algorithme
de clustering
Propriétés de l'algorithme :
● : excellente précision, durée d'apprentissage courte et utilisation de la

linéarité
○ : bonne précision et durée d’apprentissage modérée
Notes de l'algorithme
Régression linéaire
Comme mentionné précédemment, la régression linéaire fait correspondre

une ligne (ou plan ou hyperplan) au jeu de données. Elle est très efficace,
simple et rapide, mais peut être trop simpliste pour certains problèmes.
11 sur 22 26/03/2019 à 16:53

Données avec une tendance linéaire
Régression logique
Bien qu’il inclue « régression » dans le nom, la régression logistique est en fait
un outil puissant pour deux classes et multiclass classification. Elle est rapide
et simple. Le fait qu'elle utilise une courbe en forme de S, et non une ligne
droite, en fait une solution de choix pour diviser les données en groupes. La
régression logique crée des limites de classes linéaires : vérifiez donc qu'une
approximation linéaire vous convient.
12 sur 22 26/03/2019 à 16:53

Une régression logique pour les données à deux classes avec une seule
caractéristique : la limite de classe est le point auquel la courbe logistique est
aussi proche des deux classes
Arbres, forêts et jungles
Les forêts de décision (régression, deux classes et classes multiples), les

jungles de décision (deux classes et classes multiples) et les arbres de décision
renforcés (régression et deux classes) sont tous basés sur les arbres de
décision, un concept fondamental pour l’apprentissage automatique. Il existe
de nombreuses variantes d'arbres de décision, mais tous font la même chose :
subdiviser l'espace de la fonctionnalité en régions avec la même étiquette. Il
peut s'agir des régions de catégorie ou de valeur constante, si vous effectuez
une classification ou une régression.
13 sur 22 26/03/2019 à 16:53

Un arbre de décision divise un espace de caractéristique en régions de

valeurs à peu près uniformes
Étant donné qu’un espace de fonctionnalité peut être subdivisé en petites

régions de taille arbitraire, il est facile de concevoir que la division atteigne un
14 sur 22 26/03/2019 à 16:53

point de données par région. Il s’agit d’un exemple extrême de dépassement.

Pour éviter ce problème, un grand ensemble d’arbres sont construits avec un
soin mathématique pour garantir les arborescences ne sont pas corrélées. La
moyenne de cette « forêt de décision » est un arbre qui permet d'éviter un
surajustement. Les forêts de décision peuvent utiliser beaucoup de mémoire.
Les jungles de décision sont une variante qui consomme moins de mémoire,
mais avec une durée d’apprentissage légèrement plus longue.
Les arbres de décision améliorée évitent le surajustement en limitant le

nombre de subdivisions et le nombre minimum de points de données
autorisés dans chaque région. L'algorithme construit une séquence d'arbres,
chacun d'entre eux apprenant à compenser l'erreur de l'arbre précédent. Cela
fournit un apprenant très précis qui a tendance à utiliser beaucoup de
mémoire. Pour une description complète, consultez le livre d'origine de
Friedman.
La régression quantile de forêt rapide est une variante d'arbres de décision

pour les cas où vous souhaitez savoir non seulement la valeur standard
(médiane) des données au sein d'une région, mais également sa distribution
sous la forme de quantiles.
Perceptrons et réseaux neuronaux
Les réseaux neuronaux sont des algorithmes d’apprentissage inspirés du

cerveau couvrant les problèmes de classes multiples, à deux classes et de
régression. Il existe de nombreux réseaux neuronaux d’apprentissage, mais
ceux d’Azure Machine Learning Studio sont tous des graphiques acycliques
dirigés. Cela signifie que les fonctionnalités d'entrée sont transmises vers
l'avant (jamais vers l'arrière) via une séquence de couches, avant d'être
transformées en sorties. Dans chaque couche, les entrées sont pondérées
dans diverses combinaisons, additionnées et transmises à la couche suivante.
Cette combinaison de calculs simples permet d'apprendre les tendances de
données et les limites de classe sophistiquées, en toute simplicité. Les réseaux
à plusieurs couches de ce type effectuent « l’apprentissage approfondi » qui
alimente tant d’articles technologiques et de science-fiction.
Ces performances élevées ont toutefois un prix. L’apprentissage des réseaux

neuronaux peut prendre beaucoup de temps, en particulier pour les grands
15 sur 22 26/03/2019 à 16:53

jeux de données avec un grand nombre de fonctionnalités. Ils ont également

plus de paramètres que la plupart des algorithmes, ce qui signifie que le
balayage de paramètres allonge grandement la durée d’apprentissage. Et
pour les perfectionnistes qui souhaitent spécifier leur propre structure de
réseau, les possibilités sont infinies.
16 sur 22 26/03/2019 à 16:53

Les limites apprises par les réseaux neuronaux peuvent être complexes et
irrégulières
Le perceptron moyenné à deux classes est le réseau neuronal idéal pour

répondre à l’explosion des durées d'apprentissage. Il utilise une structure de
réseau qui fournit des limites de la classe linéaire. Il est presque primitif au vu
des normes actuelles, mais il a un long historique d'utilisation fiable et est
suffisamment petit pour apprendre rapidement.
Machines à vecteurs de support (SVM)
Les machines à vecteurs de support (SVM) recherchent la limite qui sépare les

classes par une marge aussi grande que possible. Lorsque les deux classes ne
peuvent pas être clairement séparées, les algorithmes trouvent la meilleure
limite possible. Comme écrites dans Azure Machine Learning Studio, le SVM à
deux classes avec uniquement une ligne droite (dans le jargon SVM, elle utilise
un noyau linéaire). Étant donné qu’elle utilise cette approximation linéaire, elle
est capable de s'exécuter assez rapidement. Elle est particulièrement est avec
des données qui consomment beaucoup de fonctionnalités, telles que le texte
ou des données. Dans ces cas, les SVM sont en mesure de séparer les classes
plus rapidement et avec moins de surajustement que la plupart des autres
algorithmes, tout en utilisant une petite quantité de mémoire.
17 sur 22 26/03/2019 à 16:53

Une frontière de classe de machine à vecteurs de support standard optimise

la marge séparant deux classes
Un autre produit de Microsoft Research, la SVM localement approfondi

à deux classes est une variante non linéaire de SVM qui conserve la plupart de
l'efficacité de la mémoire et de la vitesse de la version linéaire. Elle est idéale
pour les cas où l'approche linéaire ne donne pas de réponses suffisamment
précises. Les développeurs conservé sa rapidité en décomposant le problème
en un nombre de petits problèmes SVM linéaires. Lisez la description
complète pour plus d'informations sur la méthode utilisée.
À l'aide d'une extension intelligente de SVM non linéaires, la SVM à une classe

dessine une limite qui encadre étroitement l'ensemble de données. Elle est
utile pour la détection des anomalies. Les nouveaux points de données qui se
situent bien à l'extérieur de cette limite sont assez inhabituels pour être
remarqués.
Méthodes bayésiennes
Les méthodes bayésiennes ont une qualité très intéressante : elles évitent le
18 sur 22 26/03/2019 à 16:53

surajustement. Pour cela, elles émettent quelques hypothèses préalables sur la

distribution probable de la réponse. Un autre avantage de cette approche est
qu'elle a très peu de paramètres. Azure Machine Learning Studio comporte
des algorithmes bayésiens pour la classification (machine de point Two-class
Bayes) et de régression (régression linéaire bayésienne). Notez qu’ils
supposent que les données peuvent être fractionnées ou ajustées avec une
ligne droite.
Anecdote historique, les machines de point de Bayes ont été développées par
Microsoft Research. Elles reposent sur un travail théorique exceptionnel. Pour
plus d’informations, consultez l’article d’origine dans JMLR et le blog de Chris
Bishop.
Algorithmes spécialisés
Avoir un objectif très spécifique peut être bénéfique. La collection Azure

Machine Learning Studio comprend des algorithmes spécialisés dans les
domaines suivants :
Prédiction de classement (régression ordinale)

Prédiction de nombres (régression Poisson)
Détection des anomalies (un basé sur l’analyse des principaux
composants et un autre basé sur les machines à vecteurs de support)
Clustering (K-moyennes)
19 sur 22 26/03/2019 à 16:53

Détection des anomalies reposant sur le PCA : la grande majorité des

données correspond à une distribution typique ; les points déviant
considérablement de cette distribution sont suspects
20 sur 22 26/03/2019 à 16:53

Un jeu de données est regroupé dans cinq clusters à l’aide de K-moyennes.
Il existe également un ensemble de classifieur à classes multiples one-v-all,

qui subdivise le problème de classification de classe N en problèmes de
classification à deux classes N-1. La précision, la durée d’apprentissage et les
propriétés de linéarité sont déterminées par les classifieurs à deux classes
utilisés.
Deux classifieurs à deux classes combinés pour former un classifieur à trois
21 sur 22 26/03/2019 à 16:53

classes
Azure Machine Learning Studio inclut également l'accès à une puissante

infrastructure d'apprentissage automatique appelée Vowpal Wabbit. VW défie
la catégorisation ici, puisqu'elle peut apprendre des problèmes de
classification et de régression et même utiliser des données partiellement sans
étiquette. Vous pouvez la configurer pour utiliser l'un des nombreux
algorithmes d’apprentissage, les fonctions de perte et les algorithmes
d'optimisation. Elle a été conçue dès le départ pour être efficace, parallèle et
extrêmement rapide. Elle gère d’immenses ensembles de fonctionnalités avec
peu d'effort. Lancée et dirigée par John Langford de Microsoft Research, VW
est une Formule 1 dans la course des algorithmes. VW ne convient pas à tous
les problèmes, mais si c’est le cas pour le vôtre, il est avantageux de l’utiliser.
Elle est également disponible en tant que code open source autonome dans
plusieurs langues.
Étapes suivantes
Pour télécharger une vue d'ensemble infographique présentant de
manière simple les concepts de base du Machine Learning afin de vous
familiariser avec les algorithmes populaires utilisés pour répondre aux
questions les plus courantes concernant le Machine Learning, consultez
Principes de base du Machine Learning avec exemples d'algorithmes.
Pour obtenir la liste par catégorie de tous les algorithmes

d’apprentissage automatique disponibles dans Machine Learning Studio,
consultez Initialiser le modèle dans Machine Learning Studio : aide sur
les algorithmes et les modules.
Pour obtenir la liste alphabétique complète des algorithmes et des

modules de Machine Learning Studio, consultez Liste alphabétique des
modules de Machine Learning Studio dans Machine Learning Studio :
aide sur les algorithmes et les modules.
22 sur 22 26/03/2019 à 16:53

Types

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Types

Enviado por

Direitos autorais:

Formatos disponíveis

Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Guide pratique pour choisir

La réponse à la question « Quel algorithme d’apprentissage automatique

1 sur 22 26/03/2019 à 16:53

Pour télécharger l’aide-mémoire et suivre cet article, accédez à Aide-

Cet aide-mémoire est pensé pour un public très spécifique : un scientifique

Ces recommandations sont des commentaires et des conseils compilés d’un

Lisez les chemins et les étiquettes d’algorithme sur l’aide-mémoire comme

2 sur 22 26/03/2019 à 16:53

Voici un exemple tiré de Azure AI Gallery. Cette expérience teste plusieurs

Pour télécharger une vue d'ensemble infographique présentant de

Types d'apprentissage automatique

Les algorithmes d'apprentissage supervisés font des prédictions basées sur un

Il s’agit d’un type d’apprentissage automatique utile et apprécié. À une

3 sur 22 26/03/2019 à 16:53

représentés dans Azure Machine Learning Studio : la classification, la

Classification. Lorsque les données sont utilisées pour prédire une

Dans l’apprentissage non supervisé, les points de données n’ont aucune

Apprentissage par renforcement

Dans l’apprentissage par renforcement, l’algorithme choisit une action en

4 sur 22 26/03/2019 à 16:53

la qualité de la décision. En fonction de ce signal, l’algorithme modifie sa

Considérations lors du choix d'un

L’obtention de la réponse la plus précise possible n'est pas toujours

Le nombre de minutes ou d'heures nécessaires pour l'apprentissage d'un

Un grand nombre d'algorithmes d'apprentissage automatique utilisent la

5 sur 22 26/03/2019 à 16:53

vecteurs de support (comme implémentées dans Azure Machine Learning

Limite de classe non linéaire : utiliser un algorithme de classification linéaire

Données avec une tendance non linéaire : une méthode de régression

6 sur 22 26/03/2019 à 16:53

Il existe également un bloc module de balayage de paramètre dans

Avoir de nombreux paramètres indique généralement qu'un algorithme a une

Pour certains types de données, le nombre de fonctionnalités peut être très

Certains algorithmes d'apprentissage effectuent des hypothèses particulières

7 sur 22 26/03/2019 à 16:53

pertinents, des prévisions plus précises ou des durées d'apprentissage plus

machines à ○ ● 5. Idéal pour les

Machine à ○ 8 Idéal pour les

8 sur 22 26/03/2019 à 16:53

un contre - - - - Consultez les

9 sur 22 26/03/2019 à 16:53

10 sur 22 26/03/2019 à 16:53

● : excellente précision, durée d'apprentissage courte et utilisation de la

○ : bonne précision et durée d’apprentissage modérée

Comme mentionné précédemment, la régression linéaire fait correspondre

11 sur 22 26/03/2019 à 16:53

Données avec une tendance linéaire

12 sur 22 26/03/2019 à 16:53

Arbres, forêts et jungles

Les forêts de décision (régression, deux classes et classes multiples), les

13 sur 22 26/03/2019 à 16:53

Un arbre de décision divise un espace de caractéristique en régions de

Étant donné qu’un espace de fonctionnalité peut être subdivisé en petites

14 sur 22 26/03/2019 à 16:53

point de données par région. Il s’agit d’un exemple extrême de dépassement.

Les arbres de décision améliorée évitent le surajustement en limitant le

La régression quantile de forêt rapide est une variante d'arbres de décision

Perceptrons et réseaux neuronaux

Les réseaux neuronaux sont des algorithmes d’apprentissage inspirés du

Ces performances élevées ont toutefois un prix. L’apprentissage des réseaux

15 sur 22 26/03/2019 à 16:53

jeux de données avec un grand nombre de fonctionnalités. Ils ont également

16 sur 22 26/03/2019 à 16:53