Escolar Documentos
Profissional Documentos
Cultura Documentos
Machine Learning Studio fournit des algorithmes de pointe tels que les arbres
de décision optimisés évolutifs, les systèmes de recommandation bayésiens,
les réseaux neuronaux profonds et les jungles de décision développés chez
Microsoft Research. Des modules d’apprentissage automatique open source
évolutifs tels que Vowpal Wabbit sont également inclus. Machine
Learning Studio prend en charge les algorithmes d’apprentissage
automatique pour la classification, la régression et le clustering multiclasses et
binaires. Consultez la liste complète des Modules de Machine Learning. La
documentation fournit des informations sur chaque algorithme et sur la
manière de régler les paramètres afin d’optimiser votre utilisation de
l’algorithme choisi.
Aide-mémoire d’algorithme
Machine Learning
Le Microsoft Azure Machine Learning Studio aide-mémoire d’algorithme
vous permet de choisir le droit de l’ordinateur algorithme d’apprentissage
pour vos solutions d’analytique prédictive à partir d’Azure Machine Learning
Bibliothèque d’algorithmes de Studio. Cet article vous guide tout au long de
l’utilisation de cet aide-mémoire.
7 Notes
Utilisation de l’aide-mémoire
Plusieurs scientifiques de données que nous avons avec lesdites que la seule
façon de trouver le meilleur algorithme consiste à tous les essayer.
Conseil
Supervisé
Non supervisé
Précision
Durée d’apprentissage
Linéarité
Malgré leurs limitations, les algorithmes linéaires sont très populaires comme
première ligne d'attaque. Ils ont tendance à être des algorithmes simples et à
apprentissage rapide.
Nombre de paramètres
Les paramètres sont les boutons que les scientifiques des données règlent
lorsqu’ils configurent un algorithme. Ce sont des nombres qui affectent le
comportement de l'algorithme, comme la tolérance aux erreurs ou le nombre
d'itérations ou les variantes du comportement de l'algorithme. La durée
d’apprentissage et la précision de l'algorithme peuvent parfois dépendre
grandement du choix de paramètres appropriés. En règle générale, les
algorithmes avec un grand nombre de paramètres requièrent le plus d’essais
pour trouver la bonne combinaison.
Nombre de fonctionnalités
Cas particuliers
Durée
Algorithme Précision d’apprentissage Linéarité Paramètres Remarques
Classification
double
classe.
régression ● ● 5.
logique
forêt de ● ○ 6.
décision
jungle de ● ○ 6. Faible
décision encombrement
de mémoire
arbre de ● ○ 6. Encombrement
décision de mémoire
optimisé important
réseau ● 9 Personnalisation
neuronal supplémentaire
possible
perceptron ○ ○ ● 4
moyenné
Durée
Algorithme Précision d’apprentissage Linéarité Paramètres Remarques
Machine de ○ ● 3
point de
Bayes
Classification
multiclasse.
régression ● ● 5.
logique
forêt de ● ○ 6.
décision
jungle de ● ○ 6. Faible
décision encombrement
de mémoire
réseau ● 9 Personnalisation
neuronal supplémentaire
possible
Régression
linéaire ● ● 4
linéaire ○ ● 2
bayésienne
forêt de ● ○ 6.
décision
arbre de ● ○ 5. Encombrement
Durée
Algorithme Précision d’apprentissage Linéarité Paramètres Remarques
décision de mémoire
optimisé important
quantile de ● ○ 9 Distributions
forêt rapide plutôt que
prédictions de
points
réseau ● 9 Personnalisation
neuronal supplémentaire
possible
Poisson ● 5. Techniquement
journal linéaire.
Pour les
décomptes
prévisionnels
ordinal 0 Pour la
prédiction de
rang
Détection
des
anomalies
machines à ○ ○ 2 Particulièrement
vecteurs de adapté aux
support ensembles de
caractéristiques
de grande taille
Détection ○ ● 3
des
anomalies
reposant sur
le PCA
Durée
Algorithme Précision d’apprentissage Linéarité Paramètres Remarques
K-moyennes ○ ● 4 Un algorithme
de clustering
Propriétés de l'algorithme :
Notes de l'algorithme
Régression linéaire
Régression logique
Bien qu’il inclue « régression » dans le nom, la régression logistique est en fait
un outil puissant pour deux classes et multiclass classification. Elle est rapide
et simple. Le fait qu'elle utilise une courbe en forme de S, et non une ligne
droite, en fait une solution de choix pour diviser les données en groupes. La
régression logique crée des limites de classes linéaires : vérifiez donc qu'une
approximation linéaire vous convient.
Une régression logique pour les données à deux classes avec une seule
caractéristique : la limite de classe est le point auquel la courbe logistique est
aussi proche des deux classes
Les limites apprises par les réseaux neuronaux peuvent être complexes et
irrégulières
Méthodes bayésiennes
Les méthodes bayésiennes ont une qualité très intéressante : elles évitent le
Anecdote historique, les machines de point de Bayes ont été développées par
Microsoft Research. Elles reposent sur un travail théorique exceptionnel. Pour
plus d’informations, consultez l’article d’origine dans JMLR et le blog de Chris
Bishop.
Algorithmes spécialisés
classes
Étapes suivantes
Pour télécharger une vue d'ensemble infographique présentant de
manière simple les concepts de base du Machine Learning afin de vous
familiariser avec les algorithmes populaires utilisés pour répondre aux
questions les plus courantes concernant le Machine Learning, consultez
Principes de base du Machine Learning avec exemples d'algorithmes.