apprentissage non supervisé

En machine learning, lorsque l'on souhaite regrouper des données sans les étiqueter, le recours à l'apprentissage non supervisé, sans aucune intervention humaine, s'impose.

L'apprentissage non supervisé, qu'est-ce que c'est ?

En machine learning, la technique de l’apprentissage non supervisé (ou unsupervised learning) consiste à entraîner des modèles, sans réaliser d’étiquetage manuel ou automatique des données au préalable. Les algorithmes regroupent les données en fonction de leur similitude, sans aucune intervention humaine.

Comment fonctionne l'apprentissage non supervisé ?

L'apprentissage non supervisé détecte des données ou individus présentant des caractéristiques ou des structures communes. Typiquement, l'unsupervised learning peut servir à développer un moteur de recommandation de produits, qui est conçu pour proposer à un visiteur des produits au regard des appétences des clients présentant les mêmes caractéristiques.

Quelle est la différence entre apprentissage non supervisé et apprentissage supervisé ?

A la différence de l'apprentissage supervisé qui fait appel à des données étiquetées ou annotées pour réaliser des prédictions, l'apprentissage non supervisé n'a pas besoin d'étiquette. Puisque les données ne sont pas étiquetées, il n'est pas possible pour le modèle de calculer des scores de réussite. En conséquence, alors que les systèmes supervisés se concentrent sur les tâches de régression et classification, la technique non supervisée est utilisée pour effectuer des regroupements ou des mises en grappe de données en fonction de leurs ressemblances ou différences.

Quelles sont les techniques de l'apprentissage non supervisé ?

En apprentissage supervisé, le clustering est l'algorithme le plus utilisé. Il consiste à regrouper des données hétérogènes en groupes de données ayant des caractéristiques homogènes. Comme indiqué plus haut, le clustering est très utilisé pour réaliser des segmentations de clients présentant des caractéristiques et comportements communs.

Il existe plusieurs types d'algorithmes de clustering. Parmi les plus populaires figurent la méthode des K-moyennes (voir question ci-dessous), l'algorithme apriori, le clustering hiérarchique ou encore la décomposition en valeurs singulières (SVD). Autre type d'algorithme non supervisé : l'analyse en composantes principales (ACP).

12 articles dans cette thématique

Intelligence artificielle vs intelligence superficielle

Que d'encre ne coule chaque semaine pour nous expliquer que l'intelligence artificielle n'existe pas, qu'elle n'est guère intelligente notamment au re...

Patrick Perrot Gendarmerie Nationale

17/05/2022 Lire la suite →

Découvrez Neural Structured Learning, le nouveau framework TensorFlow pour les données structurées

Google a lancé un nouveau framework pour TensorFlow baptisé NSL (Neural Structured Learning). Open source, cet outil pour les chercheurs et développeu...

04/09/2019 Lire la suite →

La Data Science à la rescousse des assurances

L’Agence pour la lutte contre la fraude à l’assurance (Alfa) a signalé dans son rapport annuel que la fraude à l’assurance représenterait un coût réel...

Axionable Jean Cupe

03/07/2018 Lire la suite →

Traduction automatique : Focus sur la solution Open Source proposée par Systran, acteur historique de la T.A qui ne cesse de se renouveler

Les progrès de l'intelligence artificielle permettent un véritable essor technologique, notamment en matière de traduction automatique. Après la tradu...

Systran Jean Senellart OpenNMT Guillaume Lample

13/04/2018 Lire la suite →

Machine learning et intelligence artificielle : Sorbonne Université ouvre une nouvelle formation continue

Sorbonne Université vient d'annoncer l'ouverture en septembre 2018 d'une nouvelle formation consacrée au machine learning et à l’intelligence artifici...

LIP6 Ludovic Denoyer Sorbonne Université

22/03/2018 Lire la suite →

Appel à papiers pour la conférence sur l'Apprentissage Automatique CAp 2018

La conférence sur l'Apprentissage Automatique CAp se tiendra du 20 au 22 juin prochain. Organisée par l'INSA de Rouen, elle se veut un rassemblement i...

12/03/2018 Lire la suite →

Grâce au Lifelong Learning et au projet LIHLITH, Synapse cherche à améliorer les capacités d'auto-apprentissage des IA

Machine learning, Deep learning, apprentissage supervisé ou non-supervisé, de nombreux projets cherchent à améliorer les techniques d'apprentissage de...

Synapse développement

19/02/2018 Lire la suite →

Différence entre apprentissage supervisé et apprentissage non supervisé

En matière d'apprentissage automatisé, on oppose très fréquemment apprentissage supervisé et apprentissage non supervisé. L'apprentissage supervisé...

24/01/2018 Lire la suite →