Escolar Documentos
Profissional Documentos
Cultura Documentos
PREAMBULE ........................................................................................... 4
La pertinence............................................................................................................................................................ 6
La validité................................................................................................................................................................... 6
Le produit ............................................................................................................................................... 7
Le contexte ............................................................................................................................................ 7
L'influence .............................................................................................................................................. 7
La culture ................................................................................................................................................ 7
Quand l’univers des textes à analyser comprend une sémantique homogène ........... 8
BIBLIOGRAPHIE.................................................................................... 12
L’analyse de tonalité sur l’opinion des consommateurs, ce n’est pas nouveau : depuis
2003, des chercheurs se sont penchés sur le sujet 2. Des sociétés pionnières comme
Lexalitics travaillent sur ces techniques d’analyse de sentiment depuis déjà 6 ans.
Certaines ont déjà investi plusieurs millions de dollars sur le sujet, en collaboration avec
les équipes de recherche les plus avancées du monde.
La pertinence
Selon les textes analysés et les technologies employées, le taux de pertinence des
classifications en positif, négatif, neutre varie de 70% à 75%. C'est une moyenne. Cela
signifie que sur 10 informations, 2 voir 3 seront mal classifiées.
La validité
Nous avons donc 70% de données classées, mais sont-elles utiles, "actionnables" pour
l’analyse stratégique ? Que faire de centaines d’informations classées en plus, moins,
neutre ? Comment exploiter des centaines articles ou des consommateurs expriment
leurs "j'aime" ou "j'aime pas" ?
De nombreux textes sont ainsi classés comme Neutres car ils évoquent à la fois du positif
et du négatif. Mais le sentiment n'obéit pas à cette formule mathématique. Si un humain
analyse ce même texte, il pourra le juger, par exemple, plutôt négatif car le contexte, le
produit, les mots employés, la formulation, la nature de l’auteur font pencher davantage
le texte du côté "sombre".
Il faut pouvoir aussi gérer l’ironie, l’humour, les analogies ("j’ai autant aimé ce film que
mon service militaire"), les expressions, les dialectes (le jargon des banlieues, les
expressions adolescentes mixés de mots SMS de type Skyblogs). Les technologies
actuelles en sont encore incapables.
Le produit
Une personne qui s’exprime sur une automobile emploiera davantage les termes
économe, sécurisante, rapide que excellente, passionnante ou efficace. Qu’est-ce cela
implique ? Que, comme pour la veille "classique", il faut raisonner par thésaurus
spécialisés par secteurs, par produits, par communautés voir par problématiques. Une
approche générique transversale du "Sentiment analysis" est vouée à l’échec. Dans
l'idéal, il faudrait développer autant d'algorithmes que de secteurs et de problématiques
!
Le contexte
Qui véhicule le message et quand ? Un client fidèle en phase de renouvellement ou un
prospect en tout début de phase d'achat ?
L'influence
Est-ce que l'auteur qui s'exprime sur le net bénéficie d'une bonne visibilité donc d'une
potentielle amplification de son avis ou n'est-il tout simplement lu que par ses frères et
sœurs. 10 avis négatifs postés par des leaders d'opinions sur des sites à forte audience
pèsent plus lourd que 1000 commentaires dispersés sur des blogs quasi-invisible. Ce qui
importe, c'est d'abord l'effet potentiel du message. S'il est avéré, le contenu mérite d'être
analysé.
La culture
Au-delà des différences de signification de langage liés aux pays ("quite" n'a pas la
même signification aux USA et aux Royaume-Uni4), l'analyse de tonalité idéale devrait
pouvoir tenir compte des modes de vies. Ainsi, le site web TripAdvisor5 compile de
nombreux avis de vacanciers sur leurs séjours hôteliers : un américain donnera un avis
négatif sur un hôtel à cause de la mauvaise qualité de la climatisation et de la petite
taille de la salle de bain. Mais ce qui comptera pour l'italien, c'est bien davantage la
restauration et la propreté de la plage.
Au final, une majorité des spécialistes sur la question (éditeur de logiciel, consultant,
responsable de communication, chercheur, sociologue..) s’accordent à dire que l'analyse
de sentiment est une technique à surveiller pour l’avenir, mais que le point de vue
humain reste irremplaçable.6
Comment s'y prennent-ils afin d'éviter les écueils énoncés précédemment ? 2 exemples :
Vous pouvez vous faire votre propre…opinion avec les articles mentionnés ci-dessous.
Voir aussi :
http://liquidnotflat.blogspot.com/2009/09/sentiment-analysis-crap-in-social-media.html
Etudes
White Papers
• "Les Forums web pour la veille: Découvrez la valeur des conversations du net"
Christophe Asselin, Expert Internet, Digimind
• "Le Web 2.0 pour la veille et la recherche d'information : Exploitez les ressources du
Web Social"
Christophe Asselin, Expert Internet, Digimind
• Moyens de paiement
• Biotechnologie
• Nanotechnologie
• Nutrition
• RFID
• Risk management
• Contrefaçon
Infographies
• Typologie des sources Consumer Insight