Services aux entreprises

IBM Watson, quelles leçons tirer d’un pionnier de l’apprentissage automatique ?

Par Julie , le 13 mars 2020 - 10 minutes de lecture

Pour les entreprises, l’idée d’un ordinateur qui transforme chaque employé en expert dans son domaine est une perspective tentante. C’est ce rêve d’expertise universelle qu’IBM dans son système d’apprentissage automatique, Watson, rend possible.

En effet, Watson peut être formé pour répondre à vos questions sur n’importe quel sujet. Le système utilise le traitement du langage naturel pour lire un grand nombre de documents, extraire et organiser l’information sur un sujet particulier, puis affiner sa compréhension de ce sujet en fonction des réactions humaines.

Mais quelle est l’utilité des réponses données par Watson et à quel point est-il difficile de s’entraîner ? Lynda Chin, directrice de l’Institute for Health Transformation de l’University of Texas System, est une personne bien placée pour parler de l’utilisation du système gagnant.

Au cours des quatre dernières années, le MD Anderson Cancer Center de l’université a travaillé avec IBM Watson pour mettre au point un système permettant de conseiller les oncologues sur le diagnostic et le traitement des patients atteints de cancer. En commençant par la leucémie, le conseiller expert en oncologie s’est renseigné sur le cancer, absorbant l’information sur les traitements, les symptômes et les effets secondaires des dossiers des patients du centre. Le BCE offre des conseils sur les diagnostics et les traitements au réseau de cliniciens de MD Anderson, tout en continuant d’apprendre, et le centre se prépare à former Watson à se spécialiser dans le cancer du poumon. C’est ce que Chin a appris sur ce qu’il faut pour tirer le meilleur parti de Watson.

Il faut encore améliorer les données

Watson peut lire et, dans une certaine mesure, comprendre des documents écrits dans un langage courant et spécialisé. Mais vous aurez probablement encore besoin de mettre de l’ordre dans les données que vous utilisez pour former Watson, si vous voulez maximiser les informations utiles extraites. « Vous avez besoin de vraies données et c’est un énorme défi dans le domaine des soins de santé « , a déclaré Chin. « Vous avez probablement entendu dire que nos données de santé sont loin d’être agrégées et normalisées. »

Lors de l’envoi des dossiers des patients à Watson, le centre devait déterminer quel type de données convenait à la formation, comment les nettoyer et comment résoudre les ambiguïtés du langage humain ou les phrases imprécises. « Lire le dossier médical pour comprendre le problème du patient est l’une des parties les plus difficiles de la formation d’un système. Vous ne savez pas ce que vous rencontrerez dans les dossiers médicaux et vous devez être capable de comprendre si une information est pertinente ou non « , dit Chin.

On a besoin d’un large éventail de données

La qualité des systèmes d’apprentissage Watson et des systèmes d’apprentissage automatique en général dépend de la qualité des données sur lesquelles vous les formez. Si vous voulez que Watson soit un polyvalent, les données de formation doivent non seulement être de haute qualité, mais aussi être diversifiées. Chin a déclaré que les chercheurs de MD Anderson, et ceux qui forment un système similaire au Memorial Sloan Kettering Cancer Center à New York, ont réalisé qu’ils alimentaient les dossiers médicaux des systèmes d’un type très spécifique de patients atteints de cancer.

Le type de patients traités dans les centres sont généralement ceux qui ont un cancer avancé et qui n’ont pas réussi les traitements de deuxième, troisième et quatrième ligne. Pour que les conseils de Watson soient utiles aux oncologues en général, il faudra des données portant sur un éventail beaucoup plus large de patients atteints de cancer, a la dit directrice de l’Institute for Health Transformation de l’University of Texas System.

« Ce que nous avons réalisé, c’est que nous avons besoin de plus de données. Le genre de patient qui se retrouve dans un hôpital spécialisé comme MD Anderson et Memorial Sloan Kettering représente environ 2 %. Nous avons besoin de plus de données qui représentent les 98 % restants ». Le centre a travaillé avec les consultants PricewaterhouseCoopers, pour identifier de nouvelles sources de données qui pourraient faire de Watson un meilleur conseiller pour les cliniciens, avec Chin espérant un jour obtenir des données de nombreux hôpitaux, cliniques et pharmacies, ainsi que de dispositifs tels que Fitbit, qui fournissent des informations sur le comportement du patient à domicile. L’intention est que les données circulent en toute sécurité, non seulement à partir des hôpitaux et des cliniques, mais aussi, et surtout, à partir du monde réel.

Ne pas s’attendre à ce que le système ait un large éventail d’expertise

Si Watson, ou des systèmes concurrents basés sur l’apprentissage automatique, doivent posséder un niveau général d’expertise au sujet d’un poste, ils devront comprendre les multiples domaines de connaissance qui se rapportent à ce rôle. Par exemple, dans le domaine des soins de santé, les médecins doivent comprendre de nombreuses maladies différentes, du cancer au diabète, et des sous-domaines, du poumon au cancer du cerveau.

Cependant, les systèmes de formation pour comprendre chacun de ces nombreux domaines différents peuvent être difficiles et prendre beaucoup de temps, c’est pourquoi les efforts initiaux ont été axés sur la leucémie, le cancer du poumon et d’autres types spécifiques de cancer. « Pensez à un patient. Je ne veux pas d’un médecin qui ne connaît que le cancer. Je veux qu’ils soient au courant de mon hypertension et de mon diabète. Il y a de fortes chances que je les aie tous. Alors, comment pourrions-nous construire de multiples systèmes experts qui peuvent soutenir le même médecin, de sorte que le médecin puisse regarder le patient comme une personne à part entière ? » dit Chin. « Ce que nous devons faire pour y arriver, c’est avoir une infrastructure commune qui nous permette de briser les cloisonnements des différentes spécialités ».

Il faut des mois, voire des années pour former un conseiller expert

Former Watson et en faire un conseiller expert est un long processus, même si vous ne vous concentrez que sur un seul domaine de connaissance lié à un rôle. « Il faudra six, neuf, 18 mois pour former un domaine. Cela dépend de la complexité du domaine, de la quantité de données dont vous disposez « , a déclaré Chin, ajoutant que la formation est un processus continu. « Il y aura toujours l’exigence de formation. Nous envisageons d’apprendre à construire un moteur pendant que l’avion est dans les airs, de sorte qu’il y a beaucoup de pièces mobiles.

Le temps qu’il faut pour former un système comme Watson est un obstacle à l’adoption généralisée de l’apprentissage machine au sein des entreprises, a récemment fait valoir Harrick Vin, scientifique en chef chez Tata Consultancy Services, un sous-traitant indien, particulièrement lorsque cette longue formation doit être répétée pour chaque domaine des connaissances liées à un rôle. « Si vous voulez vraiment voir des avantages, comme ceux qui sont projetés, alors vous devez trouver un moyen de mettre à l’échelle et ne pas prendre six mois, un an, 18 mois pour former un moteur afin d’accomplir une tâche, parce qu’une grande entreprise typique exécute des centaines, voire des milliers, d’activités différentes « , dit-il.

Chin n’est pas d’accord que le besoin d’une formation initiale et continue prolongée signifie que la technologie n’est pas évolutive et souligne que le temps consacré à la formation diminue à mesure que la technologie sous-jacente, les processus de formation et les connaissances dans les différents domaines arrivent à maturité. Dans le cas du centre, l’objectif d’aider les médecins à choisir les meilleurs traitements en se fondant sur les données médicales les plus récentes, dont le médecin ne serait probablement pas au courant autrement, rend cet investissement initial intéressant. « Nous voulons soutenir un médecin en exercice comme s’il avait accès aux experts mondiaux pour ce type de tumeur pour cette maladie… ».

On n’obtiendra pas nécessairement des réponses en noir ou blanc

Dans de nombreux cas, vous ne devriez pas vous attendre à ce que Watson vous donne une réponse définitive par oui ou par non, en particulier dans les domaines complexes ou la bonne décision se résume à une question de jugement. Dans ces scénarios, Watson doit être considéré comme un outil permettant de mettre en évidence les meilleures options disponibles, afin que l’être humain puisse prendre la décision.

« Je crois que si nous parlons de systèmes semblables aux systèmes humains… ils ne sont jamais exacts à 100 % « , a dit Chin. « Il n’y a presque jamais de réponse en noir et blanc, oui ou non, en médecine, que l’on demande à une machine ou à un humain. Lorsqu’on l’interroge, Watson analyse cette enquête et en tire une liste restreinte des meilleures réponses possibles, d’après ce qu’il a appris. L’idée n’a jamais été pour Watson de faire le dernier appel pour un diagnostic ou un traitement mais de signaler les possibilités au clinicien.

Les gens se mettent immédiatement sur la défensive, ils ne veulent pas être remplacés par la machine. Cela n’a jamais été l’intention… Le système est destiné à trier une grande quantité d’informations et à présenter ce à quoi vous devriez prêter attention parce que le cerveau humain a une capacité limitée et un médecin a un temps limité.

Vous pourriez avoir besoin de plus d’infrastructure

Il peut s’avérer nécessaire de déployer plus d’infrastructures que prévu, afin de soutenir la collecte, le stockage et l’analyse de divers ensembles de données, ainsi que de rendre les systèmes experts qui en résultent largement disponibles.

Afin de recueillir en toute sécurité autant de données pertinentes que possible et de partager l’expertise des systèmes experts qui en résultent, le centre a passé 24 mois à travailler avec IBM, PricewaterhouseCoopers et AT&T pour construire une plate-forme de stockage et un réseau dédié. Chin a dit : « C’est comme si le conseiller expert en oncologie était la voiture, un véhicule pour partager les connaissances et l’expertise, et qu’on découvre qu’on n’a pas de route. Il ne va nulle part. Nous avons besoin d’un réseau routier. Un réseau sécurisé qui permet à la voiture d’aller dans une ville éloignée ou vous n’avez qu’un seul oncologue sur 100 miles, afin qu’ils obtiennent un soutien….

« Tant que vous n’aurez pas ce système, vous ne pourrez pas vraiment utiliser le BCE comme je l’avais prévu, c’est-à-dire démocratiser et partager l’expertise, pour permettre aux médecins en exercice de faire le meilleur travail possible en prenant soin de ses patients. »

Julie

La dernière recrue de l'équipe ! Julie est une blogueuse et jeune entrepreneuse. Elle vient tout juste de lancer sa propre marque de t-shirts personnalisés et compte bien écraser le marché.