Numérisation intelligente : le regard du BPOiste

11.02.2022 - 9 min

Numérisation

Mettre en place une chaîne de numérisation efficace avec un maximum d’automatisation et des engagements contractuels forts en termes de qualité des données fournies et de délai de livraison, telle est la raison d’être d’un spécialiste du BPO (Business Process Outsourcing). A lui de savoir panacher avec talent et précision les technologies nécessaires pour tenir ces engagements. Explications.

L'extraction de données chez Numen

Outre son métier d’éditeur de logiciels en SaaS autour de Doxtreem, Numen possède aussi une business unit qui fait commerce des flux de données extraites des documents scannés sur ses chaînes de numérisation. Piégées dans des documents papiers ou électroniques et présentées de façon déstructurée, ces données ont deux vocations :

être intégrées aux applications métiers ou aux bases de connaissances de l’organisation. Dans ce cas, si les données sont importantes, le document, lui, l’est beaucoup moins.
servir à indexer le document pour le classer et pouvoir le rechercher dans une GED ou un SAE par exemple.

Qu’elles soient issues de documents scannés ou de documents numériques, ces données sont extraites avec des engagements précis en termes de qualité, d’exhaustivité et de délai. Et pour faire ce métier, Numen s’appuie sur différentes technologies d’automatisation.

Ce qui compte c'est le résultat, pas la méthode !

Ainsi, en fonction des exigences des clients, Numen arbitre entre l’utilisation de l’IA, celle d’autres technologies et l’intervention humaine. Sa force, c’est de savoir placer le curseur au bon endroit. “Notre métier n’est pas de fournir la technologie pour rendre les clients autonomes afin qu’ils réalisent ces opérations eux-mêmes, mais de combiner systématiquement les meilleures technologies au contrôle humain pour assurer des prestations fiables et compétitives”, explique François Chahuneau, Director of Technology chez Numen.

Reste que la compétitivité des offres Numen en matière de BPO est fortement liée au taux d’automatisation de la chaîne de numérisation mise en place. Car seul le résultat compte. Rappelons, en effet, que derrière les flux de données livrés au client, il n’y a personne pour les contrôler. Ils nourrissent un système d’information ou une application métier. Voilà pourquoi l’extraction doit être de qualité et pourquoi il est important d’utiliser les technologies d’IA adaptées à la valeur de ces données et au risque d’erreur consenti.

Le Machine Learning : un apprentissage autonome

Il existe aujourd’hui une confusion entre l’IA et le Machine Learning qui sont devenus des buzzwords et dont on ne sait plus très bien qui fait quoi. Si le Machine Learning et le Deep Learning sont des Intelligences Artificielles, l’inverse n’est pas vrai. Par exemple, les graphiques de connaissances ou les moteurs de règles sont des Intelligences Artificielles mais ne relèvent pas du Machine Learning ni du Deep Learning. Le Machine Learning, ou apprentissage automatique, est capable de reproduire un comportement grâce à des algorithmes alimentés par un grand nombre de données. Confrontés à de nombreuses situations, ces algorithmes apprennent, par la statistique, quelle est la décision à adopter et créent un modèle. La machine peut dès lors automatiser les tâches en fonction des situations.

Pas d’intelligence, sans donnée

Le Machine Learning exige donc des données en très grande quantités et un entraînement spécifique. Or, comment faire quand on ne dispose pas d’un pool de données suffisant ? En effet, le BPOiste ne possède pas, au moins au début, les données que les clients lui confient. “Si, au regard du RGPD, le client nous demande d’oublier immédiatement les données, nous n’avons pas la possibilité de les utiliser pour entraîner notre algorithme d’IA”, ajoute François Chahuneau. Il est possible d’analyser les quelques données à disposition, de définir des règles et d’entraîner l’algorithme d’IA, mais cela risque de prendre énormément de temps.

De l’humain pour compenser les erreurs

Autre problème : l’imputabilité de l’erreur. Ces algorithmes de ML affichent aujourd’hui tous un taux de probabilité. Une sorte d’indice de confiance. Car aucun système n’est fiable à 100%. Sauf que si le client nous confie la numérisation de ses documents et l’extraction de ses données, c’est pour qu’il n’y ait pas d’erreur justement. Voilà pourquoi nous ajoutons une couche de contrôle humain derrière l’IA, avant de nous engager sur la qualité des livrables. Les opérateurs peuvent par exemple se focaliser uniquement sur les incertitudes remontées par les machines. “Les clients demandent une intervention humaine, car ils souhaitent un taux de qualité exigeant et contractuel”, poursuit François Chahuneau.

Expliquer les erreurs pour ne pas les reproduire

Et quand une prédiction d’un réseau de neurones est fausse, il n’y aucune explication sur le “pourquoi du comment”. Selon l’enjeu, cela peut être grave ou… pas du tout. Mais vous ne pouvez pas dire à un client que parmi les données extraites de ses documents il y a 10% d’erreurs, sans savoir quelle est la nature de ces erreurs. L’une d’elles peut très bien être inacceptable. Et le problème avec l’IA réside dans le fait que nous n’avons jamais de réponse ni de manière d’être certain que cela ne va pas se reproduire. Vous n’êtes jamais à l’abri d’une erreur incompréhensible. “Voilà pourquoi certaines méthodes ne sont pas applicables face aux exigences clients, insiste le Director of Technology de Numen. Nous devons pouvoir remonter à l’origine de l’anomalie et faire en sorte que cela ne se reproduise pas. Nous ne pouvons donc pas nous contenter de ces méthodes de ML statistique.”

Bien entendu, Numen s’appuie autant que possible sur l’IA pour assurer ses prestations de numérisation et d’extraction de données, mais pour renforcer leur fiabilité, le contrôle humain s’avère indispensable. C’est ce que nous appelons, chez Numen de “l’IA augmentée”. In fine, l’expertise du BPOiste réside dans cette faculté de combiner les meilleures technologies et les meilleurs usages pour obtenir les meilleurs résultats.

Le cas de l’INPI et des informations légales des entreprises françaises

L’Institut national de la propriété intellectuelle (INPI) met gratuitement à disposition, via son moteur de recherche Data INPI, les informations légales de 5,9 millions d’entreprises. Ainsi, chaque année 1,85 million de liasses fiscales passent par les chaînes de numérisation Numen. “Ici, nous ne sommes pas en présence d’un document Cerfa au gabarit parfaitement connu, explique François Chahuneau. Les entreprises sont, en effet, libres de nommer leurs comptes comme elles veulent.” Les documents étant hétérogènes, il faut de l’intelligence et de la subtilité pour aller chercher les données. Lors des pics d’activité, ce sont 8 000 liasses fiscales qui sont traitées chaque jour. Des liasses dont Numen extrait au maximum 600 valeurs numériques. Le taux d’automatisation de cette chaîne est de 85%, mais près d’une centaine d’opérateurs sont là en renfort pour effectuer l’analyse détaillée de tous les doutes et autres anomalies pour lesquels l’automate remonte une alerte. Il est d’ailleurs programmé pour lever le doigt au moindre doute.

Articles similaires

Dématérialisation, Numérisation, Secteur public, Témoignage

Chambre des Députés du Luxembourg x Numen : dématérialisation des archives patrimoniales

5 min

Dans le cadre d’un projet ambitieux et techniquement exigeant, Numen a mobilisé son expertise pour accompagner la Chambre des Députés du Luxembourg dans la numérisa...

Numérisation

Numériser ses documents archivés : les bonnes raisons pour se lancer

14 min

Une fois numérisés, les documents papier de votre entreprise peuvent être stockés électroniquement sur un disque dur, un serveur, un cloud, une solution de Gestion ...

Confiance numérique, Numérisation

Pourquoi digitaliser ses archives de bulletins de paie ?

8 min

Bien que de nombreuses entreprises aient adopté les bulletins de paie numériques, un grand nombre d’entre elles continue de stocker les documents plus anciens en format microfich...

Dématérialisation, Numérisation, Livres Blancs

Comment digitaliser vos microfiches de paie pour les rendre accessibles et pérennes ?

5 min

Dans un monde où la technologie s’impose progressivement comme le pivot central des opérations, la digitalisation des documents administratifs est devenue une priorité pour ...

Confiance numérique, Numérisation

Choisir le prestataire idéal pour la numérisation de vos documents : Conseils d'experts

14 min

La transformation digitale des entreprises passe nécessairement par la numérisation de leurs documents. L’enjeu n’est pas simplement de traduire des données physique...

Numérisation

Qu’est-ce que la numérisation des documents ?

15 min

La révolution numérique est en marche. Les entreprises qui souhaitent rester compétitives ne peuvent plus se permettre d'ignorer les bénéfices de la numé...

Numérisation, Patrimoine culturel, Secteur public

Numérisation Patrimoniale : Définition, Enjeux, Étapes et Défis

13 min

Les musées, les bibliothèques ou encore les organismes culturels se trouvent aujourd'hui à un tournant inévitable : celui de la numérisation patrimoniale. Grâce à ce processus, la conservati...

Dématérialisation, Numérisation

Comment gérer vos datas et les mettre au service de vos activités ?

8 min

Si prestataire en numérisation rime avec dématérialisation, il peut aussi rimer avec data. Numen le prouve avec ses capacités d’extraction de données de qual...

Confiance numérique, Dématérialisation, Numérisation, Archivage numérique, Secteur public

Copie Fiable : tout ce qu’il faut savoir

14 min

La numérisation simple d’un document papier n’offre au fichier électronique produit qu’une valeur de simple « copie ». Elle ne vous dispense donc pas d&rs...

Afficher plus de contenu