Et pourtant dans le cadre de la transformation numérique des entreprises, de nouvelles nuances ont été apportées par les consultants spécialisés du domaine. Ces derniers découpent en 3 la notion initiale de numérisation.

  • Numérisation
    • C’est l’action qui consiste à transférer sur un support immatériel un élément matériel (souvent un support papier).
  • Dématérialisation
    • C’est l’action qui consiste, entre autres, à produire des documents nativement numériques.
  • Digitalisation
    • C’est l’action qui consiste a pouvoir transférer la donnée d’un producteur à un consommateur sans nécessiter de ressaisie.

Je vais prendre un exemple de la vie de l’entreprise pour permettre de visualiser ce dont on parle puis on va essayer de le transposer à la généalogie pour voir où cela pourrait nous emmener demain. Prenons une dépense mineure faite dans le cadre d’un déplacement professionnel. Cela est justifié par un papier (un reçu) émis par le taxi. Ce justificatif est scanné (numérisation) et l’employé va devoir ressaisir les données dans un logiciel. Si c’est un VTC commandé dans le cadre d’une plateforme, les données peuvent arriver en PDF par mail automatique depuis la plateforme (dématérialisation). Enfin si le PDF est accompagné d’un fichier balisé contenant les informations de date, de prix, de fournisseur, de lieu etc., cela peut-être compris directement par le logiciel de gestion de l’entreprise (digitalisation). Les applications sur smartphone de gestion de note de frais actuelles intègrent un logiciel de reconnaissance de caractères et de l’intelligence artificielle, ce qui permet que même un justificatif papier, lorsqu’il est scanné voit ses caractéristiques (prix, fournisseur, date… ) directement importées dans le logiciel de gestion.

Maintenant que nous avons brossé le tableau de ce qui existe dans l’industrie, penchons-nous sur une application généalogique. La numérisation des registres et la dématérialisation de l’état-civil existent (loi du 10 août 2018 et  décret du 26 septembre 2019) pour les actes récents (ceux que consulteront les généalogistes de demain). La reconnaissance de caractères (OCR) adapté à la paléographie est en développement (cf les initiatives Transkribus et Lectaurep, on en parle dans les commentaires de l'épisode 2). Le langage à balises pour décrire numériquement les données généalogiques existe, c’est le GEDCOM. Par contre, les modules d’intelligence artificielle qui répartissent le texte dans les champs normalisés n’existent pas encore puis la normalisation des lieux au travers de bases de données regroupant FANTOIR et Cassini EHESS permettrait d’avoir une identification et une normalisation des lieux. Ensuite il faudrait que les bases de données de dépouillement permettent de remonter à la source au travers de permaliens pour que chacun puisse importer les données dans « son » environnement.

Une étape intermédiaire pourrait-être que les bases de données existantes sortent directement un extrait Gedcom pour les quelques personnes que vous sélectionnez. Cela vous semblerait-il un progrès ?

La continuité numérique pose aussi des problèmes. Comment « normaliser » l’orthographe d’un patronyme ou d’un prénom qui change au travers des actes ? Comment corriger les erreurs de l’OCR ? Comment corriger les erreurs relevées dans les actes ? Comment saisir une filiation connue mais non-officielle ?