Dans son article, Ahmed Affes, Data Scientist / MLOps, répond à cette question en vous présentant les différentes étapes : le prétraitement, la génération d’un vecteur mathématique à l’aide d’un modèle de langage, les méthodes d’entraînement et le choix de la meilleure base de données pour le stockage.
Détection de 15 aspects prédéfinie par le business sur les questionnaires clients et analyse sémantique des questionnaires.
Extraction ligne à ligne des fonds d’investissement non côtés. Restitution des résultats au format numérique.
Création d’un modèle pour identifier les transactions par carte bancaire suspectes et régler les problèmes de dissymétrie d’informations.
Lecture automatique des pièces jointes de mails, identification du type de document, stockage Automatique de la donnée en BDD.
Identification des profils clients en fonction de leur historique de navigation, et analyse sémantique du contenu des articles pour améliorer la segmentation client.
Création d’un prototype de détection des controverses potentielles dans des news issues des marchés financiers afin de faciliter le travail d’analyse des gestionnaires d’actifs.
Identification dans une liste d’arrêtés municipaux des arrêtés ayant une conséquence sur l’espace publique (Travaux, Manifestation, Événement Sportif…), détection d’adresse et validation du périmètre impacté.
Identification des clauses particulières de nombreux contrats, extraction des signatures, vérification de l’authenticité des scripteurs par matching.