Extraction automatique des bulletins de paie
Sage, ADP, Silae, PayFit : un seul pipeline.
Plus de 40 lignes de cotisations, des formats qui varient selon l'éditeur de paie (Sage, ADP, Cegid, Silae, PayFit), et 3 à 12 mois de bulletins à vérifier pour un dossier de crédit. Holofin extrait salaire brut, net, cotisations et prélèvement à la source avec plus de 95 % de précision.
Demander une démo| Rubriques | Base | Taux Sal. | Cot. Sal. | Taux Pat. | Cot. Pat. |
|---|---|---|---|---|---|
| SALAIRE DE BASE (23,08€/h) | 3 500,00€ | ||||
| SALAIRE BRUT | 3 500,00€ | ||||
| SANTÉ | |||||
| Sécurité sociale | 3 500,00€ | 7,00 | 245,00€ | ||
| RETRAITE | |||||
| Assurance Vieillesse plafonnée | 3 500,00€ | 6,90 | 241,50€ | 8,55 | 299,25€ |
| CEG tranche 1 | 3 500,00€ | 0,86 | 30,10€ | 1,29 | 45,15€ |
| Compl. tranche 1 AGIRC-ARRCO | 3 500,00€ | 3,15 | 110,25€ | 4,72 | 165,20€ |
| ASSURANCE CHOMAGE | |||||
| Assurance chômage tranche A | 3 500,00€ | 4,05 | 141,75€ | ||
| CSG déductible | 3 438,75€ | 6,80 | 233,84€ | ||
| TOTAL DES RETENUES | 629,69€ | 1 247,61€ | |||
| Impot sur le revenu | Base | Taux Neutre | Montant | Cumul annuel |
|---|---|---|---|---|
| Impôt prélevé à la source | 2 870,31€ | 3,50% | 100,46€ | 301,38€ |
Pourquoi l'extraction des bulletins de paie
reste un défi.
Plus de 40 lignes de cotisations
Chaque bulletin de paie contient des dizaines de lignes de cotisations dont les taux varient selon la convention collective, le statut cadre ou non-cadre, la branche professionnelle et la tranche de rémunération. Un extracteur générique ne peut pas deviner la structure sans comprendre le contexte.
Chaque éditeur, un format différent
Sage, ADP, Cegid, PayFit, Silae, Nibelis : chaque éditeur de paie produit un bulletin avec sa propre mise en page, ses propres intitulés de lignes, et son propre agencement des blocs. Un extracteur entraîné sur un format échoue sur un autre.
Les bulletins issus de cabinets d'expertise comptable ajoutent une couche de variabilité supplémentaire.
6 éditeurs majeurs × formats personnalisés = des centaines de mises en page différentes en circulation.
Ancien format vs format simplifié
La réforme de janvier 2018 a introduit le bulletin de paie simplifié, qui regroupe les cotisations par catégorie. Mais l'ancien format détaillé circule encore largement, notamment dans les archives et les dossiers historiques. L'extracteur doit gérer les deux.
3 à 12 mois à vérifier
Pour un dossier de crédit immobilier ou de location, il faut vérifier 3 à 12 mois de bulletins. Multiplié par le nombre de dossiers, le volume devient vite ingérable sans automatisation.
Scans et photos smartphone
Les candidats locataires et les emprunteurs envoient souvent des photos prises au téléphone ou des scans basse résolution. L'OCR doit gérer le bruit, les ombres, les perspectives déformées et les textes flous.
Récapitulatif annuel intégré
Certains bulletins de décembre incluent un récapitulatif annuel sur plusieurs pages, avec les cumuls de l'année. L'extracteur doit distinguer les données du mois courant des cumuls annuels.
Ce que Holofin extrait
d'un bulletin de paie.
Chaque champ extrait est accompagné de ses coordonnées exactes dans le document source (bounding box), permettant une vérification visuelle instantanée.
| Catégorie | Champs extraits |
|---|---|
| Identité salarié | Nom, prénom, NIR (numéro de sécurité sociale), emploi, qualification, convention collective, coefficient |
| Identité employeur | Raison sociale, SIRET, code APE/NAF, adresse, convention collective (IDCC) |
| Période et paiement | Période de paie, date de paiement, mode de paiement |
| Rémunération | Salaire brut, salaire net imposable, salaire net à payer avant PAS, net à payer après PAS |
| Prélèvement à la source | Taux PAS, montant PAS, net fiscal (base), type de taux (personnalisé, neutre) |
| Cotisations | Total cotisations salariales, total cotisations patronales, détail par ligne (base, taux, montant) |
| Cumuls annuels | Brut cumulé, net imposable cumulé, heures cumulées, montant PAS cumulé |
| Congés | Congés acquis, congés pris, solde de congés, RTT |
Exemple de sortie JSON :
{
"employe": {
"nom": "Martin Dupont",
"nir": "1 85 07 75 123 456 78",
"emploi": "Ingénieur d'études",
"convention_collective": "Syntec (IDCC 1486)"
},
"employeur": {
"raison_sociale": "Acme Technologies SAS",
"siret": "123 456 789 00012"
},
"periode": "Janvier 2025",
"remuneration": {
"salaire_brut": 4200.00,
"salaire_net_imposable": 3318.60,
"salaire_net_a_payer": 3150.45,
"prelevement_source": {
"taux": 7.5,
"montant": 248.90
}
},
"cotisations": {
"total_salariales": 881.40,
"total_patronales": 1764.00
},
"cumuls_annuels": {
"brut_ytd": 4200.00,
"net_imposable_ytd": 3318.60
}
}Fact Grounding
Chaque valeur extraite est liée à sa position exacte dans le document source (page, coordonnées x/y, bounding box). Cela permet une vérification visuelle en un clic et constitue une piste d'audit complète.
Comment ça marche.
Trois étapes, du document brut aux données structurées et validées.
Envoyez vos bulletins
API REST, email, drag-and-drop. PDF natifs, scans, photos smartphone. Envoyez un bulletin ou un lot de plusieurs centaines.
Extraction intelligente
OCR multi-passes, modèle vision-langage pour comprendre la structure, et correction agentique pour résoudre les ambiguïtés. Le tout en quelques secondes.
Données structurées
JSON structuré, CSV, ou webhook vers votre système. Chaque champ avec sa valeur, sa confiance et ses coordonnées source.
Validation automatique
avec Hololang.
Notre DSL de validation financière. Exprimez des règles de format, de cohérence et d'alerte en quelques lignes.
Vérifier que le salaire net est inférieur au salaire brut
VALIDATE @salaire_net < @salaire_brutVérifier que le NIR est au format valide
VALIDATE @nir FORMAT NIRVérifier que le taux PAS est entre 0 % et 43 %
VALIDATE @taux_pas BETWEEN 0 AND 43Vérifier que le cumul brut est cohérent avec le mois courant
VALIDATE @brut_ytd >= @salaire_brut * (@mois_courant)Alerter si le salaire brut est inférieur au SMIC
ALERT IF @salaire_brut < 1 766.92Détection de fraude
sur les bulletins de paie.
Le bulletin de paie est le document le plus falsifié en France. Dossiers de crédit, candidatures locatives, demandes de prestations : les motivations sont nombreuses et les outils de contrefaçon de plus en plus accessibles.
70 détecteurs forensiques
Holofin analyse chaque bulletin sur 6 domaines forensiques : contenu, typographie, métadonnées, structure PDF, médias et sécurité. La corroboration croisée entre domaines identifie les falsifications que l'analyse d'un seul domaine manquerait.
Typographie
Polices incohérentes, tailles anormales, espacement irrégulier entre les lignes de cotisations.
Métadonnées PDF
Producteur PDF incohérent avec l'éditeur de paie déclaré, dates de modification suspectes.
Contenu
Incohérence entre brut, net et cotisations. Taux de cotisations impossibles. SIRET invalide.
Corroboration croisée multi-domaine : un bulletin avec un producteur PDF suspect (métadonnées) et des polices incohérentes (typographie) et un taux de cotisation impossible (contenu) est signalé à risque élevé. Un seul signal isolé peut être bénin ; trois signaux convergents ne le sont presque jamais.
Extraction et vérification QR code
Certains éditeurs de paie intègrent un QR code ou un cachet 2D-Doc sur les bulletins. Lorsqu'il est présent, Holofin l'extrait et compare les données signées (net à payer, période, employeur) avec les valeurs extraites du document. Toute divergence est signalée comme indicateur de falsification.
Cas d'usage
de l'extraction bulletin de paie.
Crédit immobilier et consommation
Les banques et fintechs vérifient 3 à 12 mois de bulletins pour évaluer la capacité de remboursement. L'extraction automatique réduit le temps de traitement de chaque dossier de 15 minutes à quelques secondes, avec validation croisée des montants et détection de fraude intégrée.
Location immobilière
Les agences immobilières et les plateformes de gestion locative reçoivent des dizaines de dossiers candidats par annonce. L'extraction automatique des bulletins permet de vérifier les revenus déclarés et de détecter les documents falsifiés avant la signature du bail.
Gestion de la paie externalisée
Les cabinets de paie qui reprennent un portefeuille client doivent numériser et structurer des années de bulletins historiques. L'extraction automatique transforme des cartons d'archives en données exploitables pour la reprise de l'historique salarial.
Conformité et audit RH
Les services RH et les auditeurs vérifient la présence des mentions obligatoires, la cohérence des cotisations avec la convention collective applicable, et le respect des minima conventionnels. L'extraction structurée permet un contrôle systématique et documenté.
Questions fréquentes
sur l'extraction des bulletins de paie.
Holofin traite les bulletins de paie en PDF natif (générés par le logiciel de paie), les scans et les photos smartphone. Tous les principaux éditeurs sont pris en charge : Sage, ADP, Cegid, PayFit, Silae, Nibelis, ainsi que les bulletins produits par des cabinets d'expertise comptable. Les deux formats sont supportés : l'ancien format détaillé et le format simplifié introduit par la réforme de janvier 2018.
L'extraction d'un bulletin de paie prend quelques secondes. En traitement par lot (batch), Holofin traite plusieurs milliers de bulletins par heure grâce au traitement parallélisé. Le temps inclut l'OCR, l'extraction, la validation Hololang et la détection de fraude.
Oui. Holofin intègre 70 détecteurs forensiques qui analysent la typographie (polices incohérentes, espacement anormal), les métadonnées PDF (producteur, dates de modification), la structure du document et la cohérence du contenu (taux de cotisations, calculs brut/net). La corroboration croisée multi-domaine identifie les falsifications même sophistiquées.
Holofin extrait l'identité du salarié (nom, NIR, emploi, convention collective), l'identité de l'employeur (raison sociale, SIRET, code APE), la période de paie, la rémunération (salaire brut, net imposable, net à payer, prélèvement à la source avec taux et montant), les cotisations salariales et patronales (total et détail par ligne), les cumuls annuels (brut, net imposable, heures) et les données de congés (acquis, pris, solde).
Holofin propose une API REST documentée avec authentification par clé API. Les résultats sont disponibles en JSON structuré ou CSV. Des webhooks notifient votre système dès que l'extraction est terminée. Des SDK Python et JavaScript sont disponibles pour accélérer l'intégration. Pour les workflows no-code, l'intégration via Zapier est également possible.
Holofin est hébergé en Europe (infrastructure OVHcloud, France). Les données sont chiffrées au repos et en transit. Les données ne sont jamais utilisées pour entraîner des modèles tiers. La durée de rétention des documents est configurable par organisation. Un DPA (Data Processing Agreement) et un Trust Center sont disponibles sur demande.
Oui. Holofin extrait le taux de prélèvement à la source (PAS), le montant prélevé, le net avant PAS et le net après PAS. Le type de taux (personnalisé, neutre, individualisé) est également identifié lorsqu'il est mentionné sur le bulletin. Ces champs sont disponibles pour tous les bulletins émis depuis janvier 2019.
La tarification est au volume, avec des paliers dégressifs. Un essai gratuit est disponible pour tester la précision sur vos propres documents. Contactez-nous pour obtenir un devis adapté à votre volume de traitement.
Prêt à automatiser
le traitement de vos bulletins de paie ?
Envoyez-nous vos bulletins les plus complexes. Voyez comment ils ressortent de l'autre côté.