De ce CoalaPDF pentru anonimizare CV?
- Procesare locală: CV-urile candidaților rămân în browser și nu sunt încărcate pe server.
- Orientat pe recrutare: detectează câmpuri utile pentru HR, nu doar email și telefon.
- Output ușor de trimis: rezultatul este PDF cenzurat, pregătit pentru hiring manager sau client.
- Control manual: tool-ul marchează zonele detectate, iar HR poate verifica vizual înainte de distribuire.
Pentru HR și recruiters
În recrutare, anonimizarea CV-urilor ajută când vrei ca prima evaluare să fie făcută pe competențe, experiență și potrivire cu rolul, nu pe date personale. Este utilă pentru agenții de recrutare, echipe interne HR și procese de blind hiring unde hiring managerul nu are nevoie să vadă numele, vârsta, adresa sau datele de contact în etapa inițială.
De ce anonimizare CV?
Studii arată că recrutorii au bias inconștient privind: gen, vârstă, etnie, religie, locul nașterii. Anonimizarea CV-ului în prima fază (înainte ca hiring managerul să-l vadă) reduce dramatic acest bias și conduce la decizii mai obiective bazate pe competențe și experiență. E o practică standard la companii precum Google, Deloitte, BBC.
Ce detectează tool-ul
- Nume și prenume (heuristică: linie cu 2-4 cuvinte capitalizate, în primele 8 linii ale primei pagini)
- CNP (regex + validare cifră de control)
- Serie CI/BI (două litere + șase cifre, inclusiv după label explicit)
- CIF/CUI (prefix RO sau label CIF/CUI, cu validare cifră de control)
- IBAN RO (format 24 caractere + validare mod-97)
- Telefon RO mobil și fix (formate +40, 0040, 07xx, 02xx, 03xx)
- Email (regex standard RFC)
- LinkedIn și alte rețele sociale (linkedin.com/in/...)
- Data nașterii (formate DD.MM.YYYY, DD/MM/YYYY)
- Vârstă (după keyword: "Vârsta: 35", "Age: 35")
- Adresă (după keyword: "Adresa:", "Strada", "Bd.")
Cum funcționează tehnic
Tool-ul folosește pdfjs pentru a extrage textul împreună cu coordonatele exacte X/Y ale fiecărui element. Aplică detecții RO-specific pentru CNP, IBAN, CI/BI, CIF/CUI, telefon, email, adresă și nume, apoi cu pdf-lib desenează rectangle-uri negre peste zonele detectate.
Limitări și recomandări
- Verificare manuală recomandată: pattern matching nu e 100% precis. După cenzurare, verifică PDF-ul vizual înainte de trimitere.
- Poze: actualmente nu detectăm fotografii de profil — vine în Sprint 7 cu detecție bazată pe poziții uzuale și OpenCV WASM.
- Nume în context: dacă numele candidatului apare în alte locuri (ex: în titlul unei lucrări academice "X. Popescu, Algoritmi avansați"), poate scăpa neacoperit.
- NER cu ML: în Sprint 7 adăugăm un model NER (Named Entity Recognition) antrenat pe RO via ONNX runtime în browser pentru detecție mai precisă.
Exemplu de utilizare
- HR primește 50 CV-uri pentru un post tehnic.
- Anonimizează toate CV-urile cu acest tool (cu opțiunile bifate: nume, telefon, email, vârstă, LinkedIn).
- Trimite CV-urile anonime hiring managerului — care le evaluează exclusiv pe baza competențelor.
- Pentru top 5 candidați, HR dezvăluie identitatea (păstrează CV-urile originale separat).
Întrebări frecvente
Pot anonimiza mai multe CV-uri? Da, dar fluxul recomandat este să verifici vizual fiecare PDF rezultat înainte de trimitere.
Elimină complet datele personale? Nu promitem 100%. Pattern matching-ul acoperă cazurile comune; documentele importante trebuie revizuite manual.
Se păstrează formatul CV-ului? Da, tool-ul aplică blackout peste zonele detectate, fără să rescrie documentul.
Pot folosi rezultatul pentru blind hiring? Da, mai ales pentru screening inițial, când vrei să separi competențele de datele de identificare.