Strumento ufficiale per la validazione di CSV aperti della Pubblica Amministrazione italiana

Validatore CSV per la Pubblica Amministrazione

Verifica la qualità e la trasformabilità in RDF Linked Data secondo le ontologie dati-semantic-assets / schema.gov.it

Carica o incolla il tuo CSV

Trascina qui il file CSV oppure clicca per sceglierlo

Formati accettati: .csv, .tsv — max 5 MB

oppure incolla il contenuto
Il separatore viene rilevato automaticamente (virgola, punto e virgola, tabulazione, pipe).

Su quali standard si basano questi check?

I check del validatore sono una sintesi ragionata di standard internazionali, normativa italiana e buone pratiche open data. Non esiste un unico documento che li raccoglie tutti: questa tabella mappa ogni categoria al suo riferimento formale.

Check Cosa verifica Standard / riferimento Tipo
S1–S6Struttura CSV: separatore, intestazioni, colonneRFC 4180 — Common Format and MIME Type for CSVStandard formale
S7Dimensione file (soglia pratica 5 MB)Nessuno standard normativo — soglia praticaScelta pragmatica
S8–S9Encoding UTF-8, caratteri illeggibili, accentate corrotteRFC 4180 • Unicode StandardStandard formale
S10Marcatore BOMW3C CSVW — raccomanda UTF-8 senza BOMBuona pratica
S11–S12Caratteri di controllo nascosti, righe completamente vuoteRFC 4180Standard formale
C1Righe duplicateISO/IEC 25012 — dimensione UnicitàStandard formale
C2Valori mancantiISO/IEC 25012 — dimensione CompletezzaStandard formale
C3Colonna identificatore univocoBuona pratica per interoperabilità e Linked DataBuona pratica
C4Coerenza tipi per colonnaISO/IEC 25012 — Consistenza (applicazione pratica)Buona pratica
C5Date in formato standardISO 8601:2019 — Date and time formatStandard formale
C6Separatore decimale (punto, non virgola)RFC 4180W3C CSVW — xsd:decimal usa il puntoStandard formale
C7Valori statisticamente anomali (outlier)ISO/IEC 25012 — Accuratezza (applicazione pratica)Buona pratica
C8Celle molto lunghe (>500 caratteri)Nessuno standard — segnale di dati non normalizzatiScelta pragmatica
O1–O2Numero minimo di righe e colonneBuona pratica consolidata — nessuna soglia normativaBuona pratica
O3Intestazioni descrittiveLinee guida AGID Open Data v1.0 (2024)Linee guida
O4Intestazioni minuscolo con underscoreW3C CSVW — naming convention raccomandatoBuona pratica
O5–O6Riferimento geografico e temporaleBuona pratica per riusabilità — non è obbligo normativo per il CSVBuona pratica
O7–O10Caratteri speciali intestazioni, URI, booleani, commenti in codaW3C CSVW — best practice Linked DataBuona pratica
L1Identificatori UUIDW3C Best Practices for Publishing Linked DataBuona pratica
L2Mapping colonne a ontologie PA italianedati-semantic-assetsschema.gov.itStandard formale
L3Codici ISTAT per territoriVocabolario controllato ISTAT — schema.gov.itStandard formale
L4CIG e CUP negli appalti pubbliciD.Lgs. 36/2023 (Codice degli Appalti) • ANACNormativa italiana
L5URI di ontologie note nei valoriW3C Best Practices for Publishing Linked DataBuona pratica
L6Potenziale 5 stelle Open DataModello 5 stelle Open Data — Tim Berners-Lee / W3CStandard formale

I check marcati come Buona pratica derivano dall’esperienza pratica con dataset PA italiani e dalle raccomandazioni della community open data. I check Scelta pragmatica (S7, C8) non hanno base normativa: sono soglie operative scelte per utilità pratica.