Verifica la qualità e la trasformabilità in RDF Linked Data secondo le ontologie dati-semantic-assets / schema.gov.it
Trascina qui il file CSV oppure clicca per sceglierlo
Formati accettati: .csv, .tsv — max 5 MB
I check del validatore sono una sintesi ragionata di standard internazionali, normativa italiana e buone pratiche open data. Non esiste un unico documento che li raccoglie tutti: questa tabella mappa ogni categoria al suo riferimento formale.
| Check | Cosa verifica | Standard / riferimento | Tipo |
|---|---|---|---|
| S1–S6 | Struttura CSV: separatore, intestazioni, colonne | RFC 4180 — Common Format and MIME Type for CSV | Standard formale |
| S7 | Dimensione file (soglia pratica 5 MB) | Nessuno standard normativo — soglia pratica | Scelta pragmatica |
| S8–S9 | Encoding UTF-8, caratteri illeggibili, accentate corrotte | RFC 4180 • Unicode Standard | Standard formale |
| S10 | Marcatore BOM | W3C CSVW — raccomanda UTF-8 senza BOM | Buona pratica |
| S11–S12 | Caratteri di controllo nascosti, righe completamente vuote | RFC 4180 | Standard formale |
| C1 | Righe duplicate | ISO/IEC 25012 — dimensione Unicità | Standard formale |
| C2 | Valori mancanti | ISO/IEC 25012 — dimensione Completezza | Standard formale |
| C3 | Colonna identificatore univoco | Buona pratica per interoperabilità e Linked Data | Buona pratica |
| C4 | Coerenza tipi per colonna | ISO/IEC 25012 — Consistenza (applicazione pratica) | Buona pratica |
| C5 | Date in formato standard | ISO 8601:2019 — Date and time format | Standard formale |
| C6 | Separatore decimale (punto, non virgola) | RFC 4180 • W3C CSVW — xsd:decimal usa il punto | Standard formale |
| C7 | Valori statisticamente anomali (outlier) | ISO/IEC 25012 — Accuratezza (applicazione pratica) | Buona pratica |
| C8 | Celle molto lunghe (>500 caratteri) | Nessuno standard — segnale di dati non normalizzati | Scelta pragmatica |
| O1–O2 | Numero minimo di righe e colonne | Buona pratica consolidata — nessuna soglia normativa | Buona pratica |
| O3 | Intestazioni descrittive | Linee guida AGID Open Data v1.0 (2024) | Linee guida |
| O4 | Intestazioni minuscolo con underscore | W3C CSVW — naming convention raccomandato | Buona pratica |
| O5–O6 | Riferimento geografico e temporale | Buona pratica per riusabilità — non è obbligo normativo per il CSV | Buona pratica |
| O7–O10 | Caratteri speciali intestazioni, URI, booleani, commenti in coda | W3C CSVW — best practice Linked Data | Buona pratica |
| L1 | Identificatori UUID | W3C Best Practices for Publishing Linked Data | Buona pratica |
| L2 | Mapping colonne a ontologie PA italiane | dati-semantic-assets • schema.gov.it | Standard formale |
| L3 | Codici ISTAT per territori | Vocabolario controllato ISTAT — schema.gov.it | Standard formale |
| L4 | CIG e CUP negli appalti pubblici | D.Lgs. 36/2023 (Codice degli Appalti) • ANAC | Normativa italiana |
| L5 | URI di ontologie note nei valori | W3C Best Practices for Publishing Linked Data | Buona pratica |
| L6 | Potenziale 5 stelle Open Data | Modello 5 stelle Open Data — Tim Berners-Lee / W3C | Standard formale |
I check marcati come Buona pratica derivano dall’esperienza pratica con dataset PA italiani e dalle raccomandazioni della community open data. I check Scelta pragmatica (S7, C8) non hanno base normativa: sono soglie operative scelte per utilità pratica.