Anonimización
- 1450 lecturas
¡Atención: Muy Importante!
Los datasets que pueden contener información personal han sido anonimizados antes de su publicación. Desafortunadamente, los procesos de anonimización, para ser efectivos, frecuentemente deben sacrificar parte de la información y las propiedades presentes originalmente en los datos de partida, y por lo tanto es esencial que el reutilizador conozca y comprenda los efectos de la anonimización en la estructura y contenidos de los datasets para poder hacer una interpretación correcta de los datos.
Todos los datasets anonimizados en UniversiDATA están identificados de varias formas:
- Un aviso aparece resaltado en la página del dataset
- La etiqueta "Anonimizado" está asignada al dataset
- El nombre de todos los recursos anonimizados contiene el sufijo "-Anonimizado"
- A los datos se les añade una columna adicional "IMPORTANTE" con un texto y un enlace a esta página
Para conocer los detalles de cómo ha sido anonimizado un determinado dataset, debe consultar:
- El proceso general de anonimización de UniversiDATA, disponible aquí.
- Los parámetros particulares de anonimización del dataset en cuestión, que se pueden consultar en la definición que el "Núcleo Común" hace del dataset correspondiente. Interesa, en concreto:
- Cuáles son las variables pivote
- Cuáles son los bloques de coherencia
La regla de oro a recordar es: "Cualquier cálculo o agregación que implique el uso de variables que pertenezcan a bloques de coherencia distintos - excluyendo las variables pivote, cuyo uso siempre es seguro -, es potencialmente incorrecto. Cualquier otro cálculo, es correcto."
Estamos a vuestra disposición para resolver cualquier duda bien en la sección de "comentarios" de cualquier dataset, o por correo.