ANONIMIZACIÓN & SEUDONIMIZACIÓN
Enmascaramos los datos personales de forma reversible o irreversible. Eliminamos los datos, los sustituimos por asteriscos, tokens o datos sintéticos.
PROCESAMIENTO DEL LENGUAJE NATURAL
La identificación de datos por contexto nos permite obtener mejores resultados que otras herramientas que no trabajan con inteligencia artificial.
BBDD & DOCUMENTOS NO ESTRUCTURADOS
Protegemos los datos tanto en fuentes de datos estructurados como documentos no estructurados.
NYMIZ ES LA SOLUCIÓN ANTE EL RETO DE LOS DATOS
¿Cómo surgió Nymiz ?
Introducción
En la actualidad, la gestión de los datos personales y la privacidad como gran tema son un desafío para la mayoría de las organizaciones. Sin importar su tamaño, ámbito privado o público o sector, empresas, entidades gubernamentales y no gubernamentales se ven atravesadas a nivel mundial por diferentes legislaciones, normativas y estándares que requieren incorporar herramientas, conocimientos y procesos que hasta hace unos años no eran indispensables.
Por otro lado, los avances de la tecnología no solamente ayudan a las actividades productivas legítimas. Actualmente, bajo el amplio paraguas de la ciberseguridad, se impone un análisis consciente de las posibles vulnerabilidades y medidas reactivas y proactivas de protección y remediación.
En este contexto, surge Nymiz con la misión de proveer las herramientas más sofisticadas disponibles para asistir en la tarea de encontrar y proteger los datos de carácter personal en todos los repositorios posibles. Con el foco especialmente puesto en los documentos no estructurados (ofimáticos, PDFs, imágenes). Pero, también en las fuentes de datos estructurados (ej.: bases de datos relacionales).
En relación, la visión a mediano y largo plazo es que el corazón del producto cuente con la mayor cantidad de integraciones posibles para que, sin importar el flujo de trabajo que se esté llevando a cabo, haya un punto en el mismo en el cual se pueda incluir las tareas necesarias para cuidar, de la forma más exhaustiva y eficiente posible, la privacidad de las personas.
¿QUÉ APORTA NYMIZ?
EL FACTOR DIFERENCIAL
Trabajar con NLP nos permite identificar los datos personales por contexto para su posterior protección. Así, esta tecnología, permite optimizar los resultados ofreciendo un nivel de eficiencia fuera del alcance de otras herramientas que trabajan con expresiones y patrones regulares. Ej. campos de texto libre con datos personales en BBDD.
En resumen, niveles de eficiencia superiores gracias a nuestra tecnología identificamos y protegemos los datos en documentos no estructurados.
Alrededor del 80% de la información en las compañías se encuentra en fuentes de información no estructurados (documentos ofimáticos, escaneos, PDFs, imágenes etc.)
Es aplicable a cualquier industria, ya que el reto de los datos es un reto global que afecta a todo tipo de entidades independientemente de su actividad y localización geográfica.
¿Qué beneficios ofrece Nymiz en la práctica?
- Cumplimiento de los requerimientos regulatorios actuales en materia de privacidad y protección de datos en los diferentes marcos normativos vigentes; RGPD, CCPA, LGPD etc.
- Seguridad de la información. Capa adicional de seguridad para la información, que al encontrarse anonimizada o seudonimizada no dispone de valor práctico en caso de ser sustraída a través de una brecha de seguridad o expuesta por errores humanos (ej. envío de email a destinatario incorrecto).
- Analítica avanzada de datos. Obtención de información y datos de documentos y bases de datos, y capacidad de realizar analítica avanzada sobre datos seudonimizados tanto en producción como en entornos previos.
- Uso compartido de la información. Posibilidad de compartir información documental tanto de manera interna como con terceros sin comprometer la confidencialidad y la legalidad.
SU SOFTWARE EN POCAS PALABRAS
TECNOLOGÍA
Desde una perspectiva de arquitectura, este software es una aplicación web distribuida, con modelo SPA para construir la interfaz de usuario. Como backend, se ha creado un conjunto de API REST empresariales con estilo de microservicios, respaldado por varios servicios de soporte para descubrimiento, mesh, caché, gestión de tráfico y control de acceso. Se han elegido dos tipos de bases de datos, para admitir la lógica comercial regular, almacenar datos estructurados y no estructurados y aumentar el rendimiento del sistema mediante el uso de caché distribuida.
WORK FLOWS
Los diferentes flujos de trabajo del sistema implican procesamiento de datos no estructurados en tiempo real, basado en documentos y a corto plazo procesamiento por lotes. Además, estamos desarrollando la detección de datos en otros tipos de repositorios, que incluye un proceso asistido de configuración de las diferentes fuentes y su posterior búsqueda y procesamiento desatendido. Y estos flujos de trabajo se pueden administrar a través de dos modalidades: interfaz gráfica de usuario u operación a través de una API pública.
PLATAFORMAS
Está diseñado para admitir tanto el modelo SaaS como las implementaciones locales (on-premises). En este sentido, la clave para esto es la combinación de componentes en contenedores que se pueden ejecutar en plataformas en la nube y orquestadores privados (como Kubernetes, Openshift, etc.) y servicios y componentes de respaldo que se pueden encontrar en los proveedores de la nube e implantar en las instalaciones del cliente.
COMPONENTES
Las siguientes herramientas y marcos se utilizan en nuestra solución:
- Java / Spring.
- Angular.
- Bases de datos relacionales y NoSQL, incluida la caché distribuida.
- Servicios de cola de mensajes.
- Herramientas de control de versión descentralizadas.
- Containerización, para facilitar el proceso de implementación.
- Herramientas de CI / CD, para un seguimiento del estado y la calidad del código y tomar medidas correctivas cuando sea necesario.
- Herramientas de testing y testing automatizado.
DESCRIPCIÓN FUNCIONAL DEL SOFTWARE
1. Flujos principales
- Anonimización (irreversible) y seudonimización (reversible).
- Tratamiento de datos personales tanto en documentos no estructurados como en fuentes de datos estructurados (BBDD).
- Configuración personalizable (excepciones, exclusión de tipologías).
- Operativa por interfaz gráfica o por API.
2. Formatos soportados
- Documentos ofimáticos (doc, docx, xls, xlsx).
- Formato txt e ingreso de texto plano.
- Extracción por OCR asistido por IA, para imágenes (jpg, tif, png) y PDFs.
- Bases de datos relacionales (MySQL, SQL Server, Oracle, PostgreSQL).
3. Modalidades de sustitución
- Masking (blacklining, asteriscado).
- Tokenización/clasificación (PER, LOC, DAT).
- Datos sintéticos, equivalentes en tipología y extensión.
Más Información
Ayúdanos con este formulario a facilitarte la información que necesitas.