Seleccionar página

¿Alguna vez te has preguntado qué pasaría si no existiesen los documentos de identidad?

Los documentos de identidad son esenciales para acreditar nuestros datos personales y nuestra propia identidad. Si no existiesen no tendríamos derecho de identidad ni podríamos acreditar quiénes somos ni identificarnos al realizar ciertos trámites

Su importancia es considerable al ser documentos públicos, oficiales, personales e intransferibles que permiten a los mayores de edad gozar de capacidad de obrar. A pesar de su relevancia, estos documentos no siempre han sido los mismos y como muchos otros el DNI español ha sufrido diferentes cambios con el fin de adaptarse a los nuevos tiempos.

En medio de estos cambios, encontramos la introducción del sistema OCR como mecanismo de lectura de los datos de los documentos de identidad. Es posible que no conozcas nada sobre la tecnología OCR ni su aplicación en los documentos de identidad. Por eso, hemos reunido en este artículo todo lo que necesitas saber sobre esta tecnología: su funcionamiento, sus aplicaciones y como Mobbeel hace uso de ella a través de MobbScan.

 

Qué es la tecnología OCR y qué significan sus siglas

Las siglas OCR provienen del inglés y se traducen como Optical Character Recognition. Este concepto es también conocido como reconocimiento óptico de caracteres o simplemente reconocimiento de caracteres en español.

Antes de conocer qué es el reconocimiento óptico de caracteres, es preciso desglosar sus siglas para que comprendas mejor a qué hace referencia. Así:

O: Óptico

Las personas utilizamos los ojos y las conexiones neuronales para reconocer imágenes y leer documentos. Sin embargo, los ordenadores hacen uso de una cámara de escáner para reconocer documentos e imágenes, considerando ambos un simple conjunto de píxeles.

C: Caracteres

Los caracteres son unidades de información que se corresponden con símbolos o grafemas. Es decir, son las composiciones de píxeles, curvas y lineas que forman los dígitos escritos y las letras que utilizamos en el alfabeto.

R: Reconocimiento

El reconocimiento de los caracteres se lleva a cabo una vez que el escáner óptico digitaliza la imagen.

Cuando los caracteres han sido escaneados, el software OCR procede a identificar las letras y dígitos de la imagen y las convierte en palabras.

Seguramente ya te has hecho una idea de lo que es OCR pero es importante que conozcas un poco más su significado.

De este modo, la tecnología OCR es una técnica que permite reconocer caracteres en textos escritos e imágenes y transcribirlos en formato digital.

Sin embargo, para que se produzca este reconocimiento el sistema debe haber aprendido e interiorizado los caracteres que va a reconocer con antelación. En otras palabras, este sistema analiza documentos e imágenes en distintos soportes y formatos y reconoce en ellos caracteres que coinciden con la información que tiene almacenada.

 

¿Cómo funciona el sistema OCR?

El sistema de reconocimiento de caracteres se lleva a cabo a través de dos etapas:

  1. Procesado de imagen que consiste en modificar la imagen de entrada para eliminar todos aquellos elementos que puedan afectar al reconocimiento de los caracteres. Normalmente supone un proceso de umbralización (para convertir la imagen en binaria), limpieza y eliminación de ruido y, finalmente, transformaciones morfológicas para mejorar el trazado sobre todo en el caso de reconocimiento de texto manuscrito.
  2. Clasificación mediante la cual se aplican técnicas de reconocimiento de patrones. Existen numerosas aproximaciones a la clasificación de caracteres, algunas muy sencillas basadas únicamente en comparación mediante métodos geométricos o estadísticos y otras más avanzadas que utilizan las últimas técnicas en aprendizaje automático.

Aplicaciones del OCR para digitalizar documentos de identidad

La tecnología OCR puede ser utilizada por tu empresa para diferentes fines destacando aquellas actividades que incluyen la extracción y verificación de datos. A continuación, te detallo los casos de uso más representativos:

Digitalización de documento de identidad

Muchas organizaciones llevan a cabo campañas de actualización de los DNIs de sus clientes. El sistema OCR facilita este proceso de digitalización, ya que a través de la web se escanean los documentos, se validan y se extrae la información mediante OCR de una forma rápida y eficiente permitiendo ahorrar tiempo y esfuerzos.

Verificación de edad

Los menores de edad tienen prohibido el acceso a los juegos de azar y a los sites de apuestas online. Los operadores del juego tienen que controlar que los usuarios superan los dieciocho años por lo que es preciso verificar y validar la identidad de los usuarios en los procesos de alta. Para llevar a cabo este proceso, se escanea el documento de identidad y se extraen los datos necesarios haciendo uso del sistema de reconocimiento óptico de caracteres.

Extracción de la información de un documento de identidad de forma automática y digital

Dado un documento escaneado o una imagen de un documento de identidad válido, se usaría OCR para realizar la extracción de todos los campos de información junto con la foto disponible en dicho documento de identidad.

Tenemos clientes que envían los documentos de identidad escaneados a la API de MobbScan para que se recorte la imagen del DNI y se extraiga toda la información del documento por OCR para integrarla en los sistemas del cliente.

 

¿Qué tipos de documentos son automáticamente verificables mediante OCR?

En base al documento 9303 de la OACI, existen tres tipos de documentos estandarizados donde los datos están codificados por un sistema de reconocimiento óptico de caracteres.

Documento de viaje tamaño 1 (TD1)

El TD1 se utiliza sobre todo en tarjetas de identidad. El espacio en este documento es limitado por lo que la ZLM se mueve hacia atrás siendo necesario capturar anverso y reverso para extraer la información y validar este tipo de documentos. La MRZ del documento de viaje 1 posee tres lineas y cada linea tiene a su vez treinta caracteres. El país emisor puede añadir contenido adicional si lo desea en el área de la MRZ.

Documento de viaje tamaño 2 (TD2)

El tamaño del TD2 es inferior al del documento de viaje 1 y una de sus ventajas es que el MRZ se encuentra en el anverso por lo que solo es necesario escanear la parte delantera. El MRZ en este documento se compone de dos lineas con un total de 35 caracteres.

Documento de viaje tamaño 3 (TD3)

El documento TD3 es el que se utiliza en la mayoría de los pasaportes. Este documento posee toda la información relevante en el anverso por lo que solo es necesario el escaneo de esta parte del documento. Esto último agiliza el proceso de control de pasaportes y la extración de datos por parte de soluciones como MobbScan. El MRZ en este documento está formado por dos lineas y posee un total de 44 caracteres.

 

¿Cómo extrae MobbScan la información personal a través de OCR?

MobbScan extrae todos los datos que recoge un documento identificativo a través del escaneo óptico de caracteres con el fin de agilizar y optimizar la validación de la identidad.

La tecnología avanzada de Mobbeel escanea el documento detectando y leyendo en tiempo real la información que se encuentra en la zona de lectura mecánica o MRZ. Tras esto, se descodifica y se convierte en información legible por el usuario.

El escaneo se puede llevar a cabo de dos formas en función de las necesidades y exigencias del cliente. En base a lo que el cliente demande nos encontramos con:

  • Escaneo exclusivo de MRZ donde la tecnología extrae la información que incluye la zona de lectura mecánica del documento de identidad o pasaporte con el que estemos trabajando. La MRZ contiene todos los datos básicos de una persona (nombre, fecha de nacimiento, fecha de caducidad, país emisor, número de documento, etc.) y en ella existen dígitos de control que permiten asegurar que los datos que se extraen son correctos. Para ello, es esencial que el documento incluya una MRZ que cumpla con el estándar internacional 9303 ICAO.
  • Escaneo completo del documento de identificación oficial que permite extraer otro tipo de información adicional como puede ser la dirección y el equipo emisor. Este tipo de escaneo permite hacer validaciones para comprobar que los datos entre ambas caras del documento coinciden.

La tecnología OCR de Mobbeel trabaja de forma fiable y precisa con el objetivo de cumplir con la normativa Know Your Customer tanto con documentos que cumplen con ICAO 9303 (documentos de viajes) como con otros documentos que no cumplen con este estándar como es el carnet de conducir europeo.

 

Si quieres saber más sobre nuestra tecnología OCR y cómo la utilizamos en MobbScan para escanear documentos de identidad, puedes contactar con nosotros a través de nuestro formulario de contacto.

KYC
Tus usuarios siempre tendrán nombre y apellido