Un modelo analítico para la detección de fraudes y curso online avanzado

Un modelo analítico para la detección de fraudes y curso online avanzado

La OMA se complace en anunciar que el modelo LITE DATE para la detección de fraudes con el curso avanzado de análisis de datos ya está disponible en inglés y francés a partir del 17 de junio, con el apoyo del Fondo de Cooperación Aduanera de Corea (CCF-K).

En línea con el enfoque de la OMA en el análisis de datos para fines aduaneros, el proyecto BACUDA continúa brindando algoritmos de código abierto de acuerdo con las necesidades de los miembros y las actividades de desarrollo de capacidades que lo acompañan.

¡La última incorporación es el modelo LITE DATE con el código fuente y las explicaciones incluidas en el curso Advanced Data Analytics en  Plataforma de aprendizaje electrónico.

LITE DATE, fácil y sencillo de usar

LITE DATE es una versión lite del modelo DATE desarrollado en 2020 como parte del proyecto BACUDA, en el sentido de que la estructura del modelo se ha simplificado para un uso más amplio sin perder su funcionalidad.

Después de la publicación del modelo DATE y el lanzamiento del curso intermedio, que cubría el algoritmo y el código fuente del modelo DATE, los miembros expresaron su necesidad de abordar la dificultad del modelo debido a sus requisitos de GPU, bibliotecas y técnicas de programación complejas.

En este sentido, el modelo LITE DATE se desarrolló en respuesta a esos comentarios y recomendaciones para que sea un modelo fácil de practicar,
comprender y ejecutar sin una GPU de alto rendimiento.

Mientras que el modelo DATE original tiene como objetivo detectar el fraude prediciendo la cantidad de ingresos adicionales, el modelo LITE DATE realiza solo la primera tarea entre las funciones mencionadas anteriormente.

Aspectos clave de LITE DATE

El objetivo del modelo LITE DATE es detectar transacciones fraudulentas.
Técnicamente hablando, es un modelo de clasificación binaria que tiene como objetivo clasificar la transacción dada en la clase de transacciones ilegales o en la clase de transacciones no ilegales. El clasificador XGBoost se utilizó para la clasificación binaria, que es un algoritmo de conjunto basado en árboles que utiliza el método de impulso.

Los datos utilizados para el modelo de capacitación son el conjunto de datos de declaración de aduana sintético creado y compartido por el equipo del proyecto. El conjunto de datos comprende 100 000 muestras sintéticas de datos de declaraciones de aduanas etiquetadas con los resultados de inspección sintéticos.

En términos de rendimiento, el modelo muestra un recuerdo del 79,9 % y una precisión del 20,8 % (el recuerdo es una métrica comúnmente utilizada para evaluar con precisión la detección de fraude de la IA).

De acuerdo con los resultados, se espera que el modelo pueda detectar alrededor del 80% de todas las transacciones ilícitas y reducir la cantidad de transacciones sujetas a inspección humana a un tercio mientras triplica su eficacia del 7% al 20,8%

BACUDA: apoyando a la Aduana con análisis de datos

Por la Secretaría de la OMA

Los miembros de la OMA pidieron a la Secretaría que ponga un nuevo enfoque en el desarrollo de orientación y capacidad para apoyar el uso de análisis de datos. Como una de las respuestas, se puso en marcha un equipo de expertos en el marco de un proyecto llamado BACUDA. El nombre del proyecto es un acrónimo que significa "BAND of CUstoms Data Analysts". También es una palabra coreana que significa “cambiar”. De
hecho, el objetivo del proyecto es ayudar a las administraciones aduaneras a adoptar herramientas y metodologías analíticas, un paso importante para muchos.

Los miembros del equipo BACUDA son todos expertos en datos con quienes la Secretaría ha estado colaborando durante algunos años. Son funcionarios de Aduanas a cargo de la gestión de riesgos, estadísticas y sistemas informáticos, así como economistas profesionales y científicos
de datos con formación académica en informática. Científicos de datos de varias nacionalidades del Instituto de Ciencias Básicas (IBS), el Instituto Avanzado de Ciencia y Tecnología de Corea (KAIST) y la Universidad Nacional Cheng Kung (NCKU) están involucrados en el proyecto y lideran el desarrollo de tecnología de punta. algoritmos de última generación. Sin embargo, cualquier experto en datos calificado que trabaje en administraciones aduaneras o en el mundo académico puede unirse al equipo de BACUDA.

OBJETIVO

BACUDA es un proyecto de investigación colaborativo entre Aduanas y científicos de datos cuyo objetivo es desarrollar metodologías de análisis de datos, incluidos algoritmos en lenguajes de programación de código abierto (R 1 o Python 2 ). Los métodos y algoritmos se explican y comparten en el sitio web de la OMA, donde se presentan en la "Serie 3 " y se clasifican por objetivos, lo que permite a los miembros de la OMA implementar los algoritmos en sus administraciones para analizar sus propios datos.

MÉTODOS DE TRABAJO

Para desarrollar los algoritmos, los analistas de BACUDA utilizan datos de Aduanas al nivel más desagregado, es decir, el nivel de transacciones. Dichos datos se recopilan de las administraciones aduaneras que desean apoyar el proyecto y luego se anonimizan para respetar la confidencialidad de la información proporcionada. Además, los expertos que acceden a los datos anónimos deben firmar una declaración de confidencialidad, y los resultados preliminares de cualquier investigación se entregan primero a los propietarios de los datos, quienes deben aprobarlos antes de su publicación.

El éxito potencial del proyecto radica en el acceso a una gran cantidad de datos a nivel de transacción, pero los expertos de BACUDA también trabajan con datos de código abierto. Estos datos no se limitan a datos macroeconómicos o geográficos y espaciales obtenidos de organizaciones internacionales. También incluye imágenes satelitales 4 de dominio público publicadas por algunas agencias espaciales y militares. Además, los expertos también hacen uso de algunas plataformas que permiten rastrear el movimiento de medios de transporte, como aviones, 5 así como actividades delictivas o eventos específicos 6 . Juntos, estos datos permiten obtener una mejor comprensión de las actividades y las cadenas de suministro relacionadas con la frontera.

Gracias a las herramientas de minería de texto y web scraping, los datos no estructurados pueden extraerse de páginas web o sitios de redes sociales (SNS) y luego analizarse. Por ejemplo, los datos de precios en las plataformas de compras en línea pueden cotejarse para evaluar la conformidad del valor declarado de un artículo a efectos de valoración en aduana.

RESULTADOS Y CAMINO A SEGUIR

Para desarrollar y probar los algoritmos que han diseñado, los analistas de BACUDA tienen a su disposición dos potentes ordenadores conectados a
un servidor en la nube gracias al generoso apoyo del Servicio de Aduanas de Corea. Esta instalación les permite trabajar en cualquier lugar, en cualquier momento, siempre que puedan conectarse a Internet.

El equipo del proyecto ya ha desarrollado métodos y algoritmos básicos presentados en la "Serie 3 " y clasificados según los siguientes objetivos: análisis de datos espejo con R y Shiny, previsión de ingresos aduaneros, análisis de brechas de ingresos, raspado web de datos de precios y detección de fraude aduanero mediante Aprendizaje automático con Random Forest y Python. El acceso a esta información está restringido y se invita a los lectores interesados ​​que no tengan una cuenta de usuario para el sitio web de la OMA a enviar una solicitud de acceso a la OMA si son funcionarios de aduanas o a ponerse en contacto con la Unidad de Investigación de la OMA si tienen otra función pública o privada.

En conclusión, cabe destacar que el equipo del proyecto está preparado para resolver todo tipo de enigmas para las administraciones aduaneras, no solo cuestiones relacionadas con la aplicación en sí. Podrían, por ejemplo, ayudar a desarrollar chatbots para asesorar a los importadores sobre cómo clasificar sus productos o cómo calcular los aranceles e impuestos que se aplican a sus operaciones comerciales. Otra área en la que los expertos de BACUDA podrían ser útiles es en la medición del desempeño de la Aduana mediante la extracción de texto de los comentarios que aparecen en las redes sociales, en lugar de utilizar las encuestas tradicionales.


Compartir: