Tecnologías abiertas en la prevención contra el Fraude

0

El Plan de Prevención del Fraude Fiscal permitió recaudar 8.119 millones de euros en 2009

por Luis Flores
CEO Open sistemas

  • Dentro de los objetivos de la Agencia Española Tributaria se encuentra, sin lugar a dudas, la gestión y prevención del fraude fiscal. Por ello, la AEAT viene desarrollando en los últimos años un plan de Prevención del Fraude Fiscal con el que se ha conseguido recaudar más de 35.500 millones de euros. En 2009 la deuda media por contribuyente inspeccionado alcanzó los 174.000 euros. La cuota defraudada por actuaciones remitidas a la fiscalía por delito fiscal fue de 784 millones de euros el año pasado.

La Agencia Tributaria recaudó 8.119 millones de euros en 2009 por la aplicación del Plan de Prevención del Fraude Fiscal, un 0,8 ciento más que el año anterior. Desde que éste entró en vigor en 2005 se han recaudado 35.540 millones de euros por actuaciones de control y prevención del fraude. Este Plan se ha visto recientemente actualizado con la aprobación del Plan Integral de Prevención y Corrección del Fraude fiscal, laboral y de Seguridad Social, que amplía la colaboración entre los organismos públicos encargados del control del fraude para mejorar su eficacia y da respuesta a los cambios en la tipología del fraude a consecuencia de la crisis económica, especialmente a la economía irregular y al trabajo no declarado.

En 2009, la recaudación directa por actuaciones de control, incluyendo la minoración de devoluciones, ascendió a 7.008 millones de euros, un 7,5 por ciento más que en 2008. La recaudación por el efecto inducido, las regularizaciones voluntarias, fue de 1.111 millones de euros, un 27,7 por ciento menos que en 2008, afectadas por el aumento de las peticiones de aplazamiento.

 

Control del fraude más grave

La Agencia Tributaria continuó poniendo el énfasis y sus mejores recursos en controlar el fraude más grave y complejo. En 2009 fueron inspeccionados 25.826 contribuyentes, un 3,1 por ciento más que en 2008. La deuda liquidada por estas actuaciones aumentó un 21,5 por ciento, pasando de 3.720 millones de euros a 4.518. El 2009 supuso un aumento en la deuda media del 17,8 por ciento, pasando de 148.487 euros a 174.940 euros por cada contribuyente inspeccionado.

La deuda liquidada es aquella deuda descubierta y regularizada mediante expedientes de inspección y control de la Agencia Tributaria en el transcurso de un ejercicio, que suele ingresarse en ejercicios posteriores.

Además de los expedientes administrativos finalizados por la Agencia Tributaria, muchas de las investigaciones realizadas pusieron de manifiesto la posible comisión de un delito fiscal. En estos casos la actuación se remite a la fiscalía. En 2009 la Agencia Tributaria denunció un total de 738 casos, con una cuota defraudada de 784 millones de euros, un 56,7 por ciento más que en 2008. La cuota media defraudada por los delitos fiscales denunciados fue en 2009 de 1,06 millones de euros, un 44,2 por ciento más que en 2008, cuando fue de 740.000 euros.

Billetes de 500 euros

Las investigaciones sobre la utilización de grandes cantidades de efectivo con billetes de alta denominación han dado como resultado hasta 2009 unas cuotas liquidadas por un total de 742 millones de euros. De estos, 346,5 millones son por declaraciones extemporáneas, 281,8 millones por deuda incoada y 113,7 millones por delitos denunciados. A partir de 2010 la Agencia Tributaria comenzará a recibir la información proveniente de entidades financieras de todos los movimientos en efectivo de más de tres mil euros, independientemente del tipo de billete utilizado.

Control del fraude sobre el sector inmobiliario

En 2009 se inspeccionó a 6.959 contribuyentes de este sector, un 10,2 por ciento menos que en 2007, pero la deuda descubierta se incrementó un 10,9 por ciento respecto al año anterior con 1.458 millones de euros.

Garantías para el cobro de la deuda tributaria

El Plan de Prevención propuso la mejora del cobro de la deuda descubierta en las actuaciones de lucha contra el fraude fiscal. En ese sentido, las actuaciones para garantizar el cobro de las deudas crecieron un 40 por ciento, llegando en 2009 a 1.861. Estas actuaciones se realizan de manera coordinada entre los departamentos de Inspección y Recaudación con el fin de evitar vaciamientos patrimoniales por parte de los defraudadores. El importe total cobrado ha alcanzado los 1.242 millones de euros, un 105 por ciento superior a 2008.

Asistencia al contribuyente

Como en años anteriores, la Agencia Tributaria ha destinado gran parte de sus esfuerzos a incrementar la asistencia al contribuyente como herramienta de prevención. En 2009, una de cada tres declaraciones (el 66,3 por ciento) se presentó por vía informática y telefónica. Durante 2009 la página web de la Agencia Tributaria recibió 339 millones de visitas.

Lucha contra el narcotráfico

Por último, la labor de lucha contra el narcotráfico desarrollada por el departamento de Aduanas e Impuestos Especiales, ha permitido la aprehensión de más 137 toneladas de hachís y 16,7 toneladas de cocaína. Se ha producido un descenso del 35 por ciento en hachís y un 24 por ciento en cocaína respecto a 2008 gracias a una mayor presión nacional e internacional sobre las rutas tradicionales del narcotráfico, que se ha concretado en un aumento del 44 por ciento en el número de actuaciones.

 

La Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude

El Plan de Prevención del Fraude Fiscal propone, entre sus medidas organizativas y de coordinación interna e integración funcional, la creación de una Delegación Central que permita el control coordinado de los grandes contribuyentes, en el marco de una apuesta decidida por la coordinación e integración entre las áreas funcionales de la Administración tributaria. Esta Delegación tendrá por objeto, en unos casos, una mayor integración entre los controles inspectores realizados por los órganos de la inspección financiera y tributaria y los de la inspección de aduanas e impuestos especiales cuando se trate de contribuyentes sometidos a estos últimos impuestos, para evitar la realización de actuaciones independientes y descoordinadas entre sí; y, en otros, el refuerzo de la coordinación entre las áreas liquidadoras y de recaudación, para que las actuaciones de control se dirijan desde su inicio no sólo a la regularización del incumplimiento fiscal, sino también al cobro efectivo de la deuda que se vaya a liquida.

En esta línea, el Plan indica que la existencia de diversas Oficinas Nacionales en la Agencia Estatal de Administración Tributaria, que dependen orgánica y funcionalmente de los respectivos Departamentos de la Agencia y que no cuentan con normas de integración o de coordinación específicas, no permite lograr la eficacia que sería deseable en el tratamiento integral de los grandes contribuyentes; eficacia que podría lograrse con una Delegación Central que asumiese sus competencias, sin más excepciones que las que en el ámbito de gestión tributaria se refieren a la gestión y el control de contribuyentes que no puedan considerarse como grandes o de ámbito nacional.

En definitiva, el Plan abogó por la creación de una Delegación Central de Grandes Contribuyentes que desarrolle las funciones hasta aquel momento atribuidas a las Oficinas Nacionales de Inspección de los Departamentos de Inspección Financiera y Tributaria y de Aduanas e Impuestos Especiales, a la Oficina Nacional de Recaudación y, en su caso, a la Oficina Nacional de Gestión Tributaria, adscribiendo a dicha Delegación Central los contribuyentes que se encuentran adscritos a las Oficinas Nacionales de Inspección indicadas, si bien puntualiza que deben revisarse los criterios de adscripción actuales teniendo en cuenta no sólo el volumen de operaciones de los contribuyentes sino también su implantación territorial.

Recogiendo esta propuesta, entre los compromisos de la Agencia Estatal de Administración Tributaria para 2005 se ha estableció que durante ese año se crearía la Delegación Central de Grandes Contribuyentes, la cual desarrollará las funciones hasta ahora atribuidas a las Oficinas Nacionales mencionadas respecto de los contribuyentes que se le adscriban.

Por otra parte, en el Plan de Prevención del Fraude Fiscal se hace hincapié en la necesidad de reforzar las actuaciones de investigación y se dedica especial atención al fraude en el sector inmobiliario, las tramas organizadas en el IVA e Impuestos Especiales, el blanqueo de capitales, la ingeniería fiscal, las operaciones con paraísos fiscales, los abusos en la aplicación del régimen de módulos y el fraude en la fase de recaudación.

El éxito de varias de las medidas incluidas en el Plan está ligado a la existencia de técnicas y herramientas informáticas adecuadas, lo que supone la aplicación de modernas tecnologías y métodos que permitan inferir nuevos patrones de fraude para superar así la tradicional limitación de trabajar exclusivamente a partir de los datos declarados por los contribuyentes, que permite la pervivencia de ‘zonas de sombra’ de difícil detección. La efectiva aplicación de estas medidas requería de una previa reestructuración del Departamento de Informática Tributaria que permitiese acometer una buena parte de los desarrollos informáticos requeridos por el Plan, por lo que se proponía la creación de una Subdirección en el Departamento de Informática Tributaria de apoyo a la investigación y prevención del fraude, mediante el desarrollo de aplicaciones informáticas basadas en las nuevas tecnologías.

Esta Subdirección realizará funciones de apoyo informático a la investigación y prevención del fraude, mediante el desarrollo de aplicaciones informáticas basadas en las nuevas tecnologías, de acuerdo con lo que se determine por resolución del Presidente de la Agencia Estatal de Administración Tributaria.

Desafíos en el entorno de la Subdirección Gral. de Tecnologías de Análisis de la Información e Investigación del Fraude
La Agencia Tributaria tiene un volumen inmenso de datos de contribuyentes. No sólo datos fiscales de entidades físicas o jurídicas individuales, sino de movimientos bancarios, facturas emitidas, apuntes contables, relaciones societarias, familiares, de cotitularidad… Esta información excede los 100 Terabytes en total.

Para lograr detectar casos de fraude complejos, los inspectores necesitan cruzar los datos de distintos orígenes, analizar cantidades singulares y totales, y poder ir reduciendo el círculo de búsqueda a través de filtros complejos. Todo este análisis debe de hacerse en tiempo real y con una interfaz unificada.

Todo este conjunto de datos requiere de importantes recursos tecnológicos de cara a su correcta gestión y administración. De un lado, recursos hardware para la gestión, en el sentido de máquinas de alta capacidad de almacenamiento y procesamiento.

A nivel de sistemas se requieren altos niveles de seguridad y confidencialidad en el acceso a la información, por lo que las necesidades en la capa de servicios son importantes. En un nivel más alto estos entornos buscan flexibilidad, capacidad de integración y adaptabilidad a nuevos cambios y requerimientos.

Todo estos hechos hacen de este tipo de entornos el caldo de cultivo ideal para la incorporación de plataformas GNU/Linux y, en líneas generales, tecnologías de código abierto.

Dentro de este marco, el conjunto de aplicaciones desarrolladas y soportadas por la Subdirección permiten analizar y extraer resultados e información de los datos disponibles en esta materia.

  • Plataforma lógica

Para ello cuenta con una plataforma lógica que probablemente no tenga equivalente en nuestro país en cuanto a tamaño y capacidad. Como sistema operativo se utiliza SuSE Linux Enterprise Server 10.2.

En la plataforma descrita se ejecutan, por un lado, las necesarias instancias del almacén de datos Sybase IQ, y, por otro, las distintas aplicaciones desarrolladas en la Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude que, a su vez, hacen uso de los servicios de Sybase IQ. Entre éstas cabe distinguir entre las que se corresponden con servicios comunes u horizontales (Motor Zújar) y las diferentes aplicaciones verticales, que hacen uso de las anteriores y proporcionan servicios de análisis de la información y de minería de datos.

Se proponía la creación de una Subdirección en el Departamento de Informática Tributaria de apoyo a la investigación y prevención del fraude, mediante el desarrollo de aplicaciones informáticas basadas en las nuevas tecnologías

La plataforma lógica, como se ha indicado, se basa en la base de datos orientada a columnas Sybase IQ en la que se manejan más de 10.000 tablas de más de 15.000 columnas, 4.500 millones de registros y 1,3 TB de tamaño. A título informativo puede indicarse que los sistemas de análisis de la información de la AEAT manejan datos de 10 ejercicios, con más de 200 conceptos, 30.000 dimensiones, 50 millones de contribuyentes y 150 millones de relaciones, más de 5.000 millones de registros y 2 billones de celdas. Se considerará requisito imprescindible para que un candidato sea aceptado que acredite su experiencia en las labores para las que se presente en instalaciones análogas a las aquí descritas.

Los distintos lenguajes empleados para el desarrollo de las aplicaciones anteriores han sido: C, C++, Java, Perl, Python, Bash Shell Script y se han utilizado diversas herramientas de desarrollo, tales como: gcc, gdb, Autotools, Eclipse…, y sistemas de control de versiones tales como CVS y Subversion.

Asimismo, en algunas de las plataformas descritas se utilizan distintas tecnologías de virtualización.

  • Plataforma física

A nivel físico son requeridos importantes sistemas con los que procesar esta gran cantidad de información. Esta estructura física está formada por nodos IBM pSeries 595, 690 y 595 POWER 6, xSeries 3950, xSeries 455, pSeries 510, junto con diferentes sistemas de almacenamiento externo, robots de cintas y cabinas de disco también IBM acaparan las funciones de almacenamiento y backup de esta ingente cantidad de información.

Unido a ellos un clúster auxiliar basado en tecnología compatible Power 4+ con 8 Blade Centers de IBM con 14 blades de 2 procesadores Power 970, diferentes sistemas de virtualización y variada tecnología de comunicación permite separar y gestionar adecuadamente estos entornos.

En su conjunto, el entorno constituye un enorme ecosistema orientado al análisis e investigación en la lucha contra el fraude.

  • Equipo de trabajo muy especial

Dado el carácter esencial del elemento personal para el desarrollo y mantenimiento de los sistemas y aplicaciones que se llevan a cabo en el ámbito de la AEAT y la importancia de un conocimiento profundo de los entornos tecnológicos especificados, se requiere un equipo especialmente orientado a estas labores, formado por diferentes grupos de trabajo.

El grupo de administración de sistemas se orienta a las funciones administración, explotación y supervisión de los sistemas.

Otro grupo de personas se enfoca hacia la Extracción, Transformación y Carga de la información. Y un tercer grupo lo conforman los administradores del sistema de gestión de base de datos Sybase IQ, caracterizados por su dedicación estable a las funciones relacionadas con la base de datos Sybase IQ.

El grupo del motor lo manejan diferentes desarrollos de una complejidad elevada que intermedian entre los diferentes sistemas de gestión de base de datos y los entornos cliente que requieren de la información almacenada.

El grupo del cliente, finalmente, se dedica de forma estable a las funciones relacionadas con la explotación y el acceso a la información por parte de los usuarios finales, habitualmente inspectores y personal interno de la propia Agencia Tributaria.

  • Resultado

El resultado de todo esta combinación de fuerzas es el sistema actual de almacenamiento, motor y explotación de datos desarrollado por la propia Agencia.

El núcleo del sistema es una solución en dos capas, con un motor OLAP híbrido ad-hoc para las necesidades de la Agencia. Este motor utiliza una base de datos y aprovecha las características de elevada RAM de la máquina (512 Gigabytes) para construir cachés en RAM.

Se utiliza Sybase IQ como sistema de base de datos por sus características de orientación a columnas y capacidad de compresión de datos. Sobre este motor se desarrolla un middleware en C++ utilizando Qt y DBus para comunicación entre procesos y procedimientos remotos. Un diseño complejo de más de 15 procesos que se comunican entre sí permite el crecimiento modular, tolerancia a fallos y mantenimiento en caliente. Dicho middleware exporta una interfaz SOAP que es consumida por los programas de consulta.

La primera versión funcional de Zújar IV se puso en producción el pasado mes de junio de 2009. Desde entonces se han lanzado varias versiones nuevas con más funcionalidad. El nuevo Zújar IV permite a los inspectores trabajar con tablas de miles de millones de filas, cruzar datos entre tablas y definir filtros. Todo esto se hace de forma on line con tiempos de respuesta medios inferior a un segundo.

Actualmente se está trabajando en la solución que permita utilizar tablas con más de 20.000 columnas sin perjudicar el rendimiento.

Conclusiones

Como se pone de manifiesto, un entorno crítico de estas características y con este tipo de necesidades supone un ámbito muy apropiado para el desarrollo de soluciones basadas en codigo abierto y GNU/Linux.

A nivel de sistema se requiere como necesidad obtener el máximo partido de una arquitectura hardware excepcional. Por ello, las posibilidades que Linux ofrece, en relación a sus capacidades de parametrización del núcleo, permiten obtener el máximo rendimiento de los sistemas existentes y ajustar las configuraciones hasta el más alto nivel.

Por encima de esa capa se requiere fundamentalmente integrabilidad, elementos como el servidor web Apache, soluciones de web services open source, el gestor de servlets Jakarta Tomcat… aportan el nivel adecuado para obtener los mejores resultados de interconexión entre los diferentes sistemas del entorno.

Otro aspecto esencial que el uso de código abierto aporta en un entorno de estas características es la reducción de costes de licencia que llega a implicar un elevado uso de estas soluciones. En primer lugar, porque este coste en sus equivalentes herramientas privativas llegaría a ser muy elevado en entornos tan pesados en términos de número de procesadores, discos, etc. En segundo lugar, por la propia sencillez en la gestión, que permite escalar las soluciones, probar nuevas opciones o modificar rápidamente su funcionamiento sin incurrir en las necesidades de valoración de coste de licencia para cada cambio.

Unido a lo anterior hay que citar las necesidades que sobre la seguridad y la confidencialidad tienen este tipo de entornos críticos. En la medida en que estas soluciones admiten el acceso a las fuentes, sus errores son más rápidamente solventados que los homólogos privativos y se pueden modificar libremente aportando un plus de adaptabilidad a las necesidades de seguridad existentes.

En definitiva, nos encontramos con un entorno amplio y complejo, donde se detecta un enorme uso de plataformas GNU/Linux y soluciones de código abierto y donde, precisamente, estas soluciones muestran muchas de sus ventajas y factores clave de éxito desde variados puntos de vista y en diferentes niveles, aportando una solución integral y avanzada en términos de innovación.

 

Las soluciones de código abierto en este entorno: SuSE, Zabbix y Tomcat

– Configuración y administración del sistema operativo SuSE Linux Enterprise Server, software de base y utilidades de la plataforma HPC, para un óptimo funcionamiento del clúster.

– Mantenimiento correctivo, adaptativo, evolutivo y perfectivo del código de la aplicación requerido para la ejecución distribuida de los procesos.

– Administración, control y monitorización del clúster (Ganglia ).

– La monitorización de la actividad de los nodos del clúster deberán permitir el análisis global y el análisis por tipo de aplicación y tipo de consulta.

– Los sistemas de administración, control y monitorización incorporarán el establecimiento de procedimientos automáticos, tanto preventivos como correctivos, para los supuestos de inactividad y sobrecarga de los nodos.

– Gestión de la configuración de los nodos del clúster (CSM).

– Administración, configuración y optimización del sistema de ficheros distribuidos.

– Adaptación y mantenimiento de la imagen para integrar nuevos servicios y desarrollos.

– Adaptación y mantenimiento del código de aplicación desarrollado en la Subdirección incluido en la imagen del kernel de Linux, que permite la ejecución distribuida de las nuevas aplicaciones y procesos de análisis de la información.

– Adaptación y mantenimiento del núcleo distribuido de la base de datos multidimensional Zújar.

– Configuración y mantenimiento de la infraestructura de distribución de procesos actualmente existente, desarrollada en C.

– Configuración y mantenimiento de los procesos de arranque remoto.

– Gestión, configuración y monitorización de la red de comunicaciones de clúster.

– Elaboración de informes y estadísticas de actividad del clúster, incluyendo mediciones de ancho de banda de la red de comunicaciones, con la periodicidad que se determine por los responsables de la Subdirección.

– Todas las mediciones y gráficos asociados serán visualizables.


Zabbix

– Realización de una imagen del kernel de Linux basada en el sistema operativo SuSE SLES 9.0 SP3 y con la parte cliente del sistema de ficheros distribuido GPFS (Global Parallel Filesystem) integrada, que haga posible el arranque remoto del elevado número de nodos que configuran el clúster HPC (sistema de alto rendimiento basado en la arquitectura pSerires de IBM con nodos JS-20).

– Inclusión de dicha imagen del código de aplicación desarrollado en la Subdirección que permite la ejecución distribuida de las aplicaciones y procesos de análisis de la información.

– Desarrollo del procedimiento de actualización y/o modificación de la imagen para integrar nuevos servicios cuando sea necesario, ya sean de monitorización, gestión o aplicaciones propietarias.

– Instalación y verificación de la imagen utilizando un Blade Center (14 nodos JS20) como prototipo.

– Revisión de todos los nodos JS20 (112 en total) del clúster a nivel físico: arranque, interfaces de red, etc.

– Instalación y puesta en marcha del clúster completo con todos los nodos y las aplicaciones corriendo en modo distribuido con él.

– Chequeo y verificación del clúster, incluyendo el arranque remoto, verificación de anchos de banda en los nodos y medidas de rendimiento de las aplicaciones de análisis ejecutándose sobre el clúster.

Compartir.

Responder