Recursos/White Papers

Opinião

Machine Learning é a mais nova arma na identificação de fraudes de ICMS

Aplicada base de dados da NF-e, tecnologia é ensina a encontrar inconsistências

Renato Matavelli *

Publicada em 26 de setembro de 2016 às 14h00

O termo Inteligência Artificial (IA) não é algo novo e já foi muito usado, principalmente em filmes de ficção científica. Mas agora voltou acompanhado de outros termos que fazem parte desta tecnologia e que de alguma forma nos aproxima do conceito, trazendo-o para o nosso dia a dia.

Um destes termos é “Machine Learning” (Aprendizado de Máquina), que de forma sucinta e simples seria um agrupamento de regras, que permite aos computadores agirem e tomarem decisões baseadas na interpretação de um universo de dados ao invés de seguir uma programação. São capazes de aprender e melhorarem com a evolução e com a exposição a novos fatos.

O termo “IA” também já foi citado algumas vezes no âmbito de seu uso pelo fisco brasileiro, tanto na auditoria como na fiscalização dos contribuintes. Sobretudo após a implementação dos primeiros projetos de escrituração digital, como por exemplo, a nota fiscal eletrônica e todos os SPEDs (Sistema Público de Escrituração Digital), os quais são transmitidos ao Fisco, ficando armazenados em uma base de dados a fim de serem auditados, cruzados e validados por até cinco anos após a entrega. Podemos imaginar o quanto a tecnologia pode evoluir nesse período...

Mas, vamos avaliar agora pela ótica do Fisco: o que fazer com essa quantidade enorme de dados recebidos e armazenados, alguns analíticos, outros sintéticos, em bases de dados separadas, informações não padronizadas e principalmente com inconsistência na qualidade dos dados, justificado entre outros motivos pela própria complexidade das obrigações acessórias?

Como exemplo deste cenário, podemos citar a base da nota fiscal eletrônica, que segundo informação do site nacional (nfe.fazenda.gov.br) possui mais de 14 bilhões de documentos autorizados. Se considerarmos uma média de seis itens por documento, teremos algo em torno de 84 bilhões de itens da NF-e na base para processamento, volume que aumentará muito se considerarmos o novo projeto NFC-e (cupom fiscal).

E é neste cenário que entra a evolução da tecnologia em todas as suas frentes. Vejamos, atualmente estão disponíveis e acessíveis equipamentos e plataformas de alta performance para processamento de Big Data e, com eles, softwares de última geração para análise de dados, com modelos estatísticos e todos os demais recursos necessários para a implementação de um projeto de “Machine Learning”.

financas_625

Mas existe algum caso real? Sim, em recente evento um caso real foi demonstrado. Trata-se de um projeto para “identificação de fraudes de ICMS”, realizado por uma Sefaz (Secretaria da Fazenda Estadual) com o apoio da consultoria de sistemas e de professores de linguística e estatística da universidade e de auditores fiscais, que conhecem o negócio (inteligência).

Em conjunto criaram um modelo para aplicar na base de dados da NF-e. Primeiro interpretando, classificando e distinguindo cada item (produto) da NF-e e separando os similares dos não reconhecidos por categoria e subcategoria. Segundo, “ensinando” o sistema a reconhecer esses novos dados e a tomar a decisão mais adequada. E, finalmente, com a base de dados mais padronizada, realizar as análises necessárias para identificar quaisquer inconsistências e fraudes de ICMS.

Pôde-se, por exemplo, avaliar em poucos minutos a classificação fiscal, o valor médio, a unidade de medida, a tributação e outras informações utilizadas pelas várias empresas para um mesmo produto, com um alto grau de assertividade, pois o sistema consegue identificar anormalidades relacionadas ao produto. Um outro exemplo foi a identificação de inconsistências no transporte de mercadorias, como refrigerantes em caminhão de 15mil litros, que na verdade era combustível.

Como vemos, não se trata apenas de automação ou processamento de grandes volumes, mas sim de uma auditoria detalhista e interpretativa, que aprenderá cada vez mais com o aumento no volume de dados e informações processadas, sendo um aliado poderoso do auditor fiscal no exercício de suas funções. O mais importante é que a tecnologia está disponível para todos, e temos que nos preparar para essa nova realidade.

 

(*) Renato Matavelli é especialista em soluções de compliance tributário



Reportagens mais lidas

Acesse a comunidade da CIO

LinkedIn
A partir da comunidade no LinkedIn, a CIO promove a troca de informações entre os líderes de TI. Acesse aqui