As máquinas são hoje capazes de superar os humanos em tarefas complexas aparentemente elaboradas sob medida para as capacidades da mente humana, tais como o pôquer, o jogo Go e o reconhecimento visual. Ainda assim, para muitas decisões de alto risco que são candidatas naturais ao emprego do raciocínio automatizado, como, por exemplo, o diagnóstico médico e a estipulação de fianças, os especialistas costumam favorecer a experiência e a intuição em detrimento da análise estatística de dados. Essa relutância em adotar métodos estatísticos formais faz sentido: sistemas de aprendizado de máquina são difíceis de projetar, aplicar e entender. Mas furtar-se aos avanços da inteligência artificial pode custar caro.

Por reconhecer as limitações concretas enfrentadas por gestores e engenheiros, desenvolvemos um método simples de três etapas para a criação de conjuntos de regras que permitam tomar melhores decisões do tipo sim ou não. Esses conjuntos de regras podem auxiliar juízes, auditores fiscais e empregadores a decidir quem deter, quem investigar e quem entrevistar, respectivamente. Nossa abordagem oferece o desempenho do mais avançado aprendizado de máquina sem a desnecessária complexidade.

Para ver essas regras em ação, vamos considerar decisões relativas à liberdade provisória. Quando os réus se apresentam pela primeira vez ao tribunal, cabe aos juízes avaliar a probabilidade de eles se ausentarem nas audiências seguintes. Aqueles considerados de baixo risco são liberados de volta à sociedade, ao passo que os réus de alto risco são detidos. Essas decisões têm, portanto, grande importância não apenas para os réus, mas também para o público em geral. Para auxiliar os juízes a tomar essas decisões, utilizamos nosso método na criação da tabela simples, abaixo, para cálculo de risco. O risco de fuga de cada réu é calculado por meio da soma de pontos correspondentes à sua idade e ao número de audiências a que ele faltou. Um limiar de risco é então aplicado a fim de converter a pontuação em uma recomendação binária de liberdade-detenção. Por exemplo, estabelecendo 10 como limiar de risco, um réu de 35 anos de idade que tenha faltado a uma audiência somaria oito pontos (dois por idade mais seis pela audiência perdida) e obteria, assim, uma recomendação para soltura.

Uma ferramenta simples de decisão pode superar o desempenho dos especialistas
Este exemplo mede o risco de fuga de um réu por meio da soma de pontos relativos à idade e ao número de audiências perdidas. Métodos semelhantes podem ser usados para a contratação, auditoria e outras decisões tomadas com base em classificações.

Fonte: Jongbin Jung et al.

Embora simples, essa regra supera de modo significativo o desempenho de especialistas na tomada de decisões. Analisamos mais de 100.000 decisões judiciais de liberdade provisória em uma das maiores cidades do país. A adesão à nossa regra permitiria que os juízes dessa jurisdição detivessem um número 50% menor de réus sem, com isso, aumentar de maneira considerável o número daqueles que deixam de comparecer às audiências. Como isso é possível? Decisões judiciais tomadas sem o auxílio de ferramentas externas mantêm apenas uma fraca relação com o nível objetivo de risco de fuga do réu. Além disso, os juízes aplicam critérios idiossincráticos, com alguns deles liberando 90% dos réus e outros, apenas 50%. O resultado é que muitos réus de alto risco são liberados, enquanto muitos de baixo risco são detidos. A adoção de nosso conjunto de regras garantiria igual tratamento aos réus, fazendo com que apenas os de alto risco fossem detidos e, ao mesmo tempo, melhorando a eficiência e a equidade das decisões.

Esse tipo de regra de decisão é rápida, na medida em que as decisões podem ser tomadas com rapidez sem o auxílio de um computador; econômica, no sentido de que requer apenas informação limitada para chegar a uma decisão; e clara, pois expõe as bases que fundamentam as decisões. Regras que satisfazem esses critérios apresentam muitos benefícios, não apenas no âmbito judicial como para além dele. Por exemplo, regras de fácil memorização costumam ser adotadas e usadas com coerência. Na medicina, é possível que regras econômicas reduzam o número de exames pedidos, o que pode economizar tempo, dinheiro e, em situações de triagem, salvar vidas. Ademais, a clareza das regras simples gera confiança ao revelar como as decisões são tomadas e indicar os pontos em que podem ser aprimoradas. A clareza pode até passar a ser um requisito legal quando a sociedade exige justiça e transparência.

Regras simples certamente têm suas vantagens, mas alguém poderia, com razão, perguntar-se se favorecer a simplicidade não significaria sacrificar o desempenho. Em muitos casos, a resposta é, surpreendentemente, não. Comparamos nossas regras simples com complexos algoritmos de aprendizado de máquina. No caso das decisões judiciais, a tabela de risco acima teve um desempenho praticamente idêntico ao das melhores técnicas estatísticas de avaliação de risco. Ao replicar nossa análise em 22 outros domínios, constatamos que esse fenômeno persiste: regras de decisão simples e transparentes possuem, em geral, um desempenho equiparável ao dos métodos complexos e obscuros de aprendizado de máquina.

Para criar essas regras simples, fizemos uso de uma estratégia tripartite, aqui detalhada, que chamamos de selecionar-regredir-arredondar. Eis como ela funciona.

•   Selecionam-se alguns dos principais indicadores do resultado em questão — por exemplo, o uso da idade do réu e do número de audiências perdidas para determinar o risco de fuga. Em nossa opinião, o uso de dois a cinco indicadores funciona bem. Os dois fatores que usamos para decisões judiciais provisórias são indicadores bem conhecidos de risco de fuga. Quando não se dispõe de tal conhecimento específico, pode-se criar a lista de fatores por meio de métodos estatísticos padrão (seleção de variáveis stepwise por exemplo).

•   Com o uso de dados históricos, regride-se o resultado (faltar à audiência) sobre os indicadores selecionados (idade e número de audiências perdidas). Esse passo pode ser realizado com apenas uma linha de código nos programas estatísticos modernos.

   O produto da etapa acima é um modelo que atribui complicados pesos numéricos a cada fator. Tais pesos são de uma precisão excessiva para muitos dos casos de tomada de decisão. Portanto, arredondam-se os pesos a fim de obter pontuações em números inteiros.

Nossa estratégia de selecionar-regredir-arredondar produz regras de decisão que são simples. De igual importância, o próprio método para construção das regras é simples. A receita em três etapas pode ser seguida por um analista com conhecimento limitado de estatística, usando software gratuito.

Regras estatísticas de decisão funcionam melhor quando os objetivos são claramente definidos e quando se dispõe de dados sobre resultados passados e seus principais indicadores. Quando esses critérios são satisfeitos, decisões estatisticamente fundamentadas superam, em geral, a experiência e a intuição dos especialistas. Regras simples, bem como nossa estratégia simples para criá-las, põem o poder do aprendizado de máquina ao alcance das massas.
_____________________________________________________________________________
Jongbin Jung é doutorando no Department of Management Science & Engineering da Stanford University.
Connor Concannon é vice-diretor de análise de dados da Procuradoria do Condado de Nova York e doutorando no John Jay College of Criminal Justice.
Ravi Shroff é pesquisador no Center for Urban Science and Progress da New York University.
_____________________________________________________________________________
Tradução: Alessandro Barriviera

Share with your friends









Submit