As empresas são inundadas de informações – de dados transacionais geocodificados, passando pelo tráfego de websites em tempo real, a processos de quantificação semântica de relatórios corporativos anuais. Todos esses dados e fontes de dados somente têm valor agregado se colocados em uso, o que normalmente significa que os dados são incorporados em um modelo. Por modelo, refiro-me a uma representação matemática formal que pode ser aplicada ou calibrada para se ajustar aos dados.

Leia também:

O sucesso gera desigualdade: o que os dados mostram

Os limites da análise de dados

Algumas empresas fazem uso de “modelos” sem sequer conhecê-los. Por exemplo, uma curva de juros, que compara títulos com o mesmo perfil de risco mas com datas de vencimento diferentes, pode ser considerada um modelo. Uma planilha de referências para contratação também é uma espécie de modelo. Quando você determina os elementos fundamentais para a contratação de um candidato, você está criando um modelo que pega os dados sobre um candidato e os transforma em uma recomendação para contratar ou não essa pessoa. Outras empresas desenvolvem modelos sofisticados. Alguns desses modelos são estruturais e criados para capturar a realidade, enquanto outros extraem dados utilizando ferramentas de aprendizado de máquina e inteligência artificial.

As empresas mais sofisticadas—como a Alphabet, a Berkshire Hathaway e até a CIA—utilizam modelos. Na verdade, elas fazem algo ainda melhor: utilizam modelos múltiplos combinados.

Sem modelos, entender os dados é difícil, pois eles ajudam a descrever a realidade, embora de forma imperfeita. Isoladamente, no entanto, os dados não podem recomendar uma decisão em detrimento de outra. Se você perceber que suas equipes com melhor desempenho também são as mais diversificadas pode ser interessante. Mas, para transformar esse ponto de dados em informação, é necessário conectá-lo a algum modelo existente no mundo – por exemplo, você pode supor que pontos de vista mais variados dentro de uma equipe conduzem a uma melhor tomada de decisão. Sua hipótese representa um modelo do mundo.

Embora modelos únicos possam ter um bom desempenho, conjuntos de modelos funcionam ainda melhor. É por isso que as melhores ideias, as previsões mais acertadas e as equipes de design mais eficazes utilizam conjuntos de modelos. Eles são o que eu chamo de “analistas de modelos múltiplos”.

Neste artigo, tento explicar por que modelos múltiplos são melhores que modelos únicos e descrevo três regras sobre como construir seu próprio conjunto poderoso de modelos: espalhar a atenção de maneira ampla, impulsionar as previsões e buscar conflitos.

O pressuposto em prol dos modelos

Primeiro, algumas informações prévias sobre modelos. Um modelo representa formalmente determinado domínio ou processo, muitas vezes por meio de variáveis e fórmulas matemáticas. (Na prática, muitas pessoas constroem modelos mais informais de cabeça, ou por escrito, mas formalizar seus modelos pode ser útil para torná-los mais claros e úteis). Por exemplo, a Point Nine Capital utiliza um modelo linear para classificar possíveis oportunidades em startups com base em variáveis que representam a qualidade da equipe e da tecnologia. Algumas das principais universidades, como Princeton e Michigan, aplicam modelos probabilísticos que representam candidatos por média de notas, notas de provas e outras variáveis para determinar a probabilidade de se formarem. As universidades também utilizam modelos para ajudar os alunos a adotarem comportamentos de sucesso. Esses modelos utilizam variáveis como mudanças nas notas de provas ao longo de um semestre. A Disney utilizou um modelo baseado em agentes para projetar parques e atrações. Esse modelo resultou em uma versão computadorizada do parque, inclusive com os visitantes, e simulou suas atividades para que a Disney pudesse estudar como diferentes decisões poderiam afetar o funcionamento dele. O Departamento de Orçamento do Congresso utiliza um modelo econômico que inclui estatísticas sobre renda, desemprego e saúde para estimar os custos das mudanças nas leis do sistema de saúde.

Nesses casos, os modelos organizam a profusão de dados. Todos esses modelos ajudam os líderes a explicar fenômenos e comunicar informações. Eles também impõem coerência lógica, auxiliando, assim, na tomada de decisões estratégicas e nas previsões. Não surpreende que os modelos sejam mais precisos do que a maioria das pessoas. Em competições de igual para igual entre pessoas que usam modelos e pessoas que não os utilizam, os primeiros ganham, geralmente com uma grande vantagem.

Os modelos vencem por terem recursos que os humanos não possuem. Eles podem incorporar e potencializar mais dados, podem ser testados, calibrados e comparados, além de não cometerem erros lógicos. Modelos não sofrem de viés cognitivo. (Eles podem, entretanto, introduzir ou replicar um viés humano; essa é uma das razões para combinar vários modelos).

Modelos múltiplos combinados

Embora a aplicação de um modelo seja positiva, o uso de modelos múltiplos – um conjunto – é ainda melhor, principalmente no domínio de problemas complexos. O motivo é que os modelos simplificam as coisas. Então, independentemente da quantidade de dados que um modelo incorpore, ele sempre perderá alguma variável relevante ou deixará de fora alguma interação. Portanto, qualquer modelo estará errado.

Com um conjunto de modelos, você pode compensar as lacunas em qualquer um dos modelos, individualmente. Construir o melhor conjunto de modelos requer reflexão e esforço. Como se constatou, os conjuntos de modelos mais precisos não consistem nos modelos individuais de melhor desempenho. Por isso, você não deve criar uma competição entre os candidatos a modelo e escolher os quatro primeiros colocados. Em vez disso, uma melhor opção é combinar diferentes modelos.

Durante décadas, empresas da Wall Street utilizaram modelos para avaliar o risco de investimento. O risco assume muitas formas. Além do risco das flutuações do mercado financeiro, existem outros, envolvendo, por exemplo, a geopolítica, eventos climáticos e movimentos sociais, como o Occupy Wall Street, sem mencionar os riscos de ameaças cibernéticas e outras formas de terrorismo. Um modelo de risco padrão baseado em correlações de preços de ações não incorporará todas essas dimensões. Assim, alguns dos principais bancos de investimento utilizam conjuntos de modelos para avaliar os riscos.

Mas, como deve ser esse conjunto? Quais modelos incluir e quais deixar de fora?

O primeiro parâmetro para a construção de um conjunto é procurar modelos que direcionem a atenção para diferentes partes de um problema ou para diferentes processos. Em outras palavras, seu segundo modelo deve incluir variáveis diferentes. Como mencionado acima, os modelos deixam algumas coisas de fora. Os modelos padrão do mercado financeiro deixam de lado detalhes institucionais pormenorizados sobre como as negociações são realizadas. Eles conseguem se abstrair da ecologia de crenças e regras de negociação que geram sequências de preços. Portanto, um bom segundo modelo deve incluir esses elementos.

O matemático Doyne Farmer defende modelos baseados em agentes como um bom segundo modelo. Esse tipo de modelo consiste em “agentes” orientados por regras que representam pessoas e organizações. O modelo é então analisado por computador. No caso do risco financeiro, os modelos baseados em agentes podem ser projetados para incluir grande parte desses detalhes de nível micro. Um modelo baseado em agentes para o mercado imobiliário pode representar cada domicílio, atribuindo-lhe uma renda e uma hipoteca ou o pagamento de aluguel, e também pode incluir regras comportamentais que descrevem condições em que proprietários de imóveis poderão recorrer ao refinanciamento ou se tornar insolventes. Essas regras comportamentais podem ser difíceis de acertar e, como resultado, o modelo baseado em agentes pode não ser tão preciso – pelo menos a princípio. Entretanto, Farmer e outros autores argumentariam que, com o tempo, os modelos podem se tornar bastante precisos.

Importa-nos menos se os modelos baseados em agentes superariam outros modelos padrão do que se os modelos baseados em agentes serão capazes de interpretar os sinais que os modelos padrão não puderam captar – e aí reside seu sucesso. Os modelos padrão trabalham com agregados, como os índices Case-Shiller, que medem as mudanças nos preços de imóveis. Se o índice Case-Shiller subir mais rapidamente do que a renda, uma bolha imobiliária pode estar em vias de se formar. Por mais útil que seja o índice, ele é cego às mudanças distribucionais que mantêm as médias constantes. Se o aumento da renda valer apenas para o 1% mais rico, enquanto os preços dos imóveis aumentam de forma generalizada, o índice não será diferente do que se os aumentos de renda fossem de base ampla. Os modelos baseados em agentes não seriam cegos às mudanças distribucionais. Eles perceberiam que as pessoas que ganham US$ 40 mil devem ter US$ 600 mil em hipotecas. O modelo baseado em agentes não é necessariamente melhor. Sua qualidade advém de sua capacidade de concentrar a atenção nos pontos em que o modelo padrão é incapaz de fazê-lo.

O segundo parâmetro empresta o conceito de boosting, uma técnica do aprendizado de máquina. Os algoritmos de classificação de conjuntos, como os modelos de florestas aleatórias (random forest), consistem em uma coleção de árvores de decisão simples. Uma árvore de decisão que classifica potenciais investimentos de capital de risco pode apontar que, se o mercado é grande, invista. Florestas aleatórias são uma técnica de combinação de várias árvores de decisão. E o boosting melhora a potência desses algoritmos utilizando dados para buscar novas árvores de maneira inovadora. Em vez de procurar árvores que preveem com alta precisão, mas isoladamente, o boosting busca por árvores que demonstram bom desempenho quando a floresta com as árvores atuais apresenta resultados aquém do esperado. Em outras palavras, busque um modelo que ataca as fraquezas do seu modelo atual.

Eis um exemplo. Conforme mencionei, muitos capitalistas de risco utilizam modelos de atributos ponderados para examinar as milhares de ofertas que chegam às suas mãos. Entre os atributos mais comuns estão a equipe, o tamanho do mercado, a aplicação tecnológica e o timing. Uma firma de capital de risco pode avaliar cada uma dessas dimensões em uma escala de 1 a 5 para, então, atribuir uma pontuação agregada da seguinte maneira:

Pontuação = 10*Equipe + 8*Tamanho do mercado + 7 *Tecnologia + 4*Timing

Este pode ser o melhor modelo para um investidor construir. O segundo melhor modelo pode utilizar variáveis semelhantes e pesos semelhantes. Nesse caso, ele sofrerá com as mesmas falhas do primeiro modelo. Isso significa que combiná-lo com o primeiro modelo provavelmente não conduzirá a decisões expressivamente melhores.

Uma abordagem sob o conceito de boosting consideraria dados de todas as decisões anteriores e analisaria onde o primeiro modelo falhou. Por exemplo, pode ser que as oportunidades de investimento com uma pontuação 5 de 5 na categoria equipe, tamanho de mercado e tecnologia não decolem conforme esperado. Uma razão para isso pode ser o fato de que esses mercados já estão saturados. Cada um dos três atributos – equipe, tamanho do mercado e tecnologia viável – tem boa chance de predição isoladamente, mas se alguém tiver todos os três à disposição, é provável que outros também tenham, e que uma manada de cavalos atropele o unicórnio almejado. O primeiro modelo, portanto, não se saiu bem em termos de predição nesses casos. A ideia do boosting é sair em busca de modelos que se adaptem melhor onde seus outros modelos falham.

Para oferecer um segundo exemplo, várias empresas que visitei contrataram cientistas da computação para aplicar técnicas de inteligência artificial para identificar erros de contratação anteriores. Isso é o boosting em sua forma mais pura. Em vez de tentar empregar a inteligência artificial para simplesmente superar seu atual modelo de contratação, utiliza-se a inteligência artificial para construir um segundo modelo que complementa o atual modelo de contratação. Deve-se procurar onde seu modelo atual é falho e, então, construir novos modelos para complementá-lo.

Dessa forma, o boosting e a atenção compartilham algo em comum: ambos procuram combinar modelos complementares. Mas a atenção olha para o que entra no modelo – os tipos de variáveis a considerar – enquanto o boosting se concentra no que sai – os casos em que o primeiro modelo tem dificuldades.

O boosting funciona melhor se você tiver muitos dados históricos sobre o desempenho de seu modelo principal. Às vezes não dispomos dessas informações. Nesses casos, busque o conflito, isto é, procure modelos que discordam entre si. Quando uma equipe de pessoas se confronta com uma decisão complexa, ela espera – quer, na verdade, – certo dissenso. A unanimidade seria um indício de identidade de grupo. Isso também vale para os modelos.

A única maneira em que o conjunto pode melhorar um único modelo é se os modelos forem diferentes. Para empregar uma citação de Richard Levins, a “verdade está na interseção de mentiras independentes”. Ela não está na interseção de mentiras correlacionadas. Dito de outra forma, assim como você não se cercaria de “pessoas que só dizem sim”, também não se cercaria de “modelos que só dizem sim”.

Imagine que você administre uma empresa farmacêutica e utilize um modelo linear para projetar vendas de medicamentos recém-patenteados. Para construir um conjunto, você também poderia construir um modelo de dinâmica de sistemas, além de um modelo de contágio. Digamos que o modelo de contágio resulte em vendas de longo prazo similares, mas uma absorção inicial mais lenta, mas que o modelo de dinâmica de sistemas leve a uma previsão muito diferente. Se isso ocorrer, surge aí uma oportunidade para o pensamento estratégico. Por que os modelos divergem? O que podemos aprender com isso e como devemos intervir?

Em suma, os modelos, assim como os humanos, cometem erros porque não prestam atenção a variáveis ou interações relevantes. A análise de modelos múltiplos supera as falhas de atenção de qualquer modelo individual. Ela pode lhe proporcionar uma compreensão mais aprofundada.


Scott E. Page é professor colegiado Leonid Hurwicz de Sistemas Complexos, Ciência Política e Economia na University of Michigan, e membro externo do corpo docente do Santa Fe Institute. Ele é o autor de The Model Thinker (Basic Books, 2018).

 

Compartilhe nas redes sociais!