Dados

Os dados da sua empresa são realmente valiosos na era da IA?

Ajay Agrawal, Joshua Gans e Avi Goldfarb
23 de Fevereiro de 2018
ia

A Inteligência Artificial (IA) está chegando. Isso é o que ouvimos ao longo de 2017 e provavelmente continuaremos ouvindo ao longo deste ano. Para empresas estabelecidas, excluindo a Google e a Facebook, uma pergunta natural é: do que precisamos para sobreviver nessa transição?

Na nossa experiência, quando executivos fazem essa pergunta com relação à IA, a resposta que recebem é “dados”. Esta opinião é confirmada pela imprensa especializada em negócios. Há centenas de artigos afirmando que “os dados são o novo petróleo” — o que significa que são o combustível que vai impulsionar a economia da IA.

Se esse for o caso, sua empresa está com sorte. Você coletou todos esses dados e depois descobriu que estava sentado em uma reserva de petróleo quando a IA aconteceu. Mas quando você tem tanta sorte, provavelmente seria bom perguntar: “Somos realmente tão sortudos?”

A analogia “dados é petróleo” tem algo de verdadeira. Assim como um motor de combustão interna, a IA precisa de dados para funcionar. A IA recebe dados brutos e os converte em algo que seja útil na tomada de decisão. Quer saber o clima amanhã? Podemos usar dados passados do clima. Quer saber quanto iogurte será vendido na próxima semana? Podemos usar dados sobre as vendas passadas de iogurte. A IA é uma máquina de previsão guiada por dados.

Mas será que seus dados são úteis para a IA? Atualmente, há uma tendência de ver todos os dados como potencialmente valiosos para a IA, mas não é bem assim. Sim, dados, como petróleo, são usados no dia a dia para fazer sua máquina de previsão funcionar. Mas, provavelmente, os dados sobre os quais você se debruça agora não são esse tipo de dado. Na verdade, os dados que você tem agora, e que sua empresa acumulou ao longo do tempo, é o tipo de dado usado para construir a máquina de previsão, e não para fazê-la funcionar.

Os dados que você possui agora são dados de treinamento. Você usa esses dados como input para treinar um algoritmo. E você usa esse algoritmo para gerar previsões que informam ações.

Então, sim, isso significa que seus dados são valiosos. Mas isso não significa que sua empresa sobreviverá à tempestade. Quando seus dados são usados para treinar uma máquina de previsão, eles se desvalorizam. Eles deixam de ser úteis para esse tipo de previsão. E há apenas um número limitado de previsões para as quais seus dados serão úteis. Para continuar a analogia do petróleo, os dados podem ser queimados. Uma parte é perdida após o uso. Os cientistas sabem disso. Eles passam anos coletando dados, mas quando produzem resultados de pesquisa, eles são guardados, sem utilidade, em um arquivo ou disco de backup. Sua empresa pode estar sentada em um poço de petróleo, mas ele é finito. Na economia da IA, ele não lhe garante mais do que, eventualmente, um valor de liquidação maior.

Mesmo que seus dados possam ser valiosos, sua capacidade de capturar esse valor pode ser limitada. Quantas outras fontes de dados semelhantes existem? Se há muitos vendedores de iogurte, sua base de dados de venda e outros dados relacionados (preço, temperatura, vendas de produtos relacionados, como sorvete) dos últimos 10 anos terá valor de mercado menor do que se você fosse o único proprietário desse tipo de dado. Em outras palavras, assim como no caso do petróleo, quanto maior o número de fornecedores, menor será o valor obtido com seus dados de treinamento. O valor dos dados de treinamento é influenciado ainda mais pelo valor gerado por meio de uma precisão aprimorada de previsão. Ou seja, dados de treinamento são mais valiosos se, graças a uma precisão aprimorada de previsão, aumentam as vendas de iogurte em US$ 100 milhões, em vez de apenas US$ 10 milhões.

Além disso, o aumento no valor dos dados geralmente decorre das ações que você realiza no dia a dia da sua empresa — os novos dados que você acumula todos os dias. Novos dados permitem que você opere sua máquina de previsão após o treinamento. Também permitem que você melhore sua máquina de previsão por meio de aprendizado. Embora 10 anos de dados sobre as vendas passadas de iogurte sejam valiosos para a formação de um modelo de IA capaz de prever vendas futuras de iogurte, as previsões reais usadas para gerir a cadeia de suprimentos requerem dados operacionais de forma contínua. E esse é um ponto importante para empresas estabelecidas.

Uma startup de IA que adquire uma coleção valiosa de dados sobre vendas passadas de iogurte pode treinar um modelo de IA para prever vendas futuras. Porém, não poderá usar esse modelo para tomar decisões, a menos que a empresa obtenha dados operacionais contínuos para o aprendizado. Ao contrário das startups, grandes empresas geram dados operacionais todos os dias. Isso é um trunfo. Quanto mais operações, mais dados. Além disso, o dono da operação pode, de fato, usar as previsões. Ele pode usar as previsões para melhorar sua operação futura.

Na economia da IA, o valor de seus dados acumulados é limitado ao benefício único obtido com o treinamento de seu modelo de IA. E o valor dos dados de treinamento, como o petróleo ou qualquer outro insumo, é influenciado pela oferta — vale menos quando mais pessoas o possuem. Em contraste, o valor de seus dados operacionais contínuos não se limita a um benefício único, mas proporciona um benefício permanente para operar e melhorar ainda mias sua máquina de previsão. Então, embora muito se diga que os dados são o novo petróleo, dados históricos acumulados não são o ‘x’ da questão. Mas, podem ser aquilo que conduz ao ‘x’ da questão. Seu valor para as perspectivas futuras de negócio é baixo. Mas, se você conseguir encontrar formas de gerar um fluxo de dados novo e contínuo que ofereça uma vantagem de desempenho em termos do poder preditivo da sua IA, isso lhe dará alavancagem sustentável quando a IA chegar.
—————————————————————————————
Ajay Agrawal é professor da cátedra Peter Munk de Empreendedorismo da Rotman School of Management, na Toronto University, e pesquisador associado do National Bureau of Economic Research, em Cambridge, Massachusetts. É fundador do Creative Destruction Lab, cofundador da The Next AI e da Kindred. É coautor de Prediction Machines: The Simple Economics of Artificial Intelligence (Harvard Business School Press, abril de 2018).
—————————————————————————————
Joshua Gans é professor de gestão estratégica na Rotman School of Management, da Toronto Universitiy. É coautor de Prediction Machines: The Simple Economics of Artificial Intelligence (Harvard Business School Press, abril de 2018). Seu livro The Disruption Dilemma foi publicado pelo MIT Press.
—————————————————————————————
Avi Goldfarb é professor da cátedra Ellison de Maketing na Rotman School of Management, da Toronto Universitiy. É também pesquisador associado no National Bureau of Economic Research, diretor de dados da Creative Destruction Lab, e editor chefe da Marketing Science. É coautor de Prediction Machines: The Simple Economics of Artificial Intelligence (Harvard Business School Press, abril de 2018).

Compartilhe nas redes sociais!