Coisas básicas que deve saber para ser um bom analista de dados

teclado, pc, computador, software
Felipe Borges, Flickr, Creative Commons

Com a quantidade de informação disponível a aumentar todos os anos, a ciência de dados e analítica de negócios tornaram-se em duas das áreas com os maiores desafios da atualidade no âmbito da gestão de ativos. O campo de trabalho é inovador e cheio de oportunidades, mas também pode impor um elevado nível de stress. As gestoras de fundos estão a desenvolver equipas de análise de dados específicas com o objetivo de ter acesso a mais informação e extrair interpretações rápidas, que lhes permitam tomar decisões melhor sustentadas, que tenham impacto de forma positiva na rentabilidade dos seus fundos. Muitas dessas equipas não são formadas por gestores, mas sim por data scientists.

Para além de trabalhar no desenvolvimento técnico, que faça com que o modelo evolua e seja cada vez mais eficaz, estas equipas têm a responsabilidade de pensar em ideias de investimento e de as apresentar aos gestores, que se baseiam nesta informação para implementá-las nas carteiras. É o que faz, por exemplo, a equipa da gama CORE da Goldman Sachs AM, uma das empresas mais avançadas no desenvolvimento destes sistemas. A empresa americana conseguiu posicionar muitas das suas estratégias de gestão quantitativa baseadas na análise de dados entre os produtos mais procurados por alguns investidores, sendo o GS US CORE Equity, o GS Europe CORE Equity e o GS Global CORE Equity os que recebem mais atenção.

“A partir de um certo nível de competência técnica, o maior desafio científico de dados encontra-se em desenvolver uma mentalidade que facilite atravessar a complexidade da profissão e alcançar resultados”, afirma Eduardo Ramírez, doutorado em sistemas inteligentes e diretor analítico da cloud da Ensitech. Segundo explicam da empresa tecnológica, uma mentalidade orientada em dados, constrói-se através da prática de hábitos que ajudam os empresários a compreender melhor o trabalho dos cientistas de dados e estes a fazer um trabalho melhor:

1. Questionar tudo e ser crítico

O pensamento crítico consiste na arte de analisar e cultivar o pensamento para melhorá-lo constantemente. Ou seja, a prática de um pensamento autodirigido e autocorretivo. O objetivo de questionar tudo é o de evitar investir em iniciativas analíticas que não oferecem resultados e encontrar aquelas que ofereçam. Os atributos de uma análise de elevada clareza podem ajudar a propor as perguntas corretas. Alguns deles são objetividade, clareza, exatidão, precisão, relevância, profundidade e amplitude.

“Podemos julgar uma decisão pelo seu resultado, mas também pelo processo pelo qual foi tomada”, dizia o político e investigador Robert Rubin. A medição é de confiança? O uso das unidades é consistente? O uso de percentagens é válido? Estas são algumas perguntas que se devem fazer. “Da mesma forma que é necessário questionar os dados, também é fundamental questionar as próprias suposições quando os dados apontam para uma direção diferente”, assinala Ramírez.

2. Pensar estatisticamente

Pensar estatisticamente não significa memorizar as fórmulas da probabilidade e estatística, mas sim aprofundar no uso quotidiano os seus conceitos fundamentais para identificar as tendências e os erros mais comuns. As ideias estatísticas são abstrações da realidade, e por isso, escondem informação. Uma ideia aparentemente simples como a média é a fonte de muitas conclusões erróneas, ao assumir que as condições da média irão ocorrer ou que um indivíduo é semelhante à média da sua população.

“O pensamento estatístico é uma disciplina mental que requer um alerta constante para identificar as fontes de tendência e erro. Uma boa análise de dados requer praticar a identificação e quantificação das fontes de dúvida, mas não se deter por elas. É importante lembrar que todas as decisões que se tomam estão sujeitas a dúvida, mas apesar delas há que decidir e agir”, assinala Ramírez.

3. Lembrar sempre de que se trata de uma ciência

O pensamento científico é a disciplina mental que oferece uma metodologia para estabelecer a validez do conhecimento e avançar com solidez no entendimento dos fenómenos. Do método científico devemos ter presente que estabelecer causalidade não é banal e que as variáveis podem estar relacionadas de diversas formas que nos podem enganar com facilidade. Recentemente o pioneiro da abordagem probabilística para a inteligência artificial, Judea Pearl, lançou uma crítica incisiva ao modus operandi da data science popular, na qual se favorece a geração de modelos de previsão como caixas negras, sem aprofundar no entendimento das relações causais entre as variáveis.