Cientista de dados: o Sherlock Holmes do século XXI

Ao seguir carreira na área de ciência de dados, você desenvolverá habilidades comparáveis às de Holmes.

Por Denise Casatti

Curiosidade e capacidade de observação e de dedução apuradas, desenvolvidas ao longo de anos de estudo em múltiplas áreas do conhecimento e colocadas à prova diante dos mistérios do mundo real. Atenção aos detalhes, analisando todos os dados coletados e separando as informações importantes das que são irrelevantes para construir novos conhecimentos. Essas são as habilidades que um (ou uma) cientista de dados utiliza na vida profissional.

Qualquer semelhança com as habilidades do famoso Sherlock Holmes, não é mera coincidência, garante o professor André de Carvalho, vice-diretor do Instituto de Ciências Matemáticas e de Computação (ICMC) da USP, em São Carlos: “Para ser um cientista de dados, você não precisa ser o melhor aluno de matemática, precisa só ser curioso e gostar de olhar os dados para descobrir coisas novas a partir deles. Então, é mais ou menos como ser um Sherlock Holmes, porque você vai trabalhar com os dados usando ferramentas da ciência e tentará extrair informações importantes como, por exemplo: pistas sobre quem matou quem; sobre o que está por trás de uma doença; sobre como obter mais rendimento em uma aplicação financeira, entre tantas outras possibilidades.”

É como se um cientista de dados trabalhasse sempre carregando uma lupa nas mãos, debruçando-se nos detalhes dos dados, buscando encontrar padrões em meio ao caos, explica André. Assim, ao descobrir padrões, esse profissional descobrirá também informações valiosas e poderá produzir novos conhecimentos.

Para ajudar a visualizar esse trabalho, seguem alguns exemplos concretos: imagine um cientista de dados analisando os pedidos que você fez nos últimos anos em um aplicativo de entrega de comida. O que ele poderia descobrir? Com certeza, identificaria facilmente o tipo de culinária que mais agrada seu paladar. Poderia também encontrar um padrão em relação aos dias da semana e horários em que você costuma fazer suas solicitações e, a partir dessa análise, criar e enviar promoções para estimular seu estômago e agradar seu bolso.

Por outro lado, imagine esse mesmo cientista observando o histórico do consumo de energia, água e luz da sua residência. Com certeza, seria fácil prever quanto você irá consumir futuramente e quanto isso lhe custará. Analisando esses dados, poderia também oferecer percentuais de desconto, que aumentariam proporcionalmente conforme você alcançasse metas de redução do uso desses recursos, contribuindo com a sustentabilidade do planeta.

Outro exemplo: investigando uma série de dados que os médicos utilizam para tomar suas decisões, os cientistas podem localizar pistas relevantes que permitem chegar à conclusão sobre o tipo de enfermidade que acomete um paciente. Então, ao unir o conhecimento médico, desenvolvido ao longo de anos de experiência, com os dados disponíveis, é possível desenvolver sistemas para apoiar o diagnóstico médico, usando técnicas e ferramentas de inteligência artificial.

Enfim, pensando na infinidade de dados que temos disponíveis no mundo de hoje – estamos produzindo e fornecendo dados o tempo todo a partir do momento em que nos conectamos à web –, faltam profissionais capacitados para extrair informações úteis e valiosas desse incrível material bruto. A demanda por cientistas de dados é crescente em todos os países. Segundo André, em 2018, a estimativa do mercado era de que, apenas nos Estados Unidos, faltassem de 140 a 190 mil profissionais para atuar nessa área.

De acordo com quatro especialistas da empresa Bain & Company, a oferta global de talentos em ciência de dados está prestes a explodir, atingindo cerca de 1 milhão de pessoas este ano, contra meio milhão em 2018. Ainda assim, segundo eles, esse aumento na oferta não resolverá inteiramente a demanda: “A maioria desses talentos se formou recentemente, mas ainda há escassez de pessoas com mais experiência, necessárias para liderar e gerenciar equipes. Os Estados Unidos sofrerão com a escassez de engenheiros e arquitetos de dados, enquanto enfrentarão um possível excesso de oferta de cientistas de dados”.

Em artigo publicado pela empresa de recrutamento remoto TECLA, especializada na área de tecnologia, afirma-se que as vagas para cientistas de dados aumentaram “incríveis 650%” desde 2012, ano em que esse trabalho foi considerado “o mais sexy do século 21”. Um gráfico apresentado no artigo mostra o crescimento acelerado no número de vagas em aberto para cientistas de dados nas maiores companhias do mundo (veja a imagem).

“Em termos de oportunidade de trabalho, de acordo com o site Infomoney, a área de ciência de dados no Brasil está entre as cinco mais procuradas pelo mercado desde 2019. Então, a quantidade de oportunidades e de emprego para cientistas de dados é imensa”, diz o professor Luis Gustavo Nonato, do ICMC. Ele é o coordenador do Bacharelado em Ciência de Dados da USP, que é o primeiro a ser ofertado por uma universidade pública brasileira nessa área, cujas aulas da primeira turma terão início no ano que vem.

Arqueólogos do futuro – O professor Francisco Rodrigues, do ICMC, destaca, assim como André, que um cientista de dados precisa desenvolver diversas habilidades adicionais, especialmente de comunicação, tendo em vista que sempre atuará apoiando especialistas em diferentes campos do conhecimento. “O profissional tem que ser um bom gerenciador de projetos e também um data storytelling, já que precisará construir narrativas toda vez que for explicar aos profissionais de outras áreas como, depois de analisar os dados, conseguiu chegar aos resultados”, explica Francisco. “O diferencial da área é o uso do método científico para estudar os dados disponíveis e, só então, formular hipóteses, fazer testes e tirar conclusões”, completa o professor.

André faz referência a outra metáfora para explicar como é o trabalho desse profissional: “O mundo todo se tornou um grande sítio arqueológico, repleto de tesouros para serem encontrados. Nós, os cientistas de dados, somos os arqueólogos em busca dos artefatos preciosos que nos ajudarão a resolver os problemas misteriosos do mundo.”

Tal como nas histórias de Sherlock Holmes, os mistérios só serão desvendados quando as evidências coletadas – nesse caso, os dados – permitirem formular teorias e compreender o fenômeno investigado. “É um erro grave formular teorias antes de se conhecerem os fatos. Sem querer, começamos a distorcer os fatos para se adaptarem às teorias, em vez de formular teorias que se ajustem aos fatos”, ensina Holmes durante um diálogo com seu melhor amigo, John Watson, no conto Escândalo na Boêmia, no livro As aventuras de Sherlock Holmes, de Arthur Conan Doyle.

Novos cursos, mas a área nem tanto – André conta que a primeira vez que o termo “ciência de dados” apareceu na história da computação foi no livro Concise Survey of Computer Methods, publicado por Peter Naur em 1974. No prefácio, o autor menciona um curso que ministrou em 1968 intitulado Datalogy, the science of data and of data processes and its place in education, em tradução livre para o português, algo como Datalogia, a ciência dos dados e do processamento de dados e seu espaço na educação.

Mas, de fato, o termo só ascende à posição “sexy” que possui hoje no início do século XXI, em especial a partir de 2013, quando surgem os três primeiros cursos de graduação na área: na Northern Kentucky University, na University of San Francisco e no College of Charleston, todos nos Estados Unidos. Atualmente, já existem 300 curso de graduação em ciência de dados espalhados pelo mundo.

#ICMC #Infomoney #USP #SherlockHolmes

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

*