Ícone do site

Compreendendo o Social Big Data na #cpbr7

big-data-social-cpbr7
O palco Gutemberg recebeu Marco Gomes, Ricardo Cappra e Tati Tosi para falar um pouco sobre o Big Data, um dos assuntos mais falados dos últimos tempos. Apesar de muita gente falando sobre o assunto, ainda há muitas dúvidas no ar e o objetivo deles era tentar esclarecer alguns pontos.
Uma das principais questões a se esclarecer é que não devemos generalizar o termo “coleta de dados”. Com tantos problemas relacionados a privacidade na internet ocorrendo, como o escândalo da NSA e tantos processos envolvendo Google e Facebook, Marco Gomes, que é fundador da Boo-Box (empresa de publicidade direcionada) afirmou que acabar com cookies não significa melhorar a privacidade dos usuários, pois eles não entendem que essa informação é anônima e ajuda diversas empresas a oferecer serviços mais personalizados.
Há uma polêmica muito grande sobre até onde estas empresas podem ter acesso aos dados. O que é público pode ser usado dessa forma? Os três participantes concordaram que sim, afinal, você pode compartilhar coisas de forma privada, o que – em teoria – impediria certos tipos de rastreio.

Informação muda conforme a fonte, é uma interpretação de dados, já que dados não mudam conforme a fonte. Dados juntos formam o conhecimento.Ricardo Cappra

Segundo Cappra, os dados não mudam, mas a informação transmitida através dele pode variar conforme a interpretação de quem as lê. Uma notícia sobre um jogo de futebol, por exemplo, pode ser transmitida de diferentes formas (passar diferentes informações), mas os dados – que são o número de gols, faltas, etc – não mudam. Com a informação (que usa os dados), você constrói o conhecimento.
O Big Data, portanto, nada mais é do que a Ciência dos Dados, é guardar o máximo de dados possível para que se possam tirar conclusões em cima. Nas palavras de Cappra, o difícil não é encontrar programa ou dados, mas saber interpretá-los. É por isto que nesta área, quem mais tem se destacado são as pessoas com trabalhos prévios em estatísticas e áreas similares.

Slide da apresentação de Ricardo Cappra. Via Slideshare

Esta área utiliza banco de dados para tirar conclusões e a qualidade deste banco está ligada diretamente a três pilares:

  1. Quantidade – Quanto de dados que você possui sobre determinado pessoa/assunto;
  2. Velocidade – O quão recente ou antiga é aquela informação? Tem histórico? É em tempo real?
  3. Variedade – Quantos tipos de informação sobre a mesma coisa você possui? Imagens, vídeos, textos, áudios?
Sair da versão mobile