Dados… e cada vez, mais dados!

Inegável que vivemos a era dos dados, estão em nossas vidas de diversas maneiras e formas. Torna-se mais evidente quando vemos escândalos envolvendo vazamento de sites com senhas e dados usuários. Temos como exemplo Wikileaks e o caso mais recente, o Facebook, qual gerou um clima político desconfortável para os envolvidos.

Eventos como estes citados mostram como os dados interessam às empresas de muitas formas.

A questão hoje é prover meios de como processar, armazenar, transformar, analisar e extrair conhecimento útil, assim agregar valor ao negócio e dar vantagem estratégica perante seus concorrentes de mercado. Cada fonte de dados fala a sua própria língua, outras entendem mais de uma, porém se for oferecido a você leitor um ecossistema que seja poliglota de nascença?… Ficou interessado, continue lendo.

A motivação é promover a integração de diversos bancos de dados, qual podem ser relacionais ou não relacionais, orientado à linhas, colunas, a documentos ou nenhuma das opções anteriores juntos em um único dataset. Isto proporciona diversas combinações, as quais antes não era possível. Promovendo a interação dos dados, inserindo o Data Driven na Gestão da Informação e Conhecimento, onde as tomadas de decisões são orientadas em dados.

Sim, estamos falando também de aplicação dos conceitos big data, small data e smart data, porque não importa o tamanho dos seus dados, é necessário seguir livre de preconceitos, pois todo dado tem seu valor e se você discorda é provável que não fora ainda encontrado um contexto adequado para ser aplicado.

Deixo duas frases para ser consideradas quando se pensar em dados:

“Se você torturar os dados o tempo suficiente, eles confessarão”

Ronald Coase, Economista

“Sem dados você é apenas outra pessoa com uma opinião”

William Edwards Deming, estatístico, palestrante e autor

 

Seguimos então arranhando a superfície dos dados em suas fontes a fim de capturar o máximo possível. Promover meios de infraestrutura e desenvolvimento de modelos analíticos é o novo desafio, assim aos que abraçam esse mundo novo dos dados deparam-se com uma infinidade de ferramentas e linguagens de programação. Chega a ser intimidador o vasto campo de exploração aos desavisados.

Continuo escrevendo a fim de desbravar o requisito mínimo de nosso ecossistema, a computação distribuída, que possibilita a construção de um cluster flexível(conjunto de computadores onde seus recursos são somados como uma única unidade) que irá tomar forma no decorrer de sua utilização Isto possibilita ampliar seu poder de processamento e armazenamento com um simples clique de mouse.

Quando falo sobre o assunto, muitos me perguntam o valor para construir esse ecossistema e ficam impressionados com a resposta: “Custo Zero!”. Opa, agora você ficou interessado! Mas como nada nessa vida vem de graça, desculpe a brincadeira, o custo consiste em duas camadas, conhecimento e hardware… mas e os softwares?

Tudo open source, código aberto, mas se precisar de suporte, existem diversos distribuidores que podem cuidar do assunto, assim podemos começar a construção sem os problemas de licenciamento quais envolvem custos.

Vale lembrar que essas soluções de softwares são utilizados em larga escala por empresas como Netflix, Facebook, Linkedin, Google, Uber e Airbnb. As tecnologias estão disponíveis para serem aplicadas em seu data center e também nas maiores provedoras de computação em nuvem como Amazon, Google, Digitalocean, Oracle.

A proposta é começar pequeno, porém escalável de forma sustentável para proporcionar a melhor das experiências para as áreas de TI e de Business Intelligence.

Após essa pequena introdução ao mundo dos dados, vem a pergunta que faço a você leitor:

 

“Como estão seus projetos voltados à corrida pelo consumo dos dados?”.

 

Tecnologia e inovação , 1 Comment

Deixe um comentário

1 Comentário em "Dados… e cada vez, mais dados!"

Notify of
avatar

Sort by:   newest | oldest | most voted
Felipe Maia
Visitante
Felipe Maia
2 meses 29 dias atrás

Sem falar nas possibilidades do futuro da internet das coisas, ipv6 e o mar de dados de todas as “coisas” que irá gerar. Bom texto Heverton!

wpDiscuz