Big Data: Como a inteligência de dados vai mudar o nosso dia a dia

Publicado no site Uol Educação em 10/04/2015

Link para matéria

Por Carolina Cunha

Pense na sua rotina diária. Da hora em que você acorda até a hora de dormir, mesmo sem perceber, você realiza diversas interações que geram informações sobre quem é você, o que você pensa e sobre os seus hábitos.

Nunca se gerou tanta informação no mundo como hoje. Num universo sempre conectado, produzimos um volume gigantesco e crescente de dados ao realizar todo tipo de atividade. Mas essas informações só tem valor se lhes foram atribuídas sentido. É aí que entra o Big Data.

Big Data é um termo utilizado para descrever o conjunto de soluções tecnológicas ou uma ciência feita a partir das megabases de dados disponíveis na internet, que analisam e dão sentido a essas informações.

Entre especialistas, há consenso de que esses dados apresentam três características principais, iniciadas pelos três ’Vs’: volume, velocidade e variedade — há quem já trabalhe com a ideia de mais outros três ‘Vs’, acrescentando veracidade, variabilidade valor.

A novidade com relação ao que podia ser feito antes por qualquer banco de dados é que agora as soluções tecnológicas podem lidar também com os chamados dados não-estruturados, que antes só podiam ser compreendidos quando analisados por pessoas.

Considerados um dos grandes desenvolvimentos tecnológicos em computação do século passado, os Sistemas de Gerenciamento de Banco de Dados (SGBDs), nos quais permitem que tratemos de forma eficiente milhões de contas bancárias e outros sistemas, não tem uma linguagem compatível com os dados não-estruturados.

São exemplos desses dados Tweets, posts no Facebook, vídeos, fotos, informações de geolocalização entre outros que só fazem sentido quando contextualizados. Hoje, esse tipo de dado representa a maior parte das informações geradas na internet.

E como geramos tanta informação? Ao usar aplicativos de celular ou tablet, GPS, câmeras ou interagir em canais digitais como sites, redes sociais e outros dispositivos dos mais diversos tipos, além de sensores, equipamentos médicos e outras plataformas que reúnem grandes quantidades de informação.

Os dados são armazenados em plataformas e Data Centers, que contam com sistemas e ferramentas para compilar resultados em questão de minutos, horas ou dias, combinando matemática, estatística e ciência da computação.

Com o cruzamento de informações, empresas e instituições buscam capturar, armazenar e analisar uma série de dados para apoiar decisões estratégicas, inovar e entender melhor o comportamento do consumidor ou de um determinado público ou ainda para identificar tendências de eventos de vida e oferecer um produto com antecedência, como um casal que vai se casar e recebe uma oferta para comprar um apartamento.

O Big Data também pode ser usado em informações de interesse social como no jornalismo e na análise de políticas públicas pelo Governo. Com a análise de informações, o setor público pode avaliar a qualidade de seus serviços e gerar modelos de previsão. Estatísticas de boletins de ocorrência policiais, por exemplo, podem fornecer dados sobre tendências da violência urbana e ajudar na prevenção do crime.

O mercado de Big Data se insere na economia da informação. Segundo a consultoria Gartner, em 2012, o mercado global de Big Data já movimentava 70 bilhões por ano. No Brasil, a previsão é de que a área movimente cerca de US$ 965 milhões em 2018.

No Brasil, o uso mais comum da Big Data é na venda de produtos, no relacionamento com o consumidor e no monitoramento de redes sociais por marcas que buscam avaliar o que está sendo falado na web e apontar tendências. A indústria de petróleo, em especial, também é grande criadora de dados, que vão da pesquisa sísmica inicial e monitoração eletrônica de poços até a venda de combustível na bomba dos postos de abastecimento.

Um dos impulsionadores do Big Data é a ascensão da Internet das Coisas, nome dado à rede de dispositivos conectados que se comunicam entre si. Com dispositivos integrados, diversos dados poderão ser gerados sobre meio-ambiente, cidades, energia, saúde, entre outros.

Privacidade: a grande questão do Big Data
Se o armazenamento e análise de todo e qualquer dado na internet pode ajudar a traçar comportamentos e tendências, ele também levanta outras questões: o que empresas e governos fazem com tantos dados privados? Que informação pode ser deduzida a partir de dados?

Embora seja um direito não garantindo por lei em muitos países (no Brasil o direito é inviolável e garantido pela Constituição Federal), o direito à privacidade é considerado parte essencial da liberdade, mas passou a enfrentar novos desafios com o advento da internet. Na era da informação, muita gente acreditou que estaria seguro e isolado em seu computador, e que tudo o que acontecesse entre o indivíduo e a tela seria privado, o que não se mostrou verdadeiro.

No caso do Big Data, estamos falando de quantas informações sobre você podem ser armazenadas sem a garantia de que serão utilizadas de maneira ética ou compartilhadas sem que o indivíduo concorde.

A Internet criou um contexto em que as questões de privacidade precisam ser repensadas. Se por um lado acessar informações públicas ficou mais fácil, a coleta de informações particulares, sem autorização dos indivíduos, também se tornou mais frequente. E para conter este segundo avanço, marcos, leis e normas precisam ser criadas para atender ao que acontece no ciberespaço.

Os Estados Unidos e países europeus possuem regras para a manutenção desses dados. No entanto, isso não impediu a Agência de Segurança Nacional, a NSA, de coletar e armazenar inúmeros dados de cidadãos norte-americanos e chefes de Estado de outros países. O caso foi revelado ao mundo pelo ex-agente Edward Snowden.

No Brasil, o acesso a dados particulares é um dos pontos que o Marco Civil da internet regulamenta. Ficou estabelecido que a privacidade é um direito e uma condição para “o pleno exercício do direito de acesso à internet”. O usuário tem direito à inviolabilidade da intimidade e da vida privada, “sigilo do fluxo de suas comunicações pela internet, salvo por ordem judicial”. Além disso, está previsto que as operadoras não podem fornecer “a terceiros seus dados pessoais, inclusive registros de conexão, e de acesso a aplicações de internet, salvo mediante consentimento livre, expresso e informado ou nas hipóteses previstas em lei”.

No entanto, o texto do Marco afirma que provedores de internet e sites ou aplicativos devem guardar registros de acesso de usuários — e não o conteúdo acessado — por um ano e por seis meses, respectivamente, o que ainda gera polêmica, já que para críticos, tais dados não deveriam ser mantidos.

O grande desafio do Big Data é armazenar com segurança esse “oceano de dados” e proporcionar um rápido acesso aos dados quando necessário, ou seja, a tarefa é equilibrar a balança entre capacidade de armazenamento e a velocidade de geração de dados. Será possível?

DIRETO AO PONTO

Nunca se gerou tanta informação no mundo como hoje. Num mundo sempre conectado, geramos um volume gigantesco e crescente de informações ao realizar todo tipo de atividade. Mas essas informações só tem valor se lhes foram atribuídas sentido. É aí que entra o Big Data.

Big Data é um termo utilizado para descrever o conjunto de soluções tecnológicas ou uma ciência feita a partir das megabases de dados disponíveis na internet, que analisam e dão sentido a essas informações.

Esse cruzamento de informações é usado por empresas, instituições e órgãos públicos que buscam capturar, armazenar e analisar uma série de dados para apoiar decisões estratégicas, entender melhor o comportamento do consumidor ou de um determinado público, identificar tendências de eventos de vida, avaliar a qualidade de serviços, entre outros.

Uma questão delicada sobre o tema diz respeito à privacidade. O que empresas e governos fazem com tantos dados privados? Que informação pode ser deduzida a partir de dados?

A Internet criou um contexto em que as questões de privacidade precisam ser repensadas. Se por um lado acessar informações públicas ficou mais fácil, a coleta de informações particulares, sem autorização dos indivíduos, também se tornou mais frequente. E para conter este segundo avanço, marcos, leis e normas precisam ser criadas para atender ao que acontece no ciberespaço.
Carolina Cunha

997 Comments

  1. Very good article! We will be linking to this particularly great post on our site. Keep up the good writing.