Estes casos foram obtidos de diversas fontes em pesquisas por sites da internet.
Ao procurar eventuais relações entre o volume de vendas e os dias da semana, o software de data mining do Walmart apontou que, às sextas-feiras, as vendas de cervejas cresciam na mesma proporção que as de fraldas. Uma investigação mais detalhada revelou que, ao comprar fraldas para seus bebês, os pais aproveitavam para abastecer o estoque de cerveja para o final de semana. Assim, foi identificado que homens casados, entre 25 e 30 anos, compravam fraldas e/ou cervejas às sextas-feiras à tarde no caminho do trabalho para casa. A rede americana Walmart otimizou as suas gôndolas nos pontos de vendas, colocando as fraldas ao lado das cervejas. Resultado: o consumo cresceu 30%. Este se tornou um caso clássico amplamente utilizado como exemplo de sucesso do uso de data mining, passando a ser denominado “princípio de fraldas e cerveja”. A Walmart possui um dos maiores DWs do mundo.
É possível detectar fraudes, cortar gastos ou aumentar a receita da
empresa com a ajuda da mineração de dados. O Bank of America usou essas
técnicas para selecionar, entre seus 36 milhões de clientes, aqueles com
menor risco de dar calote em um empréstimo. A partir desses relatórios,
enviou cartas oferecendo linhas de crédito para os correntistas cujos
filhos tivessem entre 18 e 21 anos e, portanto, precisassem de dinheiro
para ajudar os filhos a comprar o próprio carro, uma casa ou arcar com
os gastos da faculdade. Resultado: em três anos, o banco lucrou US$ 30
milhões com a carteira de empréstimos.
Passou a utilizar ferramentas de data miningem seu DW para gerenciar as movimentações de três milhões de clientes. O banco costumava enviar mais de um milhão de malas diretas aos correntistas, com uma taxa resposta de 2%. Após a implementação das ferramentas conseguiu uma redução de 1/5 das despesas postais e aumentou a taxa de resposta para 30%.
Dobrou lucros usando informações de cartões de “jogadores frequentes”, identificando grupos de jogadores que gastavam pouco mas geravam muito lucro, e criou promoções diferenciadas.
Text mining
De acordo com Rouse (2017), text mining pode ajudar as organizações a extrair informações valiosas para os negócios a partir de textos contidos em documentos, e-mails e postagens em mídias sociais, como Facebook, Twitter, Linkedin etc. Trata-se de fazer a mineração e extração em dados não estruturados usando processamento de linguagem natural, aplicando-se modelos estatísticos e técnicas de aprendizagem por máquinas. Como textos escritos em linguagem natural geralmente apresentam inconsistências e ambiguidades em relação à semântica (significado) e sintaxe (forma escrita), como uso de gírias, termos não técnicos, ironias, sarcasmos etc., o text mining é um processo complexo.
Os aplicativos de análise de texto podem transferir palavras e frases de dados não estruturados para valores numéricos que podem ser ligados a dados estruturados em banco de dados. Estando em bases de dados, podem ser aplicadas técnicas de data mining.
O uso de ferramentas de text mining apoia o processo de inteligência competitiva. Enquanto o data mining obtém conhecimento com os dados de dentro da empresa, o text mining obtém conhecimento a partir de dados obtidos fora da empresa, com o objetivo de conhecer os clientes, concorrentes e clientes dos concorrentes. As fontes de dados podem ser redes sociais, jornais e revistas eletrônicas, e-mails, memorandos etc.
Usando text mining é possível, dentre outros exemplos, extrair frases de um artigo ou livro e criar um resumo de seu conteúdo, analisar currículos e obter os dados de seus sujeitos, como e-mail, telefone, endereço, habilidades profissionais etc. Em aplicações que envolvem a análise semântica (de significado), é possível analisar as palavras no texto e saber se o conteúdo expressa opinião positiva ou negativa. Uma empresa poderia utilizar este recurso para saber se as pessoas estariam emitindo opiniões favoráveis ou desfavoráveis sobre seus produtos ou serviços.
Com a crescente adesão de pessoas nas redes sociais, as empresas preocupam-se em saber a opinião dos internautas e, para isso, utilizam ferramentas de web mining, que extraem informações de páginas web.
Curiosidade
As maiores bases de dados do mundo!
- World Data Centre for Climate (WDCC) operado pelo Max Planck Institute for Meteorology and German Climate Computing Centre: 6 Petabytes.
- The National Energy Research Scientific Computing Center (NERSC): 2.8 Petabytes
- AT&T: entrega serviços móveis avançados, TV de última geração, internet de alta velocidade e soluções inteligentes para pessoas e negócios; banco de dados com mais de 1,9 trilhões de colunas.
- Google: contabiliza e armazena cada pesquisa simples em seu banco de dados, que gira em torno de 91 milhões de pesquisas por dia; coleta informações sobre usuários e armazena-as como entradas em seu banco de dados, da ordem de 33 trilhões.
- Sprint: banco de dados registra mais de 365 milhões de detalhes de chamadas por dia; possui mais de 2,85 trilhões de colunas; registra cerca de 70 mil chamadas por segundo.
- ChoicePoint / LexisNexis: seu banco de dados contém informação de 250 milhões de pessoas dos Estados Unidos, como endereços, telefones, registros criminais, DNA: 250 terabytes
- Youtube: cerca de 100 milhões de vídeos são vistos, 60% de todos os vídeos são vistos online; 65 mil vídeos são postados por dia; são mais de 45 terabytes de dados.
- Amazon: 59 milhões de clientes ativos, uma coleção de 250 mil textos completos de livros online e mais de 42 terabytes de dados.
- Central Intelligence Agency (CIA): coleta informação pública e privada, e parte dela é disponível para consulta pública através do Electronic Reading Room and The World Fact Book; cerca de 100 FOIA (Freedom of Information Act items) são adicionados a cada mês, com dados estatísticos de mais de 250 países.
- Library of Congress: biblioteca do congresso dos Estados Unidos com 130 milhões de itens de livros e jornais novos e antigos; mais de 20 terabytes de dados.
Fonte: JOBANDWORK.ASIA (2017)
1 byte = 8 bits
1 kilobyte (KB) = 1024 bytes
1 megabyte (MB) = 1024 kilobytes
1 gigabyte (GB) = 1024 megabytes
1 terabyte (TB) = 1024 gigabytes
1 petabyte (PB) = 1024 terabytes
1 exabyte (EB) = 1024 petabytes
1 zettabyte (ZB) = 1024 exabytes
1 yottabyte (YB) = 1024 zettabytes.
Nenhum comentário:
Postar um comentário