segunda-feira, 21 de junho de 2021

O que é aconselhamento genético em câncer

Autor: Moisés Alves Pimentel

Faculdade Unyleya

21/06/2021

O aconselhamento genético consiste na investigação de doenças hereditárias na família em diferentes gerações que lida com os problemas humanos associados à ocorrência ou ao risco de ocorrência e/ou recidiva de uma doença genética na família.   

Conforme a publicação da geneone (2020) o aconselhamento genético consiste na verificação da probabilidade da doença ocorrer em uma família e no texto da Unyleya adiciona que as neoplasias hereditárias aparecem com uma frequência maior do que esperada dentro de uma mesma família e que normalmente atinge os mesmos órgãos.

 Pode-se ser classificadas em padrão dominante: quando a doença ocorre em gerações consecutivas ou padrão recessivo uma geração apresenta e a outra não apresenta a doença, podendo surgir na próxima.

 Devido a vários fatores emocionais e psicológicos envolvidos tal ação deve ser um processo acompanhado por uma equipe multiprofissional com a finalidade de dar um suporte adequado diante de vários aspectos de dificuldades envolvidas no processo. 


Bibliografia

- A Prevenção do Câncer e a Promoção da Saúde. Unidade 2, capítulo 1 da Faculdade Unyleya.

- Aconselhamento Genético: o que é e quando fazer.

<https://geneone.com.br/blog/aconselhamento-genetico/>



google.com, pub-4262202157173490, DIRECT, f08c47fec0942fa0

O que é prevenção secundária do câncer?

 Autor: Moisés Alves Pimentel

Faculdade Unyleya

Data: 21/06/2021

As ações de rastreamento por meio de exames e testes específicos e um forte aliado no tratamento adequado de condição pré-maligna ou assintomática do desenvolvimento da doença. São ferramentas de suma importância no quesito de prevenção secundária.

 O diagnóstico precoce através dos sintomas e/ ou sinais clínicos é um procedimento utilizado para descobrir a doença o mais cedo possível e como consequência aumentar a chance de vida do paciente.

 Segundo a A.C. Camargo por meio do rastreamento e exames para diagnóstico precoce da doença aumenta a chance no combate a doença, pois a mesma pode se encontrar no estagio inicial da patologia.

 Os testes mais conhecidos entre as mulheres podem-se destacar a mamografia que é indicada para mulheres acima dos 40 anos, que ajuda a evitar o câncer de mama, e o exame Papanicolau com o teste de HPV para a prevenção de tumores no colo uterino.


Bibliografia

- A Prevenção do Câncer e a Promoção da Saúde. Unidade 2, capítulo 1 da Faculdade Unyleya.

- O Combate do Câncer Começa na Prevenção Primária – Sociedade Brasileira de Oncologia Clínica.

<https://sboc.org.br/noticias/item/1513-o-combate-ao-cancer-comeca-na-prevencao-primaria >

- Prevenção Primária Versus Prevenção Secundária.

<https://www.accamargo.org.br/en/node/2828>


google.com, pub-4262202157173490, DIRECT, f08c47fec0942fa0

O que é Prevenção Primária do câncer

Autor: Moises Alves Pimentel

Faculdade Unyleya

21/06/2021


A prevenção primaria do câncer é um conjunto de ações combinadas que visa à promoção, prevenção e detecção precoce da patologia. Tais ações preventivas estão associadas a fatores sociais, psicológicos, ambientais e culturais (Cestari & Zago (2005)).

 

De acordo com o texto da Unyleya as ações têm como objetivo de amenizar a exposição da população a agentes de riscos, que podem favorecer o aparecimento da doença por meio da promoção da saúde e proteção especifica.

 

São vários fatores que possam contribuir para o desenvolvimento da célula tumoral, mas destacarei duas delas, que é o tabagismo que devido o consumo por anos em contato com o alcatrão, nicótica, e outros agentes nocivos encontrados nos cigarros e outros equipamentos que favorece a inalação destes agentes e o alcoolismo com o consumo exagerado de bebidas alcoólicas. Ambas contribuem com o aparecimento do tumor no decorrer da vida.

O uso do tabaco e do álcool pode ser responsável com o aparecimento de câncer conforme o quadro abaixo, e o risco aumenta quando associado os dois:


Ao tomar medidas que venham reduzir o contato do individuo a estes agentes geradores, podem ajudar a redução das doenças neoplásicas.

 Conforme o relado da sociedade Brasileira de Oncologia Clinica, ao adotar um estilo de vida saudável e evitando fatores de riscos através da prevenção primária pode ser uma grande estratégia no combate a doença.


Bibliografia

- A Prevenção do Câncer e a Promoção da Saúde. Unidade 2, capítulo 1 da Faculdade Unyleya.

- Cestari, M.E.W; Zago, M.M.F. A Prevenção do câncer e a promoção da saúde: um desafio para o século XXI. Ver.Bras.Enfermagem 58(2). Abril 2005.


google.com, pub-4262202157173490, DIRECT, f08c47fec0942fa0

Como fazer um Customer Analytics

Autor: Moisés Alves Pimentel

ENEB - Escola de Negócio de Barcelona

Data: 04/04/2021


ENUNCIADO


 Fruit Box é uma empresa dedicada à venda de caixas de frutas sazonais a pedido. Estas são caixas fechadas, de modo que os usuários não podem mudar os produtos ao seu gosto. Têm geralmente quatro modelos, que combinam tipos diferentes de frutas e três tamanhos; S, M e L.

 A empresa está localizada em Huelva (Andaluzia, Espanha) e, embora muitas das mercadorias que vendam sejam cultivadas ali, a empresa adquire alguns produtos de empresas em outras comunidades autônomas, como é o caso de laranjas, que as compra de uma empresa Valenciana, e bananas, que vêm das Ilhas Canárias. 

Tradicionalmente, os pedidos são feitos por telefone ou e-mail, mas há algum tempo a empresa abriu seu próprio site que tem uma loja online para fazer pedidos, como também um aplicativo para celular. Além disso, foi aberto um perfil no Facebook e Instagram e ambos tiveram uma boa aceitação. 

A empresa tem uma trajetória longa e um grande número de clientes fiéis que adquirem suas caixas de frutas ao longo do ano. 

No entanto, por alguns meses, está perdendo clientes habituais devido ao nascimento de outras empresas dedicadas ao mesmo campo, que apresentam diferenças notáveis, como a possibilidade de personalização de suas caixas de frutas. 

Algumas características que devemos considerar em relação ao principal concorrente da Fruit Box são: 

- Localização: Barcelona. 

- Tipo de caixas: personalizáveis com fruta e verdura de temporada, assim como caixas montadas com fruta exótica, como manga, mamão ou abacate, que são adquiridos de um produtor de Málaga. 

 Não existem tamanhos de caixa, e sim um mínimo onde cliente pode comprar toda a fruta e verdura que queira. 

- Em Barcelona tem um serviço de entrega imediata, enquanto no resto da Espanha os produtos são entregues em menos de 24 horas.

 - Para os clientes que já sabem o que querem, oferecem a possibilidade de registrar-se e assinar a um tipo de caixa de maneira provisória. 

- Os clientes são variados, desde particulares até empresas, que compram para seus funcionários. 

Outro problema que detectam é que a loja online não é muito clara, o que faz com que muitos clientes liguem para realizar um pedido ou escrevam um e-mail reclamando das dificuldades. Alguns problemas que apresenta a loja online são: não se pode acessar a área de clientes antes de incluir algum produto no carrinho de compras ou se pede pela modalidade de pagamento antes de mostrar ao cliente o valor do pedido. 

Além disto, o serviço de entregas sofreu mudanças, o que também fez com que cheguem reclamações de atrasos no pedido e produtos que chegam em um estado prejudicado. 

Devido a esta situação, a empresa decidiu realizar um processo de customer analytics, para poder conhecer os motivos da perda de clientes, além de conhecêlos melhor e oferecer o produto que querem da melhor maneira possível.


ELABORAÇÃO 

1: Realize uma análise DAFO da situação atual, abordando as dificuldades da empresa e as ameaças externas que devem enfrentar. 



O mapa de customer journey com diz o texto da ENEB é a ferramenta que mostra a forma de movimentação dos clientes durante o período de qualificação até o fechamento da venda ou fidelização. 

Devem-se ter em conta os seguintes aspectos:

 - Identificar o Cliente;
 - Entender as etapas do vínculo; 
- Registrar indecisões e motivações; 
- Mapear as interações; 
- Analisar cada instância chave; 
- Processos internos da empresa;
- Oportunidades e sentimentos dos consumidores.

2. Após conhecer a situação do ambiente, assim como a nossa própria, ressalte os objetivos esperados com o desenvolvimento do Customer Analytics. Para isto e seguindo a técnica SMART, fixe os objetivos da análise de seus clientes. 



3. Explique se, na sua análise, serão utilizados dados estruturados ou não estruturados. Justifique tal escolha e determine quais dados serão utilizados para conhecer claramente o que os clientes buscam. 

A importância de se aproximar do cliente e conhecer o seu comportamento é de grande valia para a estratégia de crescimento da empresa. 

Além de possuir um nível alto de informações dos clientes, é necessário saber usálas. ENEB informa que as informações podem vir de diferentes fontes tais como: 

 CRM ou base de dados comerciais e marketing 

 KPIs ou métricas coletadas em pesquisas 

 Tickets de compra, taxas de devolução de produtos, queixas ou reclamações e nível de satisfação. 

 Observação direta do cliente

 Análise web 

 Medição do comportamento do cliente na loja 

 Informação de campanhas de comunicação.

A análise dos dados permitira a organização a direcionar estratégias de negocio detectando problemas e direcionando soluções. 

A empresa sabe que cerca de 80% de todos os dados existentes no mundo são provenientes do uso cotidiano das tecnologias (mensagens de texto, selfies, áudios via WhatsApp, fotos, emojis entre outros (digitalhouse).

 A Devmedia complementa que devido o crescimento da internet e o surgimento de mídias sociais, possibilitou um aumento do número de dados digitais que vem despertando o interesse das organizações para utiliza-los como estratégia de negócio.

 É por isso que a Fruit Box vendo o crescimento nas redes sociais e a boa aceitação do público através das mídias sociais resolveu direcionar suas análises nos dados não estruturados. 

A grande vantagem no uso dos dados não estruturados será de poder identificar as necessidades dos clientes e desenvolver estratégias de mercado e assegurar a tomada de decisões mais precisas (Devmedia). 

Os dados não estruturados podem ser extraídos através das publicações nas redes sociais, através de mensagem do WhatsApp e outros que possibilitaram ajudar a traçar o comportamento do cliente, satisfação, preferências, etc. 


Para criar estratégias mais assertivas a ENEB no seu texto sugere que será necessário criar um estreito relacionamento com o cliente e saber interpretar estas informações não estruturadas através da ferramenta de customer analytics e interpretar os quatros tipos de dados: 

 Dados descritivos: atributos, características e dados sociodemográficos; 
 Dados de comportamento: transações, detalhes dos pedidos, histórico de pagementos; 
 Dados de interação: com canais de comunicação (e-mail, páginas web, app, rede sociais, comportamento de navegação, etc. 
 Dados de atitudes: preferências, necessidades, desejos, opiniões nas redes sociais, etc. 

E esta infinidade de dados poderá ser interpretados pelo uso de algumas ferramentas de análise de dados como: 

 Dashboards 
 Cyfe 
 Chart.lo 
 KlipFolio e Clicdata. 

4. Com os dados, efetue sua exploração para comprovar que sejam corretos e forneçam a informação necessária. Qual tipo de gráfico(s) se indica para visualizar toda esta informação? Você considera necessário relacionar algumas variáveis? Justifique sua resposta. Detenha-se nas seguintes informações: 

A empresa propôs efetuar um acompanhamento mais rigoroso nos primeiros meses para verificar como será o comportamento do seu público nos primeiros meses de mudanças das vias de atendimento online. No primeiro mês, após a mudança, o departamento responsável apresentou os seguintes gráficos.

Faixa de idades – o gráfico de colunas facilita de forma rápida a visualização da distribuição de dados, onde em cada barra mostra o número de clientes por faixa de idade.





Tamanho da caixa: P, M ou G – o gráfico é composto por colunas que é utilizado para comparar quantidades de cada unidade desejada, com variações de quantidades x faixa etário.


Frequência de compra – será analisada pelo gráfico de frequência, onde registrara a frequência que nossos clientes executam dentro de um período amostral, utilizando o gráfico de colunas e o polígono de frequência. 



Canal de compra – Um gráfico muito interessante e de fácil visualização será o gráfico de pizza, onde apresenta em forma de porcentagem os canais mais utilizados na organização para fechamento de compra.



Antiguidade – o gráfico de pizza através da carteira de clientes pode de forma mais limpa e direta mostrar a porcentagem de clientes existentes da empresa.



Seria conveniente também adicionar: 

Índice de satisfação: a variável de satisfação do cliente, este gráfico permitira acompanhar o desenvolvimento de satisfação de nossos clientes e ajudará a direcionar estratégia ou intensificar ações conforme resultados. 


Base no volume de vendas:
a segmentação de clientes através do gráfico poderá mostrar a porcentagem de cada nível de clientes com seu potencial de compra comparada com uma porcentagem geral durante cada mês.


5. Além das variáveis de segmentação propostas em relação à Fruit Box, você acredita que seria necessária alguma outra segmentação sobre alguma outra variável? Justifique sua resposta. 

Nesta parte do trabalho eu procurei mostrar dois diferentes modos para mostrar os meus dados. Foram criados os dados de forma aleatória somente para planificar os gráficos. 

Foi lançado e utilizado o software gratuito PAST, para analisar os componentes principais (PCA) e foi adicionado o índice de satisfação e o volume de vendas, pois estes dados ajudaram a orientar novas estratégias para a organização com relação à satisfação e a média de compra de seus clientes.




O PCA como afirma a ENEB é uma técnica estatística de síntese de informações ou redução da dimensão ou número de variáveis. E a análise principal do componente deve-se considerar: 

 Análise da matriz de correlação 
 Seleção de fatores 
 Análise da matriz fatorial
 Interpretação dos fatores 
 Cálculo das pontuações fatoriais


Bibliografia 

Customer Analytics – ENEB 

Estratégia Empresarial – ENEB 

Pimentel, M.A. Estratégia Empresarial. Escola de Negócios Europeia de Barcelona – ENEB. Agosto de 2020.


google.com, pub-4262202157173490, DIRECT, f08c47fec0942fa0




O que é Processo ETL

 Autor: Moisés Alves Pimentel

ENEB - Escola de Negócio de Barcelona

Data: 24/03/2021


ENUNCIADO

Hierros S.A. é uma empresa familiar dedicada à venda de produtos de hardware e maquinaria localizada no bairro de Eixample de Barcelona. 

A empresa está ativa há mais de cem anos e tem um importante portfólio de clientes, a nível pessoal e profissional, cujos dados compõem uma enorme base de dados com informações realmente valiosas, dados com mais de 80 anos, aproximadamente, mas que não são usados de forma adequada. É claro que os dados dos primeiros anos foram registrados em formato de papel, mas pouco a pouco foram sendo informatizados. 

O principal problema com todos os dados e informações dos clientes reside no fato de não estarem unificados, ou seja, cada departamento tem o seu próprio banco de dados e os valores utilizados não coincidem. Além disso, alguns dados estão registados em espanhol e outros em catalão, alguns deles expressos em pesetas e outros em euros. 

Comentamos que todos os bancos de dados são informatizados em arquivos Excel, nos quais encontramos as seguintes categorias:

 - Nome e sobrenome. 

- Nome da empresa. 

- Identificação ou NIF. 

- Telefone, endereço e e-mail. 

- Histórico das compras. 

- Tíquete médio. 

- Tipos de produtos mais comprados e sua frequência. 

Em suma, Miguel, o filho do atual proprietário, vai herdar o negócio e, consciente da importância que tem para o seu desenvolvimento ter uma boa base de dados capaz de saber em primeira mão como são seus clientes, bem como para tomar decisões estrategicamente bem-sucedidas, pede ajuda a você para classificar e unificar os dados, verificar se os dados disponíveis são válidos e eliminar os que perderam a validade, tais como registros duplicados ou informações de clientes que faleceram. 

PEDE-SE 

Tendo em conta os conhecimentos obtidos durante o curso e o enunciado apresentado:

 Analisando a situação da atual base de dados de Hierros S.A., você acha que é bom para empresa realizar um processo de ETL? Justifique a sua resposta, considerando os benefícios que trariam à empresa de Miguel. Além disso, será importante estabelecer os objetivos da execução deste processo. 

A Hierros S.A por ser uma empresa com mais de 100 anos de funcionamento e possuir informações valiosas no decorrer dos últimos 80 anos, vem passando dificuldade por analisar e centralizar estas informações. 

No decorrer das décadas a empresa passou por várias mudanças nas áreas econômicas, politicas e as informações não estão unificadas, dados registrados em dois idiomas, diferentes moedas, diferentes bancos de dados para cada departamento, dados duplicados e clientes já falecidos.

 Mesmo a empresa situar em um bairro de Barcelona, e atuar na venda de produtos de hardware, a Hierros S.A possui clientes espalhado pela Espanha e Europa. 

Com isso nos últimos anos a diretoria vê a necessidade de implantação de ferramentas da ETL (Extract, Transform and Load) para ajudar na extração dos dados, transformação e armazenamento das informações para futuros estudos de direcionamento de ações estratégias de crescimento. 

A empresa por possuir muitos dados proveniente de diversas fontes, vê a necessidade de implantação da ETL, para melhor trabalhar com este acumulo de informações fazendo com que um único programa possa extrair, transformar e carregar os dados para auxiliar na tomada de decisões.

A diretoria após estudar o assunto e buscar consultoria para compreender o uso de tal ferramenta, descobriu uma seria de vantagens que a empresa conquistará em realizar o Processo ETL, que são: 


Foi sugerida a empresa uma adequação dos setores, visando melhorias e treinamento. Também foi estabelecido que todas as informações lançadas no sistema sejam unificadas para facilitar a leitura e interpretação dos dados. 

Foram apresentadas três opções de melhora de poder de processamento com suas vantagens e desvantagens para poder escolher a mais adequada para a organização e após análise e comparando as vantagens para a empresa foi escolhido o poder de processamento de crescimento vertical com Datawarehouse (DW) para trabalhar com o banco de dados.



A empresa contínua com o banco de produção com as tabelas normais e Datawarehouse trabalha criando um banco novo em tabelas com informações necessárias para o sistema, sem gasto de recursos computacional para emissão de relatórios e contribuindo ainda com economia de energia, tempo, processional, etc. 

As tabelas serão alimentadas pelo ETL que de acordo com a ENEB é uma tecnologia que tem a função de integração de dados oferecendo uma única visão dos dados. 

- Extract : Extração 
- Transform : Transformação 
- Load : Carga. 

E também a função de geri-los assegurando sua integridade, coerência e disponibilidade no destino. 

Depois de realizada a avaliação inicial foram estabelecidas metas de implementação para realizar a instalação do processo de ETL para a organização de acordo com as necessidades iniciais da empresa.


Como salienta ENEB no texto, o uso das ferramentas de ETL permitirá projetar, gerenciar e controlar todos os processos do ambiente ETL. 

Alguns exemplos de ferramentas ETL OpenSource são KETL, Talend, Jaspersoft ETL, Scriptella, e a ferramenta OpenSource por excelência, Kettle (Pentaho Data Integrator) .


2. Tendo em conta as informações que você tem da empresa coletadas em bancos de dados, você acha que seria interessante coletar outros tipos de informações? Quais informações você adicionaria? Justifique a sua resposta. 

Outros tipos de informações seriam ideais para adicionar nas categorias do banco de dados, como: 

Prazo de entrega - Para avaliar o tempo de produção até a entrega do produto seria conveniente observar se o mesmo foi obedecido ou aconteceu algo que alterasse o envio ou entrega da mercadoria. 

Devoluções – sabendo os dados das devoluções e o problema ocorrido pode ajudar a tomar medidas para contornar futuros problemas, quando a produção, armazenamento e embalagens.

 Reclamações – através dos históricos de reclamações, saberia em quais produtos ou serviços a organização deve concentrar seus esforços para desenvolver melhorias e aumentar o índice de satisfação do cliente. 

As informações e coletas de dados são de suma importância para qualquer empresa como sugere a IBC. É através deles que a organização canaliza seus esforços para melhoria e desenvolver estratégias e tomar decisões assertivas. 

Os tipos de dados da Hierros S.A consistem em dados estruturados e semiestruturados e como sugere o texto da ENEB é necessário a integração de dados através de aplicações, técnicas, produtos e tecnologias que nos permitam obter uma única visão coerente dos dados.



3. Descreva as atividades que você realizaria em cada etapa do processo ETL. 

O processo é formado por 4 etapas que são: 

- Fase de Limpeza – é o processo de limpeza de dados que foram lançados errados ou equivocados. 

- Fase de Extração – estão conectados de acordo com os objetivos marcados. Neste caso será utilizado o modo incremental extract (extração incremental) que consiste em analisar os dados que foram modificados ou adicionados. 

A utilização deste modo ajudara a apagar linhas em duplicidade ou dados lançados erroneamente, bem como evitar lentidão ou colapso no sistema. 

- Fase de Transformação – de forma padronizada e seguindo uma série de regras os dados serão convertidos. 

- Fase de Carga - é o processo mais complexo. São importados os dados já transformados para a estrutura de armazenamento que selecionamos. 

Será adotado nesta fase o Acúmulo simples por ser a maneira mais fácil de desenvolver o proceso de carregamento como sugere o texto da ENEB. 


“Se realiza um resumo das transações realizadas no período selecionado e o resultado é transportado para o Data Warehouse como uma única transação, armazenando um valor calculado resultado da soma ou média da magnitude considerada”.


4. Como mencionado no enunciado, Hierros S.A. está ativa há mais de cem anos, fato que implica uma grande quantidade de dados. Salientamos que podem existir dados com valores errados, incorretamente inseridos, duplicados ou valores que não correspondam. Portanto, é necessário realizar um processo para estabelecer a qualidade dos dados e detectar os erros. Mostre os erros que você pode encontrar neste processo, tendo em conta o enunciado. Proponha também uma maneira para solucionar o erro. É importante que se justifique a escolha. 

A Hierros S.A. por ser uma organização em atividade a mais de cem anos possui uma grande quantidade de dados. Os mesmo, nos primeiros anos, foram registrados em papeis devido a não existência de computadores. 

Com o passar dos anos a empresa foi se estruturando e os dados foram lançados no sistema em arquivos do Excel. Ao analisar as informações observou-se alguns erros no processo como: 

 Cada departamento possui seu banco de dados (não estão unificados); 
 Valores utilizados não coincidem; 
 Dados registrados em dois idiomas; 
 Dados registrados com duas diferentes moedas correntes. 

E a fase de limpeza permitira a correção dos erros: 

 Na introdução dos dados; 
 Na transmissão dos dados ou armazenamento; 
 Por diferentes definições de dados em dicionários; 
 Por duplicidade de dados; 
 Endereços não existentes, 
 Diferentes termologias, etc. 

A etapa de limpeza de dados nesta parte do processo é necessária, pois quando uma organização trabalha com dados ruins, poderá levar a empresa a ineficiências operacionais, perdas financeiras e oportunidades perdidas como informa a Astera no seu texto. 

Nesta etapa do processo permitira a análise de dados com alta qualidade e tomada de decisão. O uso de uma ferramenta de limpeza de dados bem-sucedida de possuir: 

 Recursos abrangentes de criação de perfil de dados; 
 Verificações avançadas de qualidade de dados; 
 Mapeamento fácil de dados; 
 Conectividade aprimorada; 
 Automação de fluxo de trabalho. 

A ENEB informa que a qualidade dos dados não se refere apenas ao fato de não possuírem defeitos, mas que os dados devem: 

 Proporcionar uma única visão; 
 Ser consistentes; 
 Ser completos; 
 Ser adequados para sua função; 
 Estar relacionado corretamente com todas as fontes; 
 Cumprir as leis e normativas. 

E a qualidade dos dados é preciso diferenciar a validação de dados que tenta rejeitar registros errados durante a entrada do sistema e o processo de limpeza dos dados que corrigem os dados ou elimina para obter dados de qualidades. 

Uma boa auditoria deve ser composta pelos seguintes passos: 

 Detecção de dados incorretos 
 Limpeza 
 Normalização 
 Duplicação 
 Integração

Uma auditoria de dados é de suma importância para encontrar erros no banco e a ENEB sugere realiza-la para evitar incorporar informações errôneas que distorçam os resultados com valores nulos, duplicados, valores extremos, texto por números, etc.


Análise – detectam erros de sintaxe, um analisador gramatical é usado que decidi se é aceitável ou permitida. 

Estatística - com o uso de funções matemáticas que contenham desvios, intervalos, médias ou algoritmos e que são realizadas por especialistas, nos pode levar a comprovar se os dados são corretos ou não, ainda que seja complexo, seu valor estatístico o determina. 

Eliminação – os registros são geralmente excluídos por duplicação. 

Transformação - é possível alterar o valor de um valor para outro em função daquilo que parametrizemos mediante o uso de algoritmos matemáticos básicos ou de um dicionário.


Bibliografía 

Oliveira, P.R.M (2020). Ferramenta de ETL – Seleção em Big Data Para Condensação de Dados de Produtos e Tributos. 

O Processo de ETL – ENEB 

Salis, T.T. et al. Portal de Processos e ETL para Integração de Dados Procedentes de Bases Distribuídas e Heterogêneas. Contribuição técnica ao 17° Seminário de Automação e TI Industrial - Vitória, ES, Brasil, setembro de 2013. 

Vendeirinho, R.I.A.F. O Papel dos Metadados na Implementação de Uma Gestão Orientada a Processos. Universidade Técnica de Lisboa – Instituto Superior Técnico, Outubro de 2007.




google.com, pub-4262202157173490, DIRECT, f08c47fec0942fa0


segunda-feira, 7 de junho de 2021

O que é Big Data e Business Intelligence

 Autor: Moisés Alves Pimentel

ENEB - Escola de Negócio de Barcelona

Data: 17/03/2021


Estudo de caso

Can Coll é um hotel rural localizado em Montseny, na Catalunha. Trata-se de um estabelecimento que está em operação há mais de 40 anos. Começou como uma pequena casa rural com cinco acomodações que oferecia aos clientes a possibilidade de participar dos trabalhos no campo, como, por exemplo, cultivar a terra, coletar frutas e legumes e cuidar dos animais, entre outros exemplos.

 Hoje tem um total de 50 quartos e, além de oferecer atividades de campo, tem um departamento dedicado à organização de excursões e atividades recreativas. Oferece cafés da manhã, almoço e jantar para os hóspedes do hotel e também possui um spa. 

Além de ser um estabelecimento antigo, possui um elevado número de clientes habituais que cresce todos os anos. O tipo de clientes que recebe é muito variado; famílias com crianças, casais, aposentados e grupos de amigos. 

Para oferecer aos seus clientes um serviço completamente personalizado de acordo com seus gostos e interesses, Can Coll quer conhecer em detalhe a sua carteira de clientes atual, por isso deve realizar uma análise aprofundada da informação que possui desses 40 anos de funcionamento. 

Aqui, temos que ter em conta não só os dados recolhidos pelo estabelecimento, mas os dados e informações que podemos obter através das redes sociais. Assim que, informamos que além do site, Can Coll possui Facebook e Instagram. 

Para analisar os dados, Can Coll solicita ajuda de alguns analistas de dados.


PEDE-SE 

Tendo em conta o aprendizado adquirido ao longo do curso e o enunciado apresentado justifique: 

1. Será benéfico para Can Coll levar a cabo um projeto de Big Data. Tenha em conta as características e particularidades do Big Data e os benefícios que se pode conseguir. Justifique também se seria proveitoso para o negócio utilizar o Business Intelligence. 

A ENEB define que Big Data como informações contendo grande volume e velocidade de variados dados ao sistema de informação e sabendo interpreta-los ajudará na obtenção de conhecimentos e tomada de decisões. 

A Neilpatel complementa que o business intelligence contribui diretamente para o planejamento estratégico empresarial, dando velocidade e qualidade ao processo de tomada de decisões, otimizando e alavancando eficiência operacional. 

Trabalhar com análise de dados nem sempre é fácil, ainda mais quando se usa muitas variáveis e fontes, por isso é necessário à compreensão e interpretação por pessoas profissionais qualificados para gerir tais informações e dados uteis para a organização. 

Baseado nesta informação, eu analista de dados da Can Coll, proponho uma lista de benefícios gerados pelo uso de Big Data e Business Intelligence à companhia, taís como: 

- trabalhar na coleta de informações diversas ao longo dos anos; 

- analisar diversos tipos de dados, provenientes de fontes diversificadas (mídias sociais, web, e-mails, áudio, vídeo, etc); 

- poder analisar a consistência dos dados (fontes, internos, externos, etc); 

- coleta e organização de dados para análise e direcionar ações; 

- ajuda na tomada de decisões com evidências e dados;

- direciona os objetivos, curto, médio ou longo prazo; 

- leva a um controle de desempenho; 

- amplia o controle sobre riscos; 

- otimiza processos; 

- melhora as rotinas internas; 

- possibilita achar falhas no processo; 

- reduz gastos; 

- facilita a identificação de oportunidades; 

- captar informação da empresa e transformar em inteligência de negocio; 

- controla melhor a empresa, sem achismo; 

- identificar e avaliar se determinadas ações gerara valor a empresa; 

- processar e analisar conjuntos de dados, proveniente de fontes estruturadas, não estruturas e semi-estruturados. 

- ajudar a criar objetivos e trabalhar com metas para alcançar crescimento.




2. O principal objetivo dos proprietários de Can Coll é conhecer a sua atual carteira de clientes para poder oferecer um serviço personalizado. Que tipo de dados serão necessários? Tendo em conta a tipologia de dados, quais seriam os que você usaria? 

O conjunto de dados de uma organização é uma ferramenta poderosa para direcionar as ações de uma empresa. A ENEB no texto Big Data & Business Intelligence relata que existem diferentes tipos de dados e os mesmo podem ser: 

- Dados estruturados – são aqueles que possuem estruturas bem definidas, rígidas, consistem em registro de tabelas, ficheiros XML, avaliações criadas, etc. 

- Dados não estruturados – Não possuem estruturas bem definidas, alinhadas padronizadas. São dados provenientes de multimídias, pdf, word, imagens, e-mails, redes sociais,etc.



Os dados não estruturados correspondem a 80% dos dados que são trocados, devido às tecnologias rotineiras como mensagens de texto, áudios, vídeos, etc. como salienta o blog da zendesk. 

Baseado neste contexto e a possibilidade de gerar mais informações que direcionara o negócio da Can Coll serão escolhidos os dados não estruturados para gerir o Business Intelligence da organização.



3. Tendo em conta os dados que considera necessário analisar, estabeleça uma série de objetivos a alcançar. 

Objetivos a alcançar 

- Melhorar a qualidade de serviço prestado; 
- Aumentar a fidelização com os clientes; 
- Aumentar a carteira de clientes e consequentemente as vendas; 
- Criar novas oportunidades de negócios; 
- Explorar a mídia digital, aumentando o número de visitantes na pagina; 
- Ter dados reais para canalizar recursos e ações;
 - Tornar a gestão de informações mais eficiente; 
- Aumentar a popularidade através das mídias sociais. 


4. Qual banco de dados você utilizaria para armazenar a informação que se pretende analisar? Justifique a sua resposta.

 A empresa possui muitos documentos, tabela, texto e outros documentos no desenrolar dos 40 anos de existência, que pode ajudar um plano de negócio para a organização. A organização trabalhara com bases de dados documentais, utilizando estrutura simples como JSON ou XML (devido a vários documentos que a empresa possui ao longo dos 40 anos) e banco de dados orientados em colunas, pois deseja trabalhar com as informações provenientes das redes sociais para ajudar a criar um plano de estratégia complexo e eficaz. 

Com armazenamento dos dados ao longo de linhas diferentes este banco de dados pode tolerar inconsistência de curto prazo em réplicas, com grandes volumes de dados, como centenas de Terabytes (ENEB). 

O armazenamento em colunas separadas permite a capacidade de compressão dos dados, onde cada coluna irá conter o mesmo tipo de dado. Esta forma possibilitara um nível de compressão entre 60 a 70% mais eficiente que nos banco orientados a linhas. 

As principais técnicas aplicadas a banco de dados em coluna são particionamento, indexação, compressão e diferentes estratégias para realização de joins (Wordpress). 

O uso deste tipo de bancos de dados permitira a redução do espaço de armazenamento o desempenho das operações de consulta (devido ao menor tráfego de dados entre o disco e a memória) e agiliza o tempo de resposta de operações de cálculo e/ou agregações massivos da abordagem tradicional (Devmedia). 

Existem um serie de bancos de dados orientados a colunas disponíveis por diferentes fornecedores pagos e até mesmo de livre distribuição que ajudará a analisar os dados e orientar ao implemento de futuras estratégias como: 

- Apache Cassandra: banco de dados criado pelo Facebook que agora é de livre distribuição. É recomendável para gerenciar quantidades massivas de dados. A versão da Enterprise de Cassandra é Datastax Enterprise. Dados suportados: ASCII, bigint, BLOB, Boolean, counter, decimal, double, flota, int, text, timestamp, UUID, VARCHAR and varint.

- Apache Hbase: suporta grandes quantidades de acesso de leitura e gravação em tempo real a grandes quantidades de dados. É executado pelo sistema de arquivos Hadoop. 

O Apache Cassandra informa Cin:

- surgiu em 2008, pelo Facebook; 
- Dynamo + BigTable ; 
- Alta escalabilidade e disponibilidade, sem um ponto único de falha ; 
- Organizados em linhas, colunas, famílias de colunas e keyspaces.

Arquitetura 

- Distribui os dados entre os nós; 
- Qualquer nó pode aceitar qualquer solicitação (leitura ou escrita); 
- Escolha do nível de consistencia; 
- Fácil para adicionar ou remover nós; 
- varias e grande empresas utilizam o Apache Cassandra. 


5. Finalmente, adotando uma visão com um enfoque empresarial e de marketing, e executando um projeto de big data que permita conhecerem em primeira mão o negócio antes da existência dos clientes, proponha mudanças ou atividades uma vez conhecidos os clientes, com o objetivo de oferecer um serviço personalizado. 

Conforme a necessidade apresentada pela direção da Can Coll de oferecer serviços personalizados de acordo com gostos e interesses de seus clientes segue o plano de estratégia visando à melhoria e atuação junto às mídias sociais. 

Missão 

Oferecer serviço de qualidade, visando o conforto, diversão e preço justo. 

Visão 

Ser referência regional em hospedagem rural com alta qualidade nos serviços prestados. 

Valores 

- Compromisso com os clientes; 
- Qualidade dos serviços; 
- Experiência e inovação; 
- Respeito.



Após analizar DAFO da organização a meta será criar soluções e desenvolvimento para fortificar as vantagens e reduzir e/ou anular as fraquezas competitivas da empresa. 


Criação de estratégia para a Organização 
Estratégia Defensiva 

A Can Coll investirá em mão de obra especializada, organizando o departamento de Marketing e gerenciamento de dados, para crescer nas mídias sociais, explorar o marketing digital e se aproximar mais do seu público, através das mídias sociais. 

E para mitigar e anular as ameaças a principio a organização trabalhara com consultores externos nas áreas de Community Manager, Posicionamento Web e marketing para adquirir conhecimento no campo das mídias. 

Estratégia Ofensiva 

A empresa continuará investindo na melhoria de suas instalações e o desenvolvimento dos funcionários para manter a qualidade dos serviços prestados para seus clientes. 

A direção da Can Coll vê grandes oportunidades de crescimento através das mídias sociais e marketing digital, onde divulgará seu produto, criando vendas online em parceria com outras empresas que utilizam metabuscadores e consequentemente aumentará a confiança e transparência de seus serviços com os seus antigos e novos clientes. 


Estratégia de sobrevivência 

A direção da empresa concentrará seus esforços nos pontos forte da organização e buscará consultoria externa para ajudar implementar as mudanças e com consequência buscar ferramentas para reduzir os custo, aumentando a margem de lucro e mais competitividade diante de seus concorrentes.


Estratégia de Reorientação 

A empresa visando grande oportunidade de crescimento através das mídias sociais, investirá em parceria com outras empresas que faz uso de metabuscadores para divulgar e participar de forma mais agressiva e alcançar este público que cresce a cada dia na exploração das mídias online. 

A Can Coll ao seguir estas estratégias terá grandes possibilidades de crescimento e em menos de 12 meses, ela poderá analisar dados mais concretos proveniente mídias sociais. 


Bibliografia 


Big Data & Business Intelligence – ENEB.






google.com, pub-4262202157173490, DIRECT, f08c47fec0942fa0