Banco de Dados 2

Banco de dados 2 - figura disponível em https://itforum.com.br/noticias/sistemas-de-gerenciamento-de-banco-de-dados-estao-se-tornando-obsoletos/

Turmas


Introdução

A manipulação de dados ganhou um importante papel na sociedade. Ao longo dos últimos anos, acompanhamos um crescimento exponencial de estratégias para a gestão e governança de dados, muito por conta do aumento do volume, variedade e velocidade na produção de tais recursos. Diante de tais desafios, a disciplina de Banco de Dados 2 visa discutir métodos e tecnologias emergentes.


Objetivos

  • Conhecer o conceito e a aplicabilidade de Big Data.
  • Conhecer diferentes abordagens para manipulação de Big Data.
  • Manipular bancos de dados NoSQL através de práticas com ferramentas.
  • Definir arquitetura de dados mais adequada para problemas de Big Data.
  • Criar Soluções para suporte à engenharia de dados

Atividades

  • Big data e suas aplicações

    Escolha um dos textos abaixo, que abordam o uso intensivo de dados para lidar com problemas em diferentes contextos, como agricultura, cidades inteligentes, indústria 4.0 e marketing.

    Esta atividade consiste em escolher uma das áreas e aprofundar a discussão acerca de problemas do setor e quais estratégias de gestão de dados têm sido utilizadas para impulsionar a produtividade ou mitigar problemas.

    Sua pesquisa deve ser baseada em artigos científicos. Portanto, use o portal Capes ou o Google Scholar para fazer suas pesquisas. Mais adiante, aprimoraremos os trabalhos para que tomem forma de artigos científicos.

    Entregável: faça um vídeo com até 10 minutos abordando o seu tema. Disponibilize o vídeo na sua resposta.

  • Laboratório Hadoop - Criação de estruturas

  • Laboratório Hadoop - Manipulação de arquivos

  • Laboratório Hadoop - Consultas

    Neste laboratório, exploramos as tecnologias Apache Hive e Apache Impala para realizar consultas em Big Data. Baixe AQUI os datasets e siga os passos do enunciado para realizar a atividade.

  • Laboratório Redis

  • Laboratório Cassandra

    Instruções

Laboratórios

  • Sistemas Distribuídos Analíticos

    Neste laboratório, exploramos as tecnologias do ecossistema Hadoop. Utilizaremos a interface do Apache Hue para manipular arquivos de dados através das engines do Apache Hive e Apache Impala. Também faremos manipulações de bancos de dados através do Hadoop File System, via shell.

  • Bancos de Dados Chave-Valor

    Nesta atividade, aprenderemos a manipular bancos de dados chave-valor, tendo como ferramenta de exemplo o Redis. Discutiremos as principais diferenças dessa abordagem para os bancos de dados relacionais, destacando a aplicabilidade da proposta.


Fontes Recomendadas

Os alunos devem acompanhar os materiais de apoio disponibilizados pelos canais oficiais do CEFET, sobretudo o MS Teams. Há uma farta literatura sobre a disciplina e outros tantos canais recomendados durante as aulas.

Nossa apostila

Em construção. Baixe aqui!

Bibliografia Básica do Curso

  • DATE, C. J. Introdução a sistemas de bancos de dados. Rio de Janeiro: Elsevier: Campus, c2004. 865 p. ISBN 9788535212730 (Broch.).
  • BASSO, D. E. Big Data. Rio de Janeiro: Editora Contentus, 2020. 96 p. ISBN 9786557456798.
  • TAURION, Cesar. Big Data. Editora Brasport, 2013. p. 102. ISBN 9788574526089.

Aulas

1. Introdução ao Big Data

Nesta aula, introduzimos o conceito de Big Data, destacando os desafios inerentes das sociedades baseadas em conhecimento.


2. Big Data e a Ciência de Dados

Apresentamos como Big Data tem sido utilizado para a identificação de padrões em dados. Também discutiremos as abordagens de armazenamento que têm surgido nos últimos anos.


3. Big Social Data

IoT, plataformas digitais sociais... Discutiremos tecnologias e estratégias de coleta de dados que têm sido utilizadas em Big Data.


4. Dados Abertos

Apresentaremos diferentes fontes de dados abertos, disponíveis para consultas e pesquisas.


5. Bancos Relacionais para o Tratamento de Big Data

É possível utilizar sistemas gerenciadores de bancos de dados relacionais para tratar Big data?


6. Sistemas de Bancos de Dados Distribuídos

Nesta aula, apresentaremos os sistemas de bancos de dados distribuídos e suas principais características e requisitos.


7. Ecossistema Hadoop

Nesta aula, apresentamos o ecossistema Hadoop, sua estrutura arquitetural e suas aplicações.


8. Sistemas de Bancos de Dados Distribuídos Analíticos

Nesta aula, apresentamos um ferramental Hadoop para a gestão de dados analíticos em larga escala.


9. Tecnologias NoSQL

Apresentamos as novas estratégias manipulação de dados. As tecnologias Not Only SQL.


10. Tipos de Bancos de Dados NoSQL

Apresentaremos um ferramental estatístico para a extração de extração de conhecimento em bases de dados.


11. Bancos de Dados Chave-Valor

Nesta aula, apresentamos a tecnologia NoSQL chave-valor e suas aplicações.


12. Bancos de Dados Colunares

Nesta aula, apresentamos a tecnologia NoSQL orientados a colunas e suas aplicações.


13. Bancos de Dados orientados a Documentos

Nesta aula, apresentamos a tecnologia NoSQL orientado a documentos e suas aplicações.


14. Bancos de Dados orientados a Grafos

Nesta aula, apresentamos a tecnologia NoSQL grafos e suas aplicações.


15. Demais abordagens NoSQL

Nesta aula, veremos tendências e novas tecnologias NoSQL.