Banco de Dados 2

Turmas
Introdução
A manipulação de dados ganhou um importante papel na sociedade. Ao longo dos últimos anos, acompanhamos um crescimento exponencial de estratégias para a gestão e governança de dados, muito por conta do aumento do volume, variedade e velocidade na produção de tais recursos. Diante de tais desafios, a disciplina de Banco de Dados 2 visa discutir métodos e tecnologias emergentes.
Objetivos
- Conhecer o conceito e a aplicabilidade de Big Data.
- Conhecer diferentes abordagens para manipulação de Big Data.
- Manipular bancos de dados NoSQL através de práticas com ferramentas.
- Definir arquitetura de dados mais adequada para problemas de Big Data.
- Criar Soluções para suporte à engenharia de dados
Atividades
-
Big data e suas aplicações
Escolha um dos textos abaixo, que abordam o uso intensivo de dados para lidar com problemas em diferentes contextos, como agricultura, cidades inteligentes, indústria 4.0 e marketing.
Esta atividade consiste em escolher uma das áreas e aprofundar a discussão acerca de problemas do setor e quais estratégias de gestão de dados têm sido utilizadas para impulsionar a produtividade ou mitigar problemas.
Sua pesquisa deve ser baseada em artigos científicos. Portanto, use o portal Capes ou o Google Scholar para fazer suas pesquisas. Mais adiante, aprimoraremos os trabalhos para que tomem forma de artigos científicos.
Entregável: faça um vídeo com até 10 minutos abordando o seu tema. Disponibilize o vídeo na sua resposta.
-
Laboratório Hadoop - Criação de estruturas
-
Laboratório Hadoop - Manipulação de arquivos
-
Laboratório Hadoop - Consultas
Neste laboratório, exploramos as tecnologias Apache Hive e Apache Impala para realizar consultas em Big Data. Baixe AQUI os datasets e siga os passos do enunciado para realizar a atividade.
Laboratório Redis
Laboratório Cassandra
Instruções
Laboratórios
-
Sistemas Distribuídos Analíticos
Neste laboratório, exploramos as tecnologias do ecossistema Hadoop. Utilizaremos a interface do Apache Hue para manipular arquivos de dados através das engines do Apache Hive e Apache Impala. Também faremos manipulações de bancos de dados através do Hadoop File System, via shell.
-
Bancos de Dados Chave-Valor
Nesta atividade, aprenderemos a manipular bancos de dados chave-valor, tendo como ferramenta de exemplo o Redis. Discutiremos as principais diferenças dessa abordagem para os bancos de dados relacionais, destacando a aplicabilidade da proposta.
Fontes Recomendadas
Os alunos devem acompanhar os materiais de apoio disponibilizados pelos canais oficiais do CEFET, sobretudo o MS Teams. Há uma farta literatura sobre a disciplina e outros tantos canais recomendados durante as aulas.
Nossa apostila
Em construção. Baixe aqui!
Bibliografia Básica do Curso
- DATE, C. J. Introdução a sistemas de bancos de dados. Rio de Janeiro: Elsevier: Campus, c2004. 865 p. ISBN 9788535212730 (Broch.).
- BASSO, D. E. Big Data. Rio de Janeiro: Editora Contentus, 2020. 96 p. ISBN 9786557456798.
- TAURION, Cesar. Big Data. Editora Brasport, 2013. p. 102. ISBN 9788574526089.
Aulas
- 1. Introdução ao Big Data
-
Nesta aula, introduzimos o conceito de Big Data, destacando os desafios inerentes das sociedades baseadas em conhecimento.
- 2. Big Data e a Ciência de Dados
-
Apresentamos como Big Data tem sido utilizado para a identificação de padrões em dados. Também discutiremos as abordagens de armazenamento que têm surgido nos últimos anos.
- 3. Big Social Data
-
IoT, plataformas digitais sociais... Discutiremos tecnologias e estratégias de coleta de dados que têm sido utilizadas em Big Data.
- 4. Dados Abertos
-
Apresentaremos diferentes fontes de dados abertos, disponíveis para consultas e pesquisas.
- 5. Bancos Relacionais para o Tratamento de Big Data
-
É possível utilizar sistemas gerenciadores de bancos de dados relacionais para tratar Big data?
- 6. Sistemas de Bancos de Dados Distribuídos
-
Nesta aula, apresentaremos os sistemas de bancos de dados distribuídos e suas principais características e requisitos.
- 7. Ecossistema Hadoop
-
Nesta aula, apresentamos o ecossistema Hadoop, sua estrutura arquitetural e suas aplicações.
- 8. Sistemas de Bancos de Dados Distribuídos Analíticos
-
Nesta aula, apresentamos um ferramental Hadoop para a gestão de dados analíticos em larga escala.
- 9. Tecnologias NoSQL
-
Apresentamos as novas estratégias manipulação de dados. As tecnologias
Not Only SQL
. - 10. Tipos de Bancos de Dados NoSQL
-
Apresentaremos um ferramental estatístico para a extração de extração de conhecimento em bases de dados.
- 11. Bancos de Dados Chave-Valor
-
Nesta aula, apresentamos a tecnologia NoSQL chave-valor e suas aplicações.
- 12. Bancos de Dados Colunares
-
Nesta aula, apresentamos a tecnologia NoSQL orientados a colunas e suas aplicações.
- 13. Bancos de Dados orientados a Documentos
-
Nesta aula, apresentamos a tecnologia NoSQL orientado a documentos e suas aplicações.
- 14. Bancos de Dados orientados a Grafos
-
Nesta aula, apresentamos a tecnologia NoSQL grafos e suas aplicações.
- 15. Demais abordagens NoSQL
-
Nesta aula, veremos tendências e novas tecnologias NoSQL.