- Pipeline de dados feito com spark e aws com os dados extraídos do twitter
- Dados salvos na AWS
- Dados dos principais assuntos do momento
- No projeto vai ser montada uma pipeline de dados do twitter extraídas por um aws lambda
- um lambda ea API
- O outro sao dados de diversos lugaress
- Em seguida os dados vao ser armazenados em um S3
- O tratamento de dados sera com o apache spark e Glue
- Logo apos serão armazenados em um redshift
- E depois a montagem de um dashboard e uma nuvem de palavras
- S3
- Glue
- lambda
- step functions
- redshift
- Athena
- Print tempalte
- Incluir terraform
- Subir para AWS