TASIO852 / Data-Pipeline Public

Notifications You must be signed in to change notification settings
Fork 0
Star 1

Pipeline de dados do twitter que fiz a coleta para um projeto de processamento de dados em streaming

1 star 0 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
Mapping		Mapping
Produto		Produto
StreamCode		StreamCode
Terraform		Terraform
code		code
target		target
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Repository files navigation

Pipeline de dados do twitter

Pipeline de dados feito com spark e aws com os dados extraídos do twitter
Dados salvos na AWS
Dados dos principais assuntos do momento

No projeto vai ser montada uma pipeline de dados do twitter extraídas por um aws lambda

um lambda ea API
O outro sao dados de diversos lugaress

Em seguida os dados vao ser armazenados em um S3
O tratamento de dados sera com o apache spark e Glue
Logo apos serão armazenados em um redshift
E depois a montagem de um dashboard e uma nuvem de palavras

AWS Core

S3
Glue
lambda
step functions
redshift
Athena

Dashboard

Print tempalte

Oque falta ?

Incluir terraform
Subir para AWS

About

Pipeline de dados do twitter que fiz a coleta para um projeto de processamento de dados em streaming

airflow kafka spark mongodb

Report repository

Releases

No releases published

Packages

No packages published

Languages