Tuesday, February 10, 2015

Environment Structure Review (Post in Brazilian Portuguese)

Ambiente de Trabalho:
Máquina Virtual Ubuntu com R, RStudio, pacotes ggplot2 e RODBC, Python Eric e Plpython, PostgreSQL, MADlib e Hadoop    

Estrutura do Curso:

Exercícios:
                        1º) em Excel,
                        2º) em R,
                        3º) em R carregando do Excel,
                        4º) em R carregando de um Postgresql,
                        5º) exportar de um DB (via SQL),
                        6º) importar de um DB (via Python),
                        7º ) executar in-db analytics (MADLIB),
                        8º) ensinar no HADOOP

 Técnicas: (em Excel e R):
                         1º) Estruturas de dados básicas (apenas em R),
                         2º) Teste de Hipóteses,
                         3º) ANOVA,
                         4º) Visualização,
                         5º) K-means clustering,
                         6º) Regras de associação,
                         7º) Regressão Linear simples e múltipla,
                         8º) Regressão Logística,
                         9º) Naive Bayes (apenas em R),
                        10º) Árvores de Decisão,
                        11º) Séries Temporais,
                        12º) Análise Textual (apenas em R)

 Bancos de Dados:
           1º) Gerar as bases de dados no Postgresql: retail data, census data
           2º) Seguir lab e/ou tutorial do Postgresql que existe na WEB
           3º) Extrações do Postgresql para análise no R
           4º) MADlib para gerar analytics in-db (com R & Postgresql)
           5º) HADOOP / MAPREDUCE & Python (????)

 Possíveis aplicações nos cases de marketing transferidos

No comments:

Post a Comment