«« Voltar
A Ciência de Dados e a sua aplicação em estudos de dados reais
Protocolo do SIGProj:   270992.1136.185101.17052017
De:01/05/2017  à  01/05/2019
 
Coordenador-Extensionista
  Eduardo Machado Real
Instituição
  UEMS - Universidade Estadual de Mato Grosso do Sul
Unidade Geral
  Nova Andradina - Unidade Universitária de Nova Andradina
Unidade de Origem
  Computação - Coordenação do Curso de Computação
Resumo da Ação de Extensão
  Cada vez mais os dados têm desempenhado um importante papel nas organizações, e acompanhar todo o seu ciclo de vida tornou-se uma ação indispensável. A Ciência de Dados trata os dados em todo este ciclo, da concepção à eliminação, com o objetivo de extrair conhecimentos que possam promover eficientes tomadas de decisões. Este processo vai além da estatística, ou mesmo de um problema de Big Data, pois envolve não apenas a análise de dados, mas todos os processos, métodos e tecnologias que permitem o estudo dos dados, a fim de descobrir conhecimentos de informações, muitas vezes 'entrelaçadas' entre esses dados. Neste contexto, este projeto de pesquisa tem como objetivo investigar os principais conceitos da Ciência de Dados, uma área de pesquisa que vem crescendo e recentemente tornando-se uma profissão, a de Cientista de Dados. Além disso, este projeto propõe aplicar diferentes técnicas de análises implícitas de dados usando conjuntos de dados do mundo real, tais como os disponíveis pelo UCI Repository, Kaggle e Fiocruz, ou ainda os coletados via formulários ou Sistema de Informação Acadêmico. Para as implementações práticas serão utilizados o R e o Weka, produtos de licença open source. O R é uma linguagem de programação interpretada e procedural para estatística e mineração de dados e o Weka é uma ferramenta especializada em aprendizado de máquina e disponibiliza diversas bibliotecas.
Palavras-chave
   Ciência de dados, Análise de dados, Mineração de dados.
Público-Alvo
  
Situação
  Atividade EM ANDAMENTO
Contato
  
«« Voltar