Escola avançada em big data analysis - ORGANIZAÇÃO: SCC/ICMC/USP Coordenação: Prof. Roseli Romero APOIO: CEMEAI, CROB E CTI-Campinas PÚBLICO-ALVO: ALUNOS DE PÓS-GRADUAÇÃO E DE GRADUAÇÃO PREFERENCIALMENTE DO ÚLTIMO ANO CURSANDO ENGENHARIAS, COMPUTAÇÃO, ESTATÍSTICA E ECONOMIA E GRADUADOS EM ÁREAS AFINS.
Espaço aberto para empresas demonstrarem seus produtos por meio de patrocínio (enviar e-mail para rafrance@icmc.usp.br)
É inegável que estamos vivendo a Era do "Big Data". O setor empresarial e órgãos governamentais têm testemunhado o acúmulo de informações que vêm sendo armazenadas diariamente. O crescimento é exponencial e ampla disponibilidade de dados digitais oferecem grandes potencialidades e também trazem novos desafios em várias disciplinas da área de Ciência de Computação. Tanto "Big Data" quanto "Deep Learning" se apresentam como duas grandes tendências que irão impactar e influenciar o futuro da ciência de dados. Aproveitar o poder do "Big Data" não é uma tarefa comum. Por outro lado, "Deep Learning" é um dos métodos mais promissores para análise de dados. Ele tem sido aplicado com sucesso em uma vasta gama de domínios de aplicação, tais como o reconhecimento de fala, visão computacional, processamento de linguagem natural e análise para dados de negócios de grande escala. Por seu caráter multidisciplinar, acredita-se que esta escola atrairá estudantes de pós-graduação de diversas áreas e proporcionará o desenvolvimento de importantes pesquisas abordando os temas envolvidos.
A 3ª EABDA visa apresentar ao aluno as principais técnicas usadas para a análise de grandes volumes de dados, destacando-se as mais avançadas e promissoras, tais como Gerenciamento de Grandes Bases de Dados e Visualização e Mineração de Dados. Serão apresentadas também várias ferramentas (softwares) indicadas para análise, extração de conhecimento e visualização de dados. As técnicas e ferramentas estão distribuídas em 10 minicursos, que serão apresentados por docentes especializados nos temas abordados em cada um deles.
Programação
Horário
2/SET
3/SET
4/SET
5/SET
6/SET
08:00
Palestra: Big Data e Inteligência Artificial: Oportunidades e Desafios Claudio Santos Pinhanez (IBM-BRASIL)
Big Data e Inteligência Artificial: Oportunidades e Desafios
Apresentador: Claudio Santos Pinhanez
Resumo: Os avanços recentes nas tecnologias de Inteligência Artificial são diretamente ligada à disponibilidade de Big Data. Ao mesmo, algoritmos de Deep Learning são hoje a melhor opção para resolver problemas centrais na análise de grandes volumes de dados. Esta palestra desmistifica essa explosão de IA no contexto de Big Data, ao mesmo tempo que discute as principais oportunidades e os desafios mais importantes no casamento dessas duas grandes tendências.
Bio: Claudio Pinhanez é cientista, inovador e professor. É pesquisador da IBM Research desde 1999, e hoje lidera pesquisas em Inteligência Conversacional do laboratório da IBM Research no Brasil. Claudio fez doutorado no Media Lab do MIT e foi professor da USP. É especialista em inteligência artificial, interação homem-máquina, sistema conversacionais, e ciência de serviços. Claudio tem mais de 100 artigos publicados em jornais e conferências científicas, e mais de 20 patentes outorgadas nos Estados Unidos, Europa e Japão. Twitter: @cinhanez
Saiba mais
Palestra: Ciência de Dados e Aplicações em Bancos Eduardo Hruscha (Itaú Engenharia)
Ciência de Dados e Aplicações em Bancos
Apresentador: Eduardo Hruschka
Resumo: Será apresentada uma visão geral da área de Ciência de Dados e algumas de suas aplicações reais de sucesso. Nesse contexto, o papel do cientista de dados será discutido. Desafios e tendências futuras para o desenvolvimento da área serão também abordados.
Sobre o palestrante: Eduardo Hruschka é superintendente de ciência de dados do Itaú-Unibanco e professor associado (livre- docente) do Departamento de Engenharia de Computação e Sistemas Digitais da Escola Politécnica da USP. Entre 2013-2016, foi cientista-chefe da startup Big Data. Concluiu seu doutorado em 2001 no Programa Interdisciplinar de Computação de Alto Desempenho da COPPE/UFRJ. Realizou pós-doutoramento em ciência de dados na University of Texas at Austin, entre 2010- 2012. Tem atuado na área de ciência de dados, com particular ênfase em desenvolver, aperfeiçoar e aplicar algoritmos para aprendizado de máquina, desde 1996. Publicou mais de 100 artigos científicos, os quais receberam mais de 3.800 citações.
Resumo: Grande poder computacional aliado a imensas quantidades de dados e técnicas estatísticas e de otimização têm gerado revolucionários avanços em classificação automática de dados estruturados. Porém muitos modelos, como florestas aleatórias ou redes neurais profundas, produzem decisões de difícil interpretação. Em vista disso existe um crescente interesse em técnicas que expliquem classificações automáticas. Nesta palestra serão discutidos métodos de geração de explicações, em particular para classificação de relações em bases de conhecimento.
Bio: Professor Titular da Universidade de São Paulo, PhD pela Carnegie Mellon University e Engenheiro Eletrônico pela Universidade de São Paulo com interesse na intersecção entre representação de conhecimento e aprendizado de máquina; é Associate Editor do Artificial Intelligence Journal e do International Journal of Approximate Reasoning; foi Associate Editor do Journal of Artificial Intelligence Research, Area Chair da International Joint Conference on Artificial Intelligence, e General Chair da Conference on Uncertainty in Artificial Intelligence; foi também coordenador do Comitê Especial em Inteligência Artificial da Sociedade Brasileira de Computação.
Saiba mais
Palestra: Big Data na Indústria 4.0 Josué Ramos (CTI/Campinas)
Big Data na Indústria 4.0
Apresentador: Josué Ramos
Resumo: O objetivo da palestra é apresentar a chamada Industria 4.0, que é caracterizada como a quarta revolução industrial. Serão destacados os seus principais componentes e também como a área de Big Data Analysis está diretamente envolvida com a quarta revolução
industrial.
Bio: Pesquisador em Robótica há mais de 35 anos do CTI (Centro de Tecnologia da Informação Renato Archer) do Ministério da Ciência, Tecnologia, Inovações e Comunicações. Responsável pelo Programa da Indústria 4.0 do Centro. Atua em Robótica com ênfase em Interação Humano-Robô.
Saiba mais
Palestra: Pipeline da Engenharia de Dados Ederson Corbari (Semantix) Moisés Pereira (Semantix)
Pipeline da Engenharia de Dados
Apresentadores: Ederson Corbari e Moisés Pereira
Resumo: Você sabe qual é o trabalho de um Engenheiro de Dados? O que é um Pipeline de Dados? Nessa palestra vamos abordar esses temas e muito mais, mostrando um caso real aplicado no Mercado Financeiro, utilizando diversas ferramentas de Big Data. Entenda os principais conceitos e a aplicabilidade da camada Fast e Batch. Entenda o papel principal de cada ferramenta utilizada e tenha uma visão geral dos temas de Machine Learning e sua relação dentro do Big Data.
Bios:
Ederson Corbari:
É atualmente Engenheiro de Dados na Semantix. Estudou Ciências da Computação na Unoesc e Astronomia na UFRJ, trabalha na área de T.I há mais de 13 anos, atuando em diversos projetos de cunho científico, comercial e open source. Nos últimos anos tem se dedicado a área de Big Data em clientes do mercado financeiro
Moisés Pereira:
Especialização em Big Data pela Escola Politécnica da USP, graduado em Processamento de Dados pela Universidade Bandeirantes. Atualmente Engenheiro de Dados pela Semantix, tendo atuado em diversos projetos na área financeira, ensino e turismo com mais de 10 anos na area de TI. Participa ativamente da comunidade de Big Data, organizando eventos e compartilhando conhecimento.
Saiba mais
09:30
Coffee break
Coffee break
Coffee break
Coffee break
Coffee break
10:00
Curso: Ciência de Dados (1ª parte)
Curso: Aprendizado de Máquina (1ª parte)
Curso: Deep Learning (1ª parte)
Curso: Social network mining and analysis (1ª parte)
Curso: Gerência de Dados Complexos em Larga Escala (1ª parte)
12:00
Almoço
Almoço
Almoço
Almoço
Almoço
13:00
Curso: Ciência de Dados (2ª parte)
Curso: Aprendizado de Máquina (2ª parte)
Curso: Deep Learning (2ª parte)
Curso: Social network mining and analysis (2ª parte)
Curso: Gerência de Dados Complexos em Larga Escala (2ª parte)
15:00
Coffee break
Coffee break
Coffee break
Coffee break
Coffee break
15:30
Curso: Visual Analysis of Large Data Sets: Present, Future and Usages
Curso: Processamento de línguas naturais (PLN)
Curso: Inteligência Analítica para Textos usando Mineração de Eventos
Curso: Casos de Uso de Sistemas de Recomendação em Negócios: Aplicações e Métodos Atuais
Curso: Redes Complexas em mineração de textos
19:30
Valores de inscrição*
ATÉ 27/AGO
APÓS 27/AGO
1 minicurso (estudantes)
R$ 100
R$ 120
1 minicurso (profissionais)
R$ 150
R$ 200
10 minicursos (alunos)
R$ 700
R$ 850
10 minicursos (profissionais)
R$ 1200
R$ 1700
*Será acrescida uma taxa de 10% aos valores, referente à plataforma de inscrições.