Sobre a Disciplina Professor: Alexandre Nóbrega Duarte (alexandrend@gmail.com) Carga horária: 60 horas Horário: Terça -› 14:00h-16:00h; Quinta -› 14:00h-16:00h Local: a definir Horário de Atendimento: Terça 08:00h-11:00 Lista de discussão: cidufpb@googlegroups.com - Mandar e-mail para alexandrend@gmail.com para ser cadastrado Objetivos do Curso Mecanismos de suporte à Computação Intensiva em Dados são críticos para o avanço da ciência moderna em um momento em que os sistemas de armazenamento apresentam considerável crescimento em sua capacidade de armazenamento sem comparável aumento de sua velocidade de transferência de dados. Existe uma necessidade latente por técnicas mais avançadas para manipular, visualizar e interpretar grandes volumes de dados. Construir sistemas distribuídos de larga escala capazes de dar suporte à Computação Intensiva em Dados apresenta desafios em vários níveis diferentes, desde as tecnologias de rede (transporte, roteamento, etc), ao projeto de algoritmos distribuídos (distribuição de dados, gerência de recursos, etc) e chegando até mesmo às redes sociais (mecanismos de incentivo, etc). Este curso apresenta um passeio por vários tópicos de pesquisa na área de sistemas distribuídos, cobrindo assuntos como computação utilizando clusters, grades computacionais, super-computadores e computação em nuvem. Exploraremos soluções e princípios de projeto, implementação e avaliação de sistemas distribuídos para dar suporte à Computação Intensiva em Dados. Nossas leituras e discussões nos ajudarão a identificar problemas de pesquisa e entender métodos e abordagens gerais de projeto, implementação e avaliação de sistemas distribuídos de suporte à Computação Intensiva em Dados. Os tópicos cobertos incluem gerenciamento de recursos (descoberta, alocação, modelos de computação, modelos de dados, localidade de dados, virtualização, monitoramento, etc), modelos de programação, modelos de aplicação e caracterização de sistemas. Nossas discussões serão geralmente e mbasadas no contexto de sistemas distribuídos em produção como o OurGrid, Amazon EC2, vários super-computadores modernos e diferentes plataformas de programação (MapReduce, Hadoop, Dryad, Sphere/Sector, Swift/Falkon and Parrot/Chirp). O curso será realizado por meio de aulas expositivas, palestras convidadas, discussões sobre artigos científicos e um projeto de implementação (incluindo um relatório escrita e uma apresentação oral). Espera-se que ao concluir o curso os alunos sejam capazes de:
Pré-requisitos
Conteúdo Programático
Plano de Aulas (sendo preparado on the go)
Bibliografia
Forma de Avaliação
Ferramental para os projetos
Notas |