Horário: 14h
Palestrante: Emerson de Araújo Macedo (doutorado)
Orientador: Profa Alba Melo
Título: Simulação de Enovelamento de Proteínas com Enterramento Atômico utilizando NAMD em Ambiente de Alto Desempenho
Resumo: A função biológica que uma proteína desempenha em nosso organismo está relacionada com sua estrutura nativa, ou seja, a configuração tridimensional (3D) funcional da sua molécula. Uma proteína assume essa configuração 3D através de um processo chamado de enovelamento. Duas questões que envolvem a pesquisa sobre o problema do enovelamento de proteínas são: (i) qual é o código físico do enovelamento, isto é, como as propriedades físico-químicas codificadas na sequência de aminoácidos, sua configuração geométrica unidimensional (1D), determinam a configuração 3D nativa? (ii) é possível desenvolver uma solução computacional que permita predizer a configuração 3D nativa a partir de sua configuração 1D primária? O enterramento atômico é uma hipótese para responder à primeira questão. Trata-se de uma medida relacionada a propriedades como o efeito hidrofóbico e as pontes de hidrogênio e indica a distância física de cada átomo da proteína ao centro geométrico de sua estrutura 3D nativa. Sabe-se que este enterramento atômico possui informação suficiente para se determinar a configuração 3D nativa de pequenas proteínas globulares. A simulação de dinâmica molecular (MD, Molecular Dynamics) é um método computacional que auxilia tanto o processo experimental de determinação de estruturas de proteínas quanto a pesquisa e projeto de novos fármacos para tratar doenças relacionadas, como Alzheimer e Parkinson. A simulação MD é utilizada no estudo do código físico do enovelamento (i) e na predição de estruturas proteicas (ii). Porém, o algoritmo de simulação MD exige um alto custo computacional para modelar o processo de enovelamento de uma proteína. É neste contexto que a computação de alto desempenho é utilizada para viabilizar a simulação MD de enovelamentos de proteínas consideradas grandes e de eventos biológicos de interesse, tais como ataques a vírus HIV. Nessa apresentação, mostrarei uma solução de alto desempenho para a simulação MD, chamada NAMD, e como adaptá-la para auxiliar na pesquisa sobre o efeito do enterramento atômico no enovelamento de proteínas.
Horário: 14h20
Palestrante: Helena Schubert da I. Lima da S. (mestrado)
Orientadora: Profa Alba Melo
Título: Proposta de Arquitetura Híbrida MPI/OpenMP em um supercomputador para o Workflow Científico CellHeap
Resumo: Workflows científicos utilizam uma sequência de tarefas interligadas que geram um resultado final. CellHeap é um workflow científico que processa e analisa dados de amostras de single cell RNA-seq. Como os dados de entrada são extensos e precisam de muito poder de processamento para serem computados e há muitos acessos ao IO, a utilização de um supercomputador pode diminuir o tempo total de processamento do CellHeap. O uso eficiente de um supercomputador requer que seus recursos sejam utilizados de maneira ótima ou próxima de ótima, aplicando paralelismo em seus nós e em seus múltiplos núcleos quando possível, além de otimizar o uso da memória compartilhada e distribuída. A Arquitetura Híbrida MPI/OpenMP é capaz de gerenciar os recursos paralelos disponíveis para melhor utilização. Entretanto, uma grande quantidade de threads e processos pode diminuir o tempo de acesso ao IO, logo, o paralelismo deve ser monitorado e gerido para não prejudicar sua performance. A proposta de arquitetura aqui discutida procura utilizar as características do supercomputador SDumont e de paralelismo de threads e processos para melhorar a performance do workflow CellHep, classificado como uma Bag of Tasks com IO bound.
Horário: 14h40
Palestrante: Willian de Oliveira Barreiros Junior (doutorado)
Orientador: Prof George Teodoro
Title: Efficient Execution of Microscopy Image Analysis on Distributed Memory Hybrid Machines
Resumo: A análise de imagens de whole slide tissue image (WSIs) é uma tarefa computacionalmente cara, impactando negativamente no uso de dados de patologia em imagens em larga escala para pesquisa. Diversas soluções paralelas para otimizar tais aplicações já foram propostas, mirando no uso de dispositivos e ambientes, como CPUs, GPUs e/ou sistemas distribuídos. Porém, a execução eficiente de de código paralelo em máquinas híbridas e/ou distribuídas permanece um problema em aberto para histopatologia digital. Desenvolvedores de aplicações podem precisar implementar múltiplas versões de código para diferentes dispositivos de hardware. Desenvolvedores também precisam lidar com os desafios de distribuição eficiente de carga para nós computacionais de máquinas de memória distribuída, assim como para os dispositivos de execução de cada nó. Essa tarefa pode ser particularmente difícil para análise de imagens de alta resolução com custo computacional dependente de conteúdo. Este trabalho tem como objetivo propor uma solução para a simplificação do desenvolvimento de aplicações de análise de WSI, assegurando o uso eficiente de recursos distribuídos híbridos (CPU-GPU). Para esse fim foi proposto um modelo de execução de alto nível de abstração, em conjunto com um método de particionamento automático de carga. A fim de validar os métodos e algoritmos propostos, uma linguagem de processamento de imagem de alto nível de abstração (Halide) foi utilizada como solução de paralelismo local (CPU/GPU), junto com o Region Templates (RT), um sistema de gestão de coordenação de dados e tarefas entre nós distribuídos. Também foi desenvolvida uma nova estratégia cost-aware de particionamento de dados (CADP) que considera a irregularidade de custo de tarefas a fim de minimizar o desbalanceamento de carga.
Horário: 15h
Palestrante: Danilo José Bispo Galvão (mestrado)
Orientador: Prof a Genaína Rodrigues
Title: A model checking approach to verify robotic mission specifications
Abstract: MutRoSe (Multi-Robot systems mission Specification and decomposition) is a framework aimed at specifying and decomposing multi-robot missions in hierarchically defined tasks. Though it is capable of dynamically generating task instances of a given mission specification, MutRoSe doesn't contain a tool to verify if its specification input files are designed correctly. The approach aims to provide a mission specification verifier for MutRoSe through its translation in finite state automata; the verification is then done using temporal logics with the aid of the UPPAAL model checker tool.
Horário: 15h20
Palestrante: Ricardo José Menezes Maia (doutorado)
Orientador: Prof Ricardo Jacobi
Título: Framework para Aprendizado de Máquina com Dados Privados
Resumo: A evolução dos algoritmos de aprendizado de máquina, Machine Learning (ML), com um grande volume de dados proporcionam inúmeras aplicações benéficas à sociedade. Em contrapartida, esses algoritmos acessam as informações dos usuários sem proteções que garantem a privacidade dos dados. Resolver este problema é primordial, pois a informação é um recurso valioso na sociedade moderna, além do que, muitos dados sobre indivíduos e empresas são sensíveis. O desenvolvimento de algoritmos de ML com dados privados e a técnica criptográfica de computação multipartidária segura, Secure Multi-Party Computation (MPC), mesmo limitado a operações de soma e multiplicação, é viável, pois cada parte envolvida no treinamento e inferência não revela seu dado privado a outras partes. Contudo, essa limitação de operações impõe um desafio ao projetista ao mapear algoritmos para MPC, pois exigirá a busca por estratégias matemáticas para representar funções apenas com soma e multiplicação. Nesta pesquisa o objetivo é propor e implementar protocolos MPC para algoritmos de ML, de modo a garantir a privacidade de dados nas fases de treinamento e inferência. Foram criados protocolos MPC para resolver três problemas distintos: (i) implementar inferência privada de programas maliciosos, Malicious Software (malware), que utilizam algoritmos geradores de domínio, Domain Generation Algorithms (DGA), através dos modelos Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM) e MultiLayer Perceptron (MLP); (ii) desenvolver protocolo MPC para treinamento e inferência privada de COVID-19 com CNN e tendo como entrada imagens de raio-X de tórax; (iii) criar protocolo para modelos K-Nearest Neighbors (KNN) com distância Jaccard para sistemas de recomendação sobre dados privados de usuários. Para provar formalmente a segurança dos protocolos MPC utiliza-se do paradigma de simulação. Os resultados obtidos nas otimizações dos métodos são comparados com o estado da arte quanto a tempo de execução e taxas de erro.
Horário: 15h40
Palestrante: Dennis Savio Martins da Silva (doutorado)
Orientadora: Profa Maristela Holanda
Título: Uma Arquitetura para Dados Geoespaciais Massivos de Internet das Coisas
Resumo: A popularização da internet das coisas (Internet of Things - IoT) tem estimulado a utilização de ferramentas de big data para o armazenamento e análise dos dados geoespaciais massivos oriundos destas aplicações. Podem ser encontradas na literatura soluções diversas, que consideram dispositivos heterogêneos e com níveis de mobilidade variando do estacionário ao móvel. Considerar o nível de mobilidade dos dispositivos na escolha dos mecanismos de armazenamento e análise pode representar uma melhoria no funcionamento das aplicações IoT, ao possibilitar o uso de ferramentas com desempenho e funcionalidades mais apropriados ao padrão de dados de localização gerado por contextos específicos. Neste trabalho, é investigada a relação entre o nível de mobilidade dos dispositivos e o desempenho dos frameworks para dados massivos geoespaciais. Além disso, é proposta uma arquitetura para gerenciamento de dados geoespaciais massivos de IoT, que considere o nível de mobilidade dos dispositivos para oferecer recursos de armazenamento e análise mais adequados aos padrões de dados de localização e de observação presentes em uma aplicação.
Local: Teams MS - Equipe PPGI-316415 Seminário, Canal Seminários 1-2022
Profa Célia Ghedini Ralha (Este endereço de email está sendo protegido de spambots. Você precisa do JavaScript ativado para vê-lo.)
Coordenadora Seminários de Pós-Graduação em Informática 1-2022