Projeto de Iniciação Científica Matteus Guilherme de Souza

Este projeto é o repositório para o projeto de Iniciação Científica de Matteus Guilherme de Souza.

O projeto tem como objetivo a utilização do algoritmo PBG para a extração de tópicos de discursos transcritos da Câmara dos Deputados.

Necessidades

É necessário a utilização do código do algoritmo PBG feito por Thiago Faleiros em https://github.com/thiagodepaulo/PyPBG .

O código deve ser baixado e então transformado para uma biblioteca Python existente na versão a ser utilizada do Python.

É necessário o uso do Python 3.6 ou superior.

Instalação do pacote pyPBG

Instalação no Python principal da máquina

Para a realização da instalação diretamente no Python da máquina deve-se utilizar o comando

sudo python3 setup.py install

na pasta onde o projeto pyPBG está instalado.

Instalação com a utilização de venv

Para este psso é necessário primeiramente configurar o virtual enviroment do python para que ele execute os comandos do Python e instale as bibliotecas no local especificado e não na pasta principal do Python na máquina.

Passando então para o comando a ser utilizado caso esteja-se com um virtual enviroment configurado, tem-se que o comando deve ser

sudo {virtualenviroment}/{folder}/{path}/bin/python setup.py install

Para as duas aplicações, tem-se que o pacote deve estar instalado no Python a ser utilizado.

Instalação dos demais pacotes necessários

Os demais pacotes a serem instalados podem ser obtidos com ajuda da pip, gerente de pacotes padrçao do Python.

Para tal, na pasta principal deste projeto, tem-se um arquivo nomeado requirements.txt, que será utilizado para a realização da instalação dos pacotes.

Estando na mesma pasta que este arquivo, no terminal de comando, deve-se digitar o seguinte comando

python3 -m pip install -r requirements.txt

Ao final, todos os pacotes necessários para a execução do pacote devem estar inclusos

Explicação das diversas partes

Existem alguns algoritmos de bibliotecas espalhados

Coleta dos discursos

Primeiro e o principal para a coleta dos discursos é o algoritmo scrap_discursos.py.

A função principal deste algoritmo é a função reqPartidos, que fará a requisição dos discursos de todos os deputados de um ou mais partidos. Há diversos outros parâmetros que podem ser configurados, como as datas de início e fim da coleta, o identificador de uma legislatura específica, ordem ascendete ou decrescente e o que deve ser utilizado para realizar a ordenação.

Caso queira utilizar as funções para coleta dos discursos de um determinado deputado por exemplo, deve-se saber o identificador de tal parlamentar. Tal informação além de outras pode ser obtida na página da API, no caso: https://dadosabertos.camara.leg.br/swagger/api.html .

Estruturas internas do código

O código utiliza algumas classes para realizar o armazenamento e manejamento dos discursos. As 3 principais classes são Partido, Deputado e Discurso. As classes são mapeamentos dos dados vindos da API para cada um dos tipos de dados utilizados.

Código Scraper.py

Este código possui como objetivo a coleta de dados da API para diversos partidos, salvando cada um dos partidos em um arquivo separado.

Para a seleção dos diversos partidos deve-se criar um arquivo partidos.txt.

Name		Name	Last commit message	Last commit date
Latest commit History 57 Commits
Câmara dos Deputados		Câmara dos Deputados
converte_rede		converte_rede
imagens/relatorio_parcial		imagens/relatorio_parcial
.gitignore		.gitignore
README.md		README.md
extractors_class.py		extractors_class.py
metricas.py		metricas.py
partidos.txt		partidos.txt
partidos_gov.txt		partidos_gov.txt
partidos_opo.txt		partidos_opo.txt
polarities_pos.txt		polarities_pos.txt
preprocess.py		preprocess.py
processer.py		processer.py
requirements.txt		requirements.txt
stop_words.txt		stop_words.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projeto de Iniciação Científica Matteus Guilherme de Souza

Necessidades

Instalação do pacote pyPBG

Instalação no Python principal da máquina

Instalação com a utilização de venv

Instalação dos demais pacotes necessários

Explicação das diversas partes

Coleta dos discursos

Estruturas internas do código

Código Scraper.py

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Projeto de Iniciação Científica Matteus Guilherme de Souza

Necessidades

Instalação do pacote pyPBG

Instalação no Python principal da máquina

Instalação com a utilização de venv

Instalação dos demais pacotes necessários

Explicação das diversas partes

Coleta dos discursos

Estruturas internas do código

Código Scraper.py

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages