Skip to content

[infra] <Possibilidade de baixar em formato parquet com o pacote R> #1694

@brunomioto

Description

@brunomioto

Sua solicitação de recurso está relacionada a um problema? Por favor descreva.
Algumas tabelas da base são bem grandes e salvar em .csv pode gerar arquivos bem grandes. O formato parquet tem muitas vantagens relacionadas à velocidade e tamanho do arquivo gerado.

Exemplo CSV:

library(basedosdados)

bare_query <- "SELECT *
FROM basedosdados.br_tse_eleicoes.detalhes_votacao_secao
WHERE ano = 2022
AND sigla_uf = \'SP\'"
basedosdados::download(query = bare_query,
                       path = "./teste.csv")
                       

Arquivo gerado: teste.csv 91.072 KB

Exemplo Parquet:

library(basedosdados)

bare_query <- "SELECT *
FROM basedosdados.br_tse_eleicoes.detalhes_votacao_secao
WHERE ano = 2022
AND sigla_uf = \'SP\'"
download_new(query = bare_query,
         path = "./teste2",
         format = "parquet")

Arquivo gerado: teste.parquet 15.334 KB

Este teste foi com uma base não tão grande. Mas com bases maiores, os ganhos podem ser ainda maiores.

Descreva a solução que você gostaria
Tenho essa funcionalidade implementada na função download() do pacote R. Gostaria de saber se posso subir.

Metadata

Metadata

Labels

enhancementNew feature or request

Type

No type

Projects

Status

Backlog

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions