Feriados da Anbima

feriados-anbima.livemd

Philip Sampaio

@philss

feriados-anbima

Share to X

Share to Bluesky

More notebooks

Feriados da Anbima

Mix.install([
  {:opq, "~> 4.0"},
  {:explorer, "~> 0.10.1"},
  {:floki, "~> 0.36.3"},
  {:req, "~> 0.5.8"}
])

Configurações

url_base = "https://www.anbima.com.br/feriados/feriados.asp"

diretorio_tmp = System.tmp_dir!()

# Usando `mkdir_p` pois é idempotente.
:ok = File.mkdir_p!("anual")
:ok = File.mkdir_p!("completo")

{:ok, opq} = OPQ.init(workers: 3, interval: 700)

Links de cada ano

pagina_principal = Req.get!(url_base)
uri = URI.new!(url_base)
# Atualiza o path p/ uma lista sem a última parte.
uri = %{uri | path: Path.split(uri.path) |> Enum.slice(0..-2//1)}

html = Floki.parse_document!(pagina_principal.body)

links =
  html
  |> Floki.find(":fl-contains('Ano')")
  |> Floki.attribute("href")
  |> Enum.map(fn relativo ->
    URI.to_string(%{uri | path: IO.iodata_to_binary([uri.path, "/", relativo])})
  end)

Processando cada ano

# Vamos salvar o HTML de cada ano no diretório temporário.
# Isso pode demorar ou retornar erro, dependendo do servidor da Anbima.
arquivos =
  Enum.map(links, fn link ->
    ano = String.replace(link, ~r/[^0-9]/, "")
    path = Path.join(diretorio_tmp, ano <> ".html")

    OPQ.enqueue(opq, fn ->
      body = Req.get!(link).body
      File.write!(path, body)
    end)

    {ano, path}
  end)

require Explorer.DataFrame, as: DF
alias Explorer.Series

dfs =
  for {ano, arquivo} <- arquivos do
    arquivo
    |> File.read!()
    |> Floki.parse_document!()
    |> Floki.find("tr")
    |> Enum.flat_map(fn linha ->
      case linha do
        # Nós pegaremos somente as linhas que contém 3 colunas "parecidas"
        # com o que estamos buscando.
        {"tr", _attrs, [{"td", _, [t0]}, {"td", _, [t1]}, {"td", _, [t2]}]}
        when is_binary(t0) and is_binary(t1) and is_binary(t2) ->
          if String.match?(t0, ~r/[0-9]{1,2}\/[0-9]{1,2}\/[0-9]{2}/) do
            [%{ano: String.to_integer(ano), data: t0, dia_da_semana: t1, descricao: t2}]
          else
            []
          end

        _ ->
          []
      end
    end)
    |> DF.new([dtypes: [descricao: :category, dia_da_semana: :category]])
    |> DF.mutate([data: Series.cast(Series.strptime(data, "%d/%m/%y"), :date)])
  end

Salvando arquivos

for df <- dfs do
  ano = df[:ano][0]
  DF.to_csv!(df, "anual/feriados-anbima-#{ano}.csv")
end

dfs
|> DF.concat_rows()
|> then(fn df ->
  DF.to_csv!(df, "completo/feriados-anbima.csv")
  DF.to_parquet!(df, "completo/feriados-anbima.parquet")
end)

Other notebooks:

@andyl

elix_util

MNIST

mnist.livemd

tutorial advanced data-science req axon exla nx

2022-8-18
Kevin Pan
@feng19

spider_man

ElixirJobs

elixirjobs.livemd

tutorial advanced spider_man floki nimble_csv kino

2022-8-18
Jeremy Brayton
@w0rd-driven

livebook_notebooks

Scratchpad

scratchpad.livemd

tutorial intermediate spider_man floki timex

2022-8-18
Jeremy Brayton
@w0rd-driven

livebook_notebooks

Job Application Fields to Markdown

req--job_fields.livemd

tutorial intermediate kino kino_lab kino_vega_lite kino_db req req_easyhtml

2022-8-18
Numerical Elixir (Nx)
@elixir-nx

axon

Classifying handwritten digits

mnist.livemd

tutorial advanced data-science axon nx exla req

2026-7-7
Ammar Massoud
@ammar-mohamed-massoud

Dockyard-Academy

Timer

timer.livemd

tutorial advanced gen-server jason kino youtube hidden_cell

2026-7-7
@DeSchoel

Elixir_Curriculum

Fun Formulas

fun_formulas.livemd

tutorial beginner jason kino youtube hidden_cell

2026-7-5

Back