Bootcamp: Cientista de Dados¶

Objetivo da Análise¶

Analisar a distribuição de alunos matriculados por dependência administrativa da escola por Estado.

Pergunta de Negócio¶

Qual o peso da rede pública vs. privada na educação básica por estado?

Isso pode ajudar:

  • A orientar investimentos federais ou estaduais.
  • A mostrar desigualdade no acesso à educação pública.
  • A entender o papel da iniciativa privada na educação básica.
In [7]:
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv("microdados_ed_basica_2023.csv", sep=';', encoding='latin1', low_memory=False)
In [8]:
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 217625 entries, 0 to 217624
Columns: 408 entries, NU_ANO_CENSO to QT_TUR_MED_INT
dtypes: float64(378), int64(14), object(16)
memory usage: 677.4+ MB
In [9]:
# Agrupar quantidade total de matrículas por tipo de escola e estado
tabela = df.groupby(['TP_DEPENDENCIA', 'SG_UF'])['QT_MAT_BAS'].sum().reset_index()

# Mapear valores legíveis
tabela['TP_DEPENDENCIA'] = tabela['TP_DEPENDENCIA'].map({
    1: 'Federal',
    2: 'Estadual',
    3: 'Municipal',
    4: 'Privada'
})

# Pivot para tabela com estados em linhas e tipo de escola em colunas
pivot = tabela.pivot(index='SG_UF', columns='TP_DEPENDENCIA', values='QT_MAT_BAS')
pivot.head()
Out[9]:
TP_DEPENDENCIA Estadual Federal Municipal Privada
SG_UF
AC 139704.0 3236.0 96130.0 14848.0
AL 171008.0 10381.0 579114.0 130906.0
AM 421864.0 10615.0 620650.0 96469.0
AP 109122.0 2205.0 78801.0 23217.0
BA 679936.0 22414.0 2160105.0 578073.0
In [10]:
pivot.plot(kind='bar', stacked=True, figsize=(14,6))
plt.title("Matrículas por Tipo de Escola em Cada Estado")
plt.ylabel("Quantidade de Matrículas")
plt.xlabel("Estado")
plt.legend(title="Dependência Administrativa")
plt.tight_layout()
plt.show()
No description has been provided for this image