Bootcamp: Cientista de Dados¶
Objetivo da Análise¶
Analisar a distribuição de alunos matriculados por dependência administrativa da escola por Estado.
Pergunta de Negócio¶
Qual o peso da rede pública vs. privada na educação básica por estado?
Isso pode ajudar:
- A orientar investimentos federais ou estaduais.
- A mostrar desigualdade no acesso à educação pública.
- A entender o papel da iniciativa privada na educação básica.
In [7]:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("microdados_ed_basica_2023.csv", sep=';', encoding='latin1', low_memory=False)
In [8]:
df.info()
<class 'pandas.core.frame.DataFrame'> RangeIndex: 217625 entries, 0 to 217624 Columns: 408 entries, NU_ANO_CENSO to QT_TUR_MED_INT dtypes: float64(378), int64(14), object(16) memory usage: 677.4+ MB
In [9]:
# Agrupar quantidade total de matrículas por tipo de escola e estado
tabela = df.groupby(['TP_DEPENDENCIA', 'SG_UF'])['QT_MAT_BAS'].sum().reset_index()
# Mapear valores legíveis
tabela['TP_DEPENDENCIA'] = tabela['TP_DEPENDENCIA'].map({
1: 'Federal',
2: 'Estadual',
3: 'Municipal',
4: 'Privada'
})
# Pivot para tabela com estados em linhas e tipo de escola em colunas
pivot = tabela.pivot(index='SG_UF', columns='TP_DEPENDENCIA', values='QT_MAT_BAS')
pivot.head()
Out[9]:
| TP_DEPENDENCIA | Estadual | Federal | Municipal | Privada |
|---|---|---|---|---|
| SG_UF | ||||
| AC | 139704.0 | 3236.0 | 96130.0 | 14848.0 |
| AL | 171008.0 | 10381.0 | 579114.0 | 130906.0 |
| AM | 421864.0 | 10615.0 | 620650.0 | 96469.0 |
| AP | 109122.0 | 2205.0 | 78801.0 | 23217.0 |
| BA | 679936.0 | 22414.0 | 2160105.0 | 578073.0 |
In [10]:
pivot.plot(kind='bar', stacked=True, figsize=(14,6))
plt.title("Matrículas por Tipo de Escola em Cada Estado")
plt.ylabel("Quantidade de Matrículas")
plt.xlabel("Estado")
plt.legend(title="Dependência Administrativa")
plt.tight_layout()
plt.show()