Data mining guided by the educational domain: a proof of concept
DOI:
https://doi.org/10.18222/eae.v30i74.5696Keywords:
Prova Brasil, Data Mining, Educational Policies, School PerformanceAbstract
This paper aims to propose a methodology for identifying patterns related to learning mathematics and the characteristics of the school environment. It was applied to the data of the Prova Brasil 2013, focusing on students in their 9th year of education, in the state of Rio de Janeiro. The approach, supported by education experts, consists of proposing a dimensionality reduction process integrated to data mining. Its evaluation was conducted using technical measures together with measures of interest to the educational domain. This approach made it possible to identify actions, as well as to analyze their viability, to solve educational issues. The methodology, guided by the area of application and the evaluation of which is not restricted to the use of technical metrics of data mining, can serve as a reference – a proof of concept – for other studies of educational actions and policies.
Downloads
References
ADEJUWON, A.; MOSAVI, A. Domain driven data mining. IJCSI International Journal of Computer Science Issues, Mahebourg, Republic of Mauritius, v. 7, n. 2, p. 41-44, July 2010.
BARBOSA, A. Os salários dos professores brasileiros: implicações para o trabalho docente. 2011. 208 f. Tese (Doutorado em Educação Escolar) – Universidade Estadual Paulista “Júlio de Mesquita Filho”, Faculdade de Ciências e Letras de Araraquara, Araraquara, SP, 2011.
BARBOSA, M.; RANDALL, L. Desigualdades sociais e a formação de expectativas familiares e de professores. Caderno CRH,Salvador, v. 17, n. 41, p. 299-308, maio/ago. 2004. DOI: https://doi.org/10.9771/ccrh.v17i41.18496
BAUER, A. É possível relacionar avaliação discente e formação de professores? A experiência de São Paulo. Educação em Revista, Belo Horizonte, v. 28, n. 2, p. 61-82, jun. 2012. DOI: https://doi.org/10.1590/S0102-46982012000200004
BAUER, A.; GATTI, B. A. (org.). Vinte cinco anos de avaliação de sistemas educacionais no Brasil: origens nas redes de ensino, no currículo e na formação de professores. Florianópolis: Insular, 2013. v. 2.
BAUER, A.; GATTI, B. A.; TAVARES, M. R. (org.). Vinte e cinco anos de avaliação de sistemas educacionais no Brasil: origens e pressupostos. Florianópolis: Insular, 2013. v. 1.
BEZERRA, C.; SCHOLZ, R; ADEODATO, P; PONTES, R; SILVA, I. Evasão escolar: aplicando mineração de dados para identificar variáveis relevantes. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO, 2016, Uberlândia, MG. Anais [...]. Uberlândia: Sociedade Brasileira de Computação, 2016. p. 1096-1105. DOI: https://doi.org/10.5753/cbie.sbie.2016.1096
BRASIL. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. SAEB 2001: novas perspectivas. Brasília: Inep, 2001.
BRASIL. Programa Brasil Alfabetizado. Brasília: Ministério da Educação, 2011. Disponível em: http://portal.mec.gov.br/programa-brasil-alfabetizado. Acesso em: 1 ago. 2017.
BRASIL. Ministério da Educação. Secretaria de Educação Básica. Diretoria de Currículos e Educação Integral. Diretrizes Curriculares Nacionais Gerais da Educação Básica. Brasília: MEC, 2013. Disponível em: http://portal.mec.gov.br/docman/julho-2013-pdf/13677-diretrizes-educacao-basica2013-pdf/file. Acesso em: 1 ago. 2017.
BRASIL. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Microdados da Aneb e da Anresc 2013. Brasília: Inep, 2015. Disponível em: http://portal.inep.gov.br/microdados#. Acesso em: 2 set. 2019.
BRASIL. Ministério da Educação. Educação de jovens e adultos é prioridade para o governo. Brasília: MEC, 2016. Disponível em: http://portal.mec.gov.br/busca-geral/204-noticias/10899842/41601educacao-de-jovens-e-adultos-e-prioridade-para-o-governo. Acesso em: 15 ago. 2017.
CAO, L. Domain-driven data mining: challenges and prospects. IEEE Transactions on Knowledge and Data Engineering, Piscataway, v. 22, n. 6, p. 755-769, June 2010. DOI: https://doi.org/10.1109/TKDE.2010.32
CAO, L.; YU, P. S.; ZHANG, C.; ZHAO, Y. Domain driven data mining. New York: Springer, 2010. DOI: https://doi.org/10.1007/978-1-4419-5737-5
CAO, L.; ZHANG, C. Domain-driven data mining: a practical methodology. International Journal of Data Warehousing & Mining, Sydney, v. 2, n. 4, p. 49-65, Jan. 2005. DOI: https://doi.org/10.4018/jdwm.2006100103
CLARK, A. C.; WATSON, D. Constructing validity: basic issues in objective scale development. Psychological Assessment, Washington, v. 7, n. 3, p. 309-319, Sept. 1995. DOI: https://doi.org/10.1037//1040-3590.7.3.309
COLLEMAN, J. S. Equality of education opportunity. Washington: National Center for Educational Statistics, 1966.
CRONBACH, L. Coefficient alpha and the internal structure of tests. Psychometrika, Madison, v. 16, n. 3, p. 297-334, Sept. 1951. DOI: https://doi.org/10.1007/BF02310555
DAMIAN, M. F. Discurso pedagógico e fracasso escolar. Ensaio:Avaliação e Políticas Públicas em Educação, Rio de Janeiro, v. 14, n. 53, p. 457-478, out./dez. 2006. DOI: https://doi.org/10.1590/S0104-40362006000400004
FAYYAD, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery in databases. AI Magazine,Anaheim, v. 17, n. 3, p. 37-54, Mar. 1996.
FERNANDES, E.; HOLANDA, M.; VICTORINO, M.; BORGES, V.; CARVALHO, R.; ERVEN, G.V. Educational data mining: predictive analysis of academic performance of public school students in the capital of Brazil. Journal of Business Research, v. 94, p. 335-343, Feb. 2018. https://doi.org/10.1016/j.jbusres.2018.02.012. DOI: https://doi.org/10.1016/j.jbusres.2018.02.012
FONSECA, S. O. Uma metodologia de mineração de dados orientada pelo domínio para a descoberta de conhecimento sobre o processo de aprendizagem no ensino básico. 2018. 200 f. Tese (Doutorado em Modelagem Computacional) – Instituto Politécnico, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2018.
FONSECA, S. O.; NAMEN, A. A. Mineração em bases de dados do Inep: uma análise exploratória para nortear melhorias no sistema educacional brasileiro.Educação em Revista, Belo Horizonte, v. 32, n. 1, p. 133-157, mar. 2016. DOI: https://doi.org/10.1590/0102-4698140742
FRANCO, C.; FERNANDES, C.; SOARES, J. F.; BELTRÃO, K.; BARBOSA, M. E.; ALVES, M. T. G. O referencial teórico na construção dos questionários contextuais do Saeb 2001. Estudos em Avaliação Educacional, São Paulo, n. 28, p. 39-74, jul./dez. 2003. DOI: https://doi.org/10.18222/eae02820032169
GOMES, J. C.; LEVY, A.; LACHTERMACHER, G. Segmentação do censo educacional 2000 utilizando técnicas de mineração de dados. O Impacto da pesquisa operacional nas novas tendências multidisciplinares. In:SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL,36., 2004, São João del-Rei, MG. Anais [...]. São João del-Rei, MG: Sociedade Brasileira de Pesquisa Operacional, 2004. p. 820-831.
HAIR, J. F.; ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C. Análise multivariada de dados. 5. ed. Porto Alegre: Bookman, 2005.
HAN, J.; KAMBER, M.; PEI, J. Data mining: concepts and techniques. 3. ed. Waltham: Morgan Kaufmann, 2012.
IBM CORPORATION. IBM SPSS Statistics. Versão 23. New York: IBM Corporation, 1989.
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO DE JANEIRO – IFRJ. Edital n. 44/2016 – Concurso Público – Professor de Ensino Básico, Técnico e Tecnológico. Rio de Janeiro: IFRJ, 2016. Disponível em: https://migra.ifrj.edu.br/webfm_send/10632. Acesso em: 2 set. 2019.
JESUS, G. R.; LAROS, J. A. Eficácia escolar: regressão multinível com dados de avaliação em larga escala. Avaliação Psicológica, v. 3, n. 2, p. 93-106, nov. 2004.
JOHN, G. H.; LANGLEY, P. Estimating continuous distributions in Bayesian classifiers. In:CONFERENCE ON UNCERTAINTY IN ARTIFICIAL INTELLIGENCE, 11., 1995, Montreal. Anais [...].
San Francisco: Morgan Kaufmann, 1995. p. 338-345.
KAMPFF, A. J. C.; REATEGUI, E. B.; LIMA, J. V. de. Mineração de dados educacionais para a construção de alertas em ambientes virtuais de aprendizagem como apoio à prática docente. Novas Tecnologias na Educação, Porto Alegre, v. 6, n. 2, dez. 2008. DOI: https://doi.org/10.22456/1679-1916.14394
KARINO, C. A.; VINHA, L. G. A.; LAROS, J. A. Os questionários do SAEB: o que eles realmente medem? Estudos em Avaliação Educacional, São Paulo, v. 25, n. 59, p. 270-297, set./dez. 2014. DOI: https://doi.org/10.18222/eae255920142948
KLEIN, R. Utilização da Teoria de Resposta ao Item no Sistema Nacional de Avaliação da Educação Básica (SAEB). Ensaio: Avaliação e Políticas Públicas em Educação, Rio de Janeiro, v. 11, n. 40, p. 283-296, 2003.
KLINE, P. The handbook of psychological testing. Londres: Routledge, 1999.
ORTIGÃO, M. I. R.; AGUIAR, G. S. Repetência escolar nos anos iniciais do ensino fundamental: evidências a partir dos dados da Prova Brasil 2009. Revista Brasileira de Estudos Pedagógicos, Brasília, v. 94, n. 237, p. 364-389, ago. 2013. DOI: https://doi.org/10.1590/S2176-66812013000200003
ORTIGÃO, M. I. R.; FRANCO, C.; CARVALHO, J. B. P. de. A distribuição social do currículo de matemática: quem tem acesso a tratamento da informação? Educação Matemática Pesquisa, São Paulo, v. 9, n. 2, p. 249-273, dez. 2007.
PIETY, P. J. Assessing the educational data movement. New York: Teachers College, 2013.
POSTGRESQL GLOBAL DEVELOPMENT GROUP. PostgreSQL Database Management System. Versão 9.2. Berkeley: PostgreSQL Global Development Group, c1995. Disponível em: https://www.postgresql. org. Acesso em: 1 jan. 2015.
REIS, M. C.; RAMOS, L. Escolaridade dos pais, desempenho no mercado de trabalho e desigualdade de rendimentos. Revista Brasileira de Economia, Rio de Janeiro, v. 65, n. 2, p. 177-205, abr./jun. 2011.
ROBINSON, J. P.; SHAVER, P. R.; WRIGHTSMAN, L. S. Criteria for scale selection and evaluation. In: ROBINSON, J. P.; SHAVER, P. R.; WRIGHTSMAN, L. S (ed.). Measures of personality and social psychological attitudes. San Diego: Academic Press, 1991. p. 1-16. DOI: https://doi.org/10.1016/B978-0-12-590241-0.50005-8
RODRIGUES, R. L.; RAMOS, J. L. C.; SILVA, J. C. S.; GOMES, A. S. A literatura brasileira sobre mineração de dados educacionais. In: CONGRESSO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO, 2014, Dourados, MS. Anais [...]. Dourados, MS: Sociedade Brasileira de Computação, 2014. p. 621-630. DOI: https://doi.org/10.5753/cbie.wcbie.2014.621
ROMERO, C.; VENTURA, S. Data mining in education. Wiley interdisciplinary reviews: data mining and knowledge discovery, New York, v. 3, n. 1, p. 12-27, Dec. 2013. DOI: https://doi.org/10.1002/widm.1075
ROSENTHAL, R.; JACOBSON, L. Teachers’ expectancies: determinates of pupils’ I. Q. gains. Psychological Reports, Boston, v. 19, n. 1, p. 115-118, Aug. 1966. DOI: https://doi.org/10.2466/pr0.1966.19.1.115
SMITH, L. A tutorial on principal components analysis. New York: Cornell University, 2002.
SOARES, J. F. Melhoria do desempenho cognitivo dos alunos do ensino fundamental. Cadernos de Pesquisa, São Paulo, v. 37, n. 130, p. 135-160, jan./abr. 2007. Disponível em: http://www.scielo.br/ pdf/cp/v37n130/07.pdf . Acesso em: 10 dez. 2017. DOI: https://doi.org/10.1590/S0100-15742007000100007
STEVENS, J. P. Applied multivariate statistics for the social sciences. 2. ed. Hillsdale: Erlbaum, 1992.
TCHIBOZO, G. Applications in data analysis for educational research. Policy Futures in Education, Paris, v. 7, n. 4, p. 364-367, Jan. 2009. DOI: https://doi.org/10.2304/pfie.2009.7.4.364
UNIVERSITY OF WAIKATO. Weka. Versão 3.6.9. Waikato: University of Waikato, 1999. Disponível em: https://www.cs.waikato.ac.nz/ml/weka/. Acesso em: 2 set. 2019.
VASCONCELLOS, S. S. de; MATTOS, C. L. G. de. O absenteísmo escolar e sua regulamentação. In: MATTOS, C. L. G.; CASTRO, P. A. Etnografia e educação: conceitos e usos. Campina Grande: EDUEPB, 2011. p. 271-294. DOI: https://doi.org/10.7476/9788578791902.0013
VELOSO, F.; PESSOA, S.; HENRIQUES, R.; GIAMBIAGI, F. (org.). Educação básica no Brasil: construindo o país do futuro. Rio de Janeiro: Elsevier, 2009.
WITTEN, I. H.; FRANK, E.; HALL, M. A. Data mining: practical machine learning tools and techniques. 3. ed. San Francisco: Morgan Kaufmann, 2011. DOI: https://doi.org/10.1016/B978-0-12-374856-0.00001-8
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2019 Stella Oggioni da Fonseca, Anderson Amendoeira Namen, Francisco Duarte Moura Neto, Adriana da Rocha Silva, Maria Isabel Ramalho Ortigão, Ursula Andrea Barbara Verdugo Rohrer

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
a. Authors retain the copyright and grant the journal the right to first publication.
b. All works are licensed under the Creative Commons Attribution License, which allows the sharing of the paper with acknowledgment of authorship.
Until 2024, Estudos em Avaliação Educacional adopted the Creative Commons Attribution-NonCommercial (CC BY-NC) license for its publications. For texts published from 2025 onwards, the journal will adopt the Creative Commons Attribution (CC BY) license, in line with the principles of Open Science.





