Data mining guided by the educational domain: a proof of concept

Authors

  • Stella Oggioni da Fonseca Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro-RJ, Brasil
  • Anderson Amendoeira Namen Universidade do Estado do Rio de Janeiro (UERJ) e Universidade Veiga de Almeida (UVA), Rio de Janeiro-RJ, Brasil
  • Francisco Duarte Moura Neto Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro-RJ, Brasil
  • Adriana da Rocha Silva Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro-RJ, Brasil
  • Maria Isabel Ramalho Ortigão Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro-RJ, Brasil
  • Ursula Andrea Barbara Verdugo Rohrer Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro-RJ, Brasil

DOI:

https://doi.org/10.18222/eae.v30i74.5696

Keywords:

Prova Brasil, Data Mining, Educational Policies, School Performance

Abstract

This paper aims to propose a methodology for identifying patterns related to learning mathematics and the characteristics of the school environment. It was applied to the data of the Prova Brasil 2013, focusing on students in their 9th year of education, in the state of Rio de Janeiro. The approach, supported by education experts, consists of proposing a dimensionality reduction process integrated to data mining. Its evaluation was conducted using technical measures together with measures of interest to the educational domain. This approach made it possible to identify actions, as well as to analyze their viability, to solve educational issues. The methodology, guided by the area of application and the evaluation of which is not restricted to the use of technical metrics of data mining, can serve as a reference – a proof of concept – for other studies of educational actions and policies.

Downloads

Download data is not yet available.

Author Biographies

Stella Oggioni da Fonseca, Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro-RJ, Brasil

Doutora em Modelagem Computacional - Programa de Pós-Graduação em Modelagem Computacional do Instituto Politécnico da Universidade do Estado do Rio de Janeiro.

Anderson Amendoeira Namen, Universidade do Estado do Rio de Janeiro (UERJ) e Universidade Veiga de Almeida (UVA), Rio de Janeiro-RJ, Brasil

Doutor em Engenharia de Sistemas e Computação pela Universidade Federal do Rio de Janeiro (COPPE/UFRJ). Professor Adjunto do Instituto Politécnico da Universidade do Estado do Rio de Janeiro (IPRJ/UERJ) e Professor Assistente da Universidade Veiga de Almeida, Rio de Janeiro, Brasil.

Francisco Duarte Moura Neto, Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro-RJ, Brasil

PhD em Matemática pela Universidade da Califórnia (UC Berkeley). Professor Associado do Instituto Politécnico da Universidade do Estado do Rio de Janeiro (IPRJ/UERJ) e atualmente Professor Visitante do Instituto de Matemática Pura e Aplicada (IMPA), Rio de Janeiro, Brasil.

Adriana da Rocha Silva, Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro-RJ, Brasil

Mestranda em Modelagem Computacional pelo Instituto Politécnico da Universidade do Estado do Rio de Janeiro (IPRJ/UERJ). Tutora presencial do Centro de Educação a Distância do Estado do Rio de Janeiro (Cecierj), Nova Friburgo, Rio de Janeiro, Brasil.

Maria Isabel Ramalho Ortigão, Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro-RJ, Brasil

Doutora em Educação pela Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio). Professora Adjunta da Faculdade de Educação da Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro, Brasil.

Ursula Andrea Barbara Verdugo Rohrer, Universidade do Estado do Rio de Janeiro (UERJ), Rio de Janeiro-RJ, Brasil

Doutora em Matemática pela Universidade de Bielefeld, Alemanha. Professora Adjunta do Instituto Politécnico da Universidade do Estado do Rio de Janeiro (IPRJ/UERJ), Nova Friburgo, Rio de Janeiro, Brasil.

References

ADEJUWON, A.; MOSAVI, A. Domain driven data mining. IJCSI International Journal of Computer Science Issues, Mahebourg, Republic of Mauritius, v. 7, n. 2, p. 41-44, July 2010.

BARBOSA, A. Os salários dos professores brasileiros: implicações para o trabalho docente. 2011. 208 f. Tese (Doutorado em Educação Escolar) – Universidade Estadual Paulista “Júlio de Mesquita Filho”, Faculdade de Ciências e Letras de Araraquara, Araraquara, SP, 2011.

BARBOSA, M.; RANDALL, L. Desigualdades sociais e a formação de expectativas familiares e de professores. Caderno CRH,Salvador, v. 17, n. 41, p. 299-308, maio/ago. 2004.

BAUER, A. É possível relacionar avaliação discente e formação de professores? A experiência de São Paulo. Educação em Revista, Belo Horizonte, v. 28, n. 2, p. 61-82, jun. 2012.

BAUER, A.; GATTI, B. A. (org.). Vinte cinco anos de avaliação de sistemas educacionais no Brasil: origens nas redes de ensino, no currículo e na formação de professores. Florianópolis: Insular, 2013. v. 2.

BAUER, A.; GATTI, B. A.; TAVARES, M. R. (org.). Vinte e cinco anos de avaliação de sistemas educacionais no Brasil: origens e pressupostos. Florianópolis: Insular, 2013. v. 1.

BEZERRA, C.; SCHOLZ, R; ADEODATO, P; PONTES, R; SILVA, I. Evasão escolar: aplicando mineração de dados para identificar variáveis relevantes. In: SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO, 2016, Uberlândia, MG. Anais [...]. Uberlândia: Sociedade Brasileira de Computação, 2016. p. 1096-1105.

BRASIL. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. SAEB 2001: novas perspectivas. Brasília: Inep, 2001.

BRASIL. Programa Brasil Alfabetizado. Brasília: Ministério da Educação, 2011. Disponível em: http://portal.mec.gov.br/programa-brasil-alfabetizado. Acesso em: 1 ago. 2017.

BRASIL. Ministério da Educação. Secretaria de Educação Básica. Diretoria de Currículos e Educação Integral. Diretrizes Curriculares Nacionais Gerais da Educação Básica. Brasília: MEC, 2013. Disponível em: http://portal.mec.gov.br/docman/julho-2013-pdf/13677-diretrizes-educacao-basica2013-pdf/file. Acesso em: 1 ago. 2017.

BRASIL. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Microdados da Aneb e da Anresc 2013. Brasília: Inep, 2015. Disponível em: http://portal.inep.gov.br/microdados#. Acesso em: 2 set. 2019.

BRASIL. Ministério da Educação. Educação de jovens e adultos é prioridade para o governo. Brasília: MEC, 2016. Disponível em: http://portal.mec.gov.br/busca-geral/204-noticias/10899842/41601educacao-de-jovens-e-adultos-e-prioridade-para-o-governo. Acesso em: 15 ago. 2017.

CAO, L. Domain-driven data mining: challenges and prospects. IEEE Transactions on Knowledge and Data Engineering, Piscataway, v. 22, n. 6, p. 755-769, June 2010.

CAO, L.; YU, P. S.; ZHANG, C.; ZHAO, Y. Domain driven data mining. New York: Springer, 2010.

CAO, L.; ZHANG, C. Domain-driven data mining: a practical methodology. International Journal of Data Warehousing & Mining, Sydney, v. 2, n. 4, p. 49-65, Jan. 2005.

CLARK, A. C.; WATSON, D. Constructing validity: basic issues in objective scale development. Psychological Assessment, Washington, v. 7, n. 3, p. 309-319, Sept. 1995.

COLLEMAN, J. S. Equality of education opportunity. Washington: National Center for Educational Statistics, 1966.

CRONBACH, L. Coefficient alpha and the internal structure of tests. Psychometrika, Madison, v. 16, n. 3, p. 297-334, Sept. 1951.

DAMIAN, M. F. Discurso pedagógico e fracasso escolar. Ensaio:Avaliação e Políticas Públicas em Educação, Rio de Janeiro, v. 14, n. 53, p. 457-478, out./dez. 2006.

FAYYAD, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. From data mining to knowledge discovery in databases. AI Magazine,Anaheim, v. 17, n. 3, p. 37-54, Mar. 1996.

FERNANDES, E.; HOLANDA, M.; VICTORINO, M.; BORGES, V.; CARVALHO, R.; ERVEN, G.V. Educational data mining: predictive analysis of academic performance of public school students in the capital of Brazil. Journal of Business Research, v. 94, p. 335-343, Feb. 2018. https://doi.org/10.1016/j.jbusres.2018.02.012.

FONSECA, S. O. Uma metodologia de mineração de dados orientada pelo domínio para a descoberta de conhecimento sobre o processo de aprendizagem no ensino básico. 2018. 200 f. Tese (Doutorado em Modelagem Computacional) – Instituto Politécnico, Universidade do Estado do Rio de Janeiro, Rio de Janeiro, 2018.

FONSECA, S. O.; NAMEN, A. A. Mineração em bases de dados do Inep: uma análise exploratória para nortear melhorias no sistema educacional brasileiro.Educação em Revista, Belo Horizonte, v. 32, n. 1, p. 133-157, mar. 2016.

FRANCO, C.; FERNANDES, C.; SOARES, J. F.; BELTRÃO, K.; BARBOSA, M. E.; ALVES, M. T. G. O referencial teórico na construção dos questionários contextuais do Saeb 2001. Estudos em Avaliação Educacional, São Paulo, n. 28, p. 39-74, jul./dez. 2003.

GOMES, J. C.; LEVY, A.; LACHTERMACHER, G. Segmentação do censo educacional 2000 utilizando técnicas de mineração de dados. O Impacto da pesquisa operacional nas novas tendências multidisciplinares. In:SIMPÓSIO BRASILEIRO DE PESQUISA OPERACIONAL,36., 2004, São João del-Rei, MG. Anais [...]. São João del-Rei, MG: Sociedade Brasileira de Pesquisa Operacional, 2004. p. 820-831.

HAIR, J. F.; ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C. Análise multivariada de dados. 5. ed. Porto Alegre: Bookman, 2005.

HAN, J.; KAMBER, M.; PEI, J. Data mining: concepts and techniques. 3. ed. Waltham: Morgan Kaufmann, 2012.

IBM CORPORATION. IBM SPSS Statistics. Versão 23. New York: IBM Corporation, 1989.

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO DE JANEIRO – IFRJ. Edital n. 44/2016 – Concurso Público – Professor de Ensino Básico, Técnico e Tecnológico. Rio de Janeiro: IFRJ, 2016. Disponível em: https://migra.ifrj.edu.br/webfm_send/10632. Acesso em: 2 set. 2019.

JESUS, G. R.; LAROS, J. A. Eficácia escolar: regressão multinível com dados de avaliação em larga escala. Avaliação Psicológica, v. 3, n. 2, p. 93-106, nov. 2004.

JOHN, G. H.; LANGLEY, P. Estimating continuous distributions in Bayesian classifiers. In:CONFERENCE ON UNCERTAINTY IN ARTIFICIAL INTELLIGENCE, 11., 1995, Montreal. Anais [...].

San Francisco: Morgan Kaufmann, 1995. p. 338-345.

KAMPFF, A. J. C.; REATEGUI, E. B.; LIMA, J. V. de. Mineração de dados educacionais para a construção de alertas em ambientes virtuais de aprendizagem como apoio à prática docente. Novas Tecnologias na Educação, Porto Alegre, v. 6, n. 2, dez. 2008.

KARINO, C. A.; VINHA, L. G. A.; LAROS, J. A. Os questionários do SAEB: o que eles realmente medem? Estudos em Avaliação Educacional, São Paulo, v. 25, n. 59, p. 270-297, set./dez. 2014.

KLEIN, R. Utilização da Teoria de Resposta ao Item no Sistema Nacional de Avaliação da Educação Básica (SAEB). Ensaio: Avaliação e Políticas Públicas em Educação, Rio de Janeiro, v. 11, n. 40, p. 283-296, 2003.

KLINE, P. The handbook of psychological testing. Londres: Routledge, 1999.

ORTIGÃO, M. I. R.; AGUIAR, G. S. Repetência escolar nos anos iniciais do ensino fundamental: evidências a partir dos dados da Prova Brasil 2009. Revista Brasileira de Estudos Pedagógicos, Brasília, v. 94, n. 237, p. 364-389, ago. 2013.

ORTIGÃO, M. I. R.; FRANCO, C.; CARVALHO, J. B. P. de. A distribuição social do currículo de matemática: quem tem acesso a tratamento da informação? Educação Matemática Pesquisa, São Paulo, v. 9, n. 2, p. 249-273, dez. 2007.

PIETY, P. J. Assessing the educational data movement. New York: Teachers College, 2013.

POSTGRESQL GLOBAL DEVELOPMENT GROUP. PostgreSQL Database Management System. Versão 9.2. Berkeley: PostgreSQL Global Development Group, c1995. Disponível em: https://www.postgresql. org. Acesso em: 1 jan. 2015.

REIS, M. C.; RAMOS, L. Escolaridade dos pais, desempenho no mercado de trabalho e desigualdade de rendimentos. Revista Brasileira de Economia, Rio de Janeiro, v. 65, n. 2, p. 177-205, abr./jun. 2011.

ROBINSON, J. P.; SHAVER, P. R.; WRIGHTSMAN, L. S. Criteria for scale selection and evaluation. In: ROBINSON, J. P.; SHAVER, P. R.; WRIGHTSMAN, L. S (ed.). Measures of personality and social psychological attitudes. San Diego: Academic Press, 1991. p. 1-16.

RODRIGUES, R. L.; RAMOS, J. L. C.; SILVA, J. C. S.; GOMES, A. S. A literatura brasileira sobre mineração de dados educacionais. In: CONGRESSO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO, 2014, Dourados, MS. Anais [...]. Dourados, MS: Sociedade Brasileira de Computação, 2014. p. 621-630.

ROMERO, C.; VENTURA, S. Data mining in education. Wiley interdisciplinary reviews: data mining and knowledge discovery, New York, v. 3, n. 1, p. 12-27, Dec. 2013.

ROSENTHAL, R.; JACOBSON, L. Teachers’ expectancies: determinates of pupils’ I. Q. gains. Psychological Reports, Boston, v. 19, n. 1, p. 115-118, Aug. 1966.

SMITH, L. A tutorial on principal components analysis. New York: Cornell University, 2002.

SOARES, J. F. Melhoria do desempenho cognitivo dos alunos do ensino fundamental. Cadernos de Pesquisa, São Paulo, v. 37, n. 130, p. 135-160, jan./abr. 2007. Disponível em: http://www.scielo.br/ pdf/cp/v37n130/07.pdf . Acesso em: 10 dez. 2017.

STEVENS, J. P. Applied multivariate statistics for the social sciences. 2. ed. Hillsdale: Erlbaum, 1992.

TCHIBOZO, G. Applications in data analysis for educational research. Policy Futures in Education, Paris, v. 7, n. 4, p. 364-367, Jan. 2009.

UNIVERSITY OF WAIKATO. Weka. Versão 3.6.9. Waikato: University of Waikato, 1999. Disponível em: https://www.cs.waikato.ac.nz/ml/weka/. Acesso em: 2 set. 2019.

VASCONCELLOS, S. S. de; MATTOS, C. L. G. de. O absenteísmo escolar e sua regulamentação. In: MATTOS, C. L. G.; CASTRO, P. A. Etnografia e educação: conceitos e usos. Campina Grande: EDUEPB, 2011. p. 271-294.

VELOSO, F.; PESSOA, S.; HENRIQUES, R.; GIAMBIAGI, F. (org.). Educação básica no Brasil: construindo o país do futuro. Rio de Janeiro: Elsevier, 2009.

WITTEN, I. H.; FRANK, E.; HALL, M. A. Data mining: practical machine learning tools and techniques. 3. ed. San Francisco: Morgan Kaufmann, 2011.

Published

2019-10-02

How to Cite

Fonseca, S. O. da, Namen, A. A., Moura Neto, F. D., Silva, A. da R., Ortigão, M. I. R., & Rohrer, U. A. B. V. (2019). Data mining guided by the educational domain: a proof of concept. Estudos Em Avaliação Educacional, 30(74), 420–453. https://doi.org/10.18222/eae.v30i74.5696