«Textos Escolares de Educación Básica: una propuesta con validez psicolingüística para dar cuenta de su lecturabilidad».
El Texto Escolar (TE) constituye uno de los recursos didácticos más utilizados por los profesores en Chile. De hecho, el Ministerio de Educación (2014) asegura que el TE es el principal instrumento para llevar el currículum a la sala de clases. De este modo, y en concordancia con el valor reconocido en los procesos de enseñanza aprendizaje, el Estado de Chile ha implementado una política pública, cuyo fin es proveer de textos escolares de calidad a la mayor cantidad de estudiantes de educación parvularia, primaria y secundaria de nuestro país (MINEDUC, 2014). Esta política pública, que data de 1990, permitió entregar, solo para el año 2018, 18.000.000 libros, beneficiando así a 3.000.000 estudiantes (MINEDUC, 2018). De hecho, es pertinente destacar que en el año 2018, el presupuesto estatal para textos escolares fue de $35.314.920 miles (Ley 21.053).
En este escenario y considerando: 1) el presupuesto destinado por el Estado de Chile a la adquisición y distribución de textos escolares, 2) el nivel de comprensión exhibido por estudiantes pertenecientes a estratos socioeconómicos medios y bajos en diferentes instancias de evaluación (PISA, 2009; Centro de Microdatos, 2011; SIMCE, 2012, 2014; 2018) 3) la relevancia de contar con textos escolares adecuados a las habilidades y conocimientos previos de los lectores en cualquier proceso de enseñanza aprendizaje y 4) la inexistencia de una herramienta con validez psicolingüística para determinar la lecturabilidad de los textos escolares, proponemos un estudio que nos permita conocer cuán adecuados a las habilidades lectoras de los estudiantes son los textos escolares de educación básica. Más precisamente, el objetivo de este estudio es clasificar automáticamente los textos correspondientes a los Géneros del Conocimiento (GCOs) utilizados en los textos escolares de sexto, séptimo y octavo básico, de las asignaturas de Ciencias Naturales, Lenguaje y Comunicación e Historia y Geografía y Ciencias Sociales, de acuerdo a su lecturabilidad. Para alcanzar nuestro objetivo, proponemos llevar a cabo un estudio de dos etapas, que integra la lingüística de corpus, la investigación psicolingüística y el aprendizaje de máquinas. En una primera etapa, se llevará a cabo un conjunto de trabajos psicolingüísticos de corte experimental y basados en corpus, para obtener evidencia empírica concurrente respecto de los rasgos lingüísticos a nivel léxico, sintáctico y discursivo que mejor predicen la lecturabilidad de los textos utilizados para comunicar el conocimiento en las diferentes asignaturas estudiadas. Posteriormente, y utilizando el nivel de dificultad asignado a cada texto, junto con los rasgos validados psicolingüísticamente durante la primera etapa, se entrenará un modelo automático de evaluación de la dificultad de los textos. Por último, y luego de los ajustes necesarios, el modelo se validará por medio de la comparación de su desempeño con las fórmulas de lecturabilidad existentes.
A diferencia de las fórmulas tradicionales de lecturabilidad, el estudio que proponemos no se sustenta en rasgos lingüísticos correspondientes exclusivamente al nivel de la palabra y la oración, sino que también contempla rasgos de orden discursivo, considerando, además, las diferencias impuestas por la asignatura. La otra novedad y, eventualmente, el mayor aporte científico de la propuesta, es que, a diferencia de gran parte de otras fórmulas existentes para el español, nuestro modelo estará sustentado en rasgos lingüísticos, cuya validez predictiva será testeada empíricamente por medio de experimentos psicolingüísticos. Respecto de su relevancia, y de acuerdo a lo expuesto en esta formulación, nuestra propuesta investigativa tiene impacto directo en dos ejes. En el primero, de naturaleza científico-aplicada, se aporta a los trabajos orientados a indagar en la relación entre las características lingüísticas del TE y las implicancias que ellas pueden tener en los procesos de comprensión y aprendizaje de los estudiantes (Fondecyt 1160094; Meneses, Montenegro & Ruiz, 2013; Edecsa, 2017). En términos muy simples y concretos, esta investigación nos otorgará datos empíricos que podrán: 1) facilitar la distribución y asignación de material escolar según nivel de dificultad (Brabham & Villaume, 2002). 2) guiar los procesos de diseño y construcción de textos escolares (Persampieri, Gortmaker, Daly, Sheridan & McCurdy, 2006). 3) permitir construir material para el desarrollo de estrategias de comprensión de textos escritos. El segundo eje de impacto es de naturaleza científica, ya que será posible avanzar en los estudios de lecturabilidad para el español, profundizando en la identificación de rasgos lingüísticos predictores, validados psicolingüísticamente en tres niveles de análisis.