Dos años desde la publicación de ChatGGPT, maestros e instituciones continúan luchando con una evaluación en el momento de la inteligencia artificial (IA).
Algunas herramientas de IA prohibidas directamente. Los otros recurrieron y las herramientas solo para dejarlos más tarde o pidieron a los maestros que adoptaran y transformen la evaluación.
El resultado es que Hodgepodge responde, dejando a muchos jardines de infantes a 12. Grado para tomar decisiones sobre y usar que no pueden armonizarse con maestros en maestros, políticas institucionales o investigaciones actuales sobre lo que AI y no pueden hacer.
Una respuesta fue usar software para detectar AI, que se basa en algoritmos para tratar de determinar cómo se generó el texto específico.
Las herramientas de descubrimiento de IA son mejores que las personas en motos y creadas. Pero son una solución imperfecta y no hacen nada para lidiar con el problema de la validez de la importancia básica para la evaluación del proyecto en la que podemos estar seguros de lo que los estudiantes saben y pueden hacer.
Maestros que usan detectores de IA
La reciente encuesta estadounidense, basada en la investigación representativa nacional de las escuelas públicas JP-12 publicadas por el Centro de Democracia y Tecnología, informó que el 68 por ciento de los maestros utilizaron detectores de IA.
Esta práctica también ha establecido su camino en algunas escuelas y universidades canadienses K-12.
Y los detectores difieren en sus acciones. Dos enfoques comunes son verificar que las cualidades se describan como "purpor", que se relacionan con oraciones alternativas y cortas (la forma en que las personas tienden a escribir) y complejidad (o "confusión"). Si la tarea no tiene un marcador típico que se genera a un hombre, el software puede marcarla e incurrirse, lo que alienta al maestro a comenzar una investigación por violación académica.
En su préstamo, y el software de detección es confiable de la detección de lenguaje humano. Los estudios repetidos a través de contextos muestran a las personas, incluidos maestros y otros expertos, no pueden distinguir entre el texto generado por la IA, a pesar de la confianza de los maestros que pueden notar falsas.

Los maestros no deben estar seguros de que puedo notar texto generado por IA. Íconos de Deepseek y Chatgtpt en la pantalla del teléfono inteligente en Beijing, 28 de enero de 2025 (AP Photo / Andi Wong) La precisión del detector varía
Si bien algunas herramientas de detección de IA no son confiables o sesgadas contra los estudiantes del idioma inglés, parece que tienen más éxito. Sin embargo, qué tasas de éxito realmente deberían indicar a los educadores.
El teléfono se jacta de que su detector de IA tiene el 99 por ciento de la velocidad del éxito, en relación con su proximidad de resultados falsos positivos (o, el número de personas generadas en sus banderas inadecuadas como generadas por IA). Esta precisión causó una investigación reciente encontrada por Turnnitin solo el texto de texto descubierto aproximadamente el 61 por ciento del tiempo.
El mismo estudio sugirió que diferentes factores podrían dar forma a los resultados de la precisión. Por ejemplo, la precisión de Gptzero puede ser baja como el 26 por ciento, especialmente si los estudiantes están editando la salida y la herramienta genera. Sin embargo, un estudio diferente del mismo detector sugirió una amplia gama de resultados (por ejemplo, entre 23 y 82 por ciento de precisión o 74 y 100 por ciento de precisión).
En vista de los números en el contexto
El valor del porcentaje depende de su contexto. En la mayoría de los cursos, exactamente el 99 por ciento del tiempo es extremadamente. Está por encima del umbral más común para la importancia estadística en la investigación académica, que a menudo se establece en 95 por ciento.
Pero la tasa de éxito del 99 por ciento se consumiría en la ruta aérea. Habría el 99 por ciento de la tasa de éxito significaba alrededor de 500 accidentes todos los días en los Estados Unidos. Ese nivel de falla sería inaceptable.
Para sugerir que esto podría parecer: en la institución como la mía, la Universidad de Vinnipeg, alrededor de 10,000 estudiantes presentaron varias tareas (podríamos balpear, son cinco, por argumento, por unos cinco cursos cada año.
Eso sería alrededor de 250,000 tareas cada año. Allí, incluso el 99 por ciento de la tasa de éxito significa aproximadamente 2,500 fallas. Son 2.500 puestos positivos fraudulentos en los que los estudiantes no han usado ChatGGPT u otras herramientas, pero marcadas para el posible uso de IA, lo que puede lanzar horas de exploración para los estudiantes que pueden ser acusados falsamente de hacer trampa.
El tiempo se pierde para explorar falsos positivos
Mientras que el software de detección de IA simplemente aplanó posibles problemas, pero hemos visto a personas detectores poco confiables. No podemos decir cuál de estas 2.500 tareas son positivos positivos falsos, lo que significa que los trucos continuarán pasando por grietas y se perderán valiosos tiempos de maestros para investigar a los estudiantes inocentes que no hicieron nada malo.
Este no es un problema nuevo. Hacer trampa fue la principal preocupación antes del chatgpt. La omnipresente IA simplemente se destaca en un problema de validez a largo plazo.
Cuando los estudiantes pueden ser aplacados, emplean a los tramposos del contrato, o su amigo o hermana escribe papel, dependiendo de las estimaciones que toman casas escritas fuera de clase sin ninguna vigilancia de maestros. No puedo asumir que tales formas de evaluación son el aprendizaje de los estudiantes, porque no pueden diferir de manera confiable si el estudiante realmente las escribió.

AI solo ejecutó el reflector sobre el problema de la forma en que los instructores saben si la tarea representa el aprendizaje de los estudiantes. (AP Photo / Carolin Thompson) debería cambiar la evaluación
La solución para una escalera más alta para hacer trampa no son las paredes más altas. La solución es cambiar la forma en que evaluamos: algunos investigadores de la estimación del aula ya antes del inicio de la IA.
Así como no gastamos miles de dólares en los detectores, escuelas, escuelas, escuelas, las escuelas no deberían descansar simplemente porque las compañías de detección y tienen un producto a la venta. Si los educadores desean dar conclusiones válidas sobre lo que los estudiantes saben y pueden, si es necesario, se evalúa, lo que enfatiza una evaluación formativa actual (como borradores, progreso en progreso y aprendizaje repetido con respecto al aprendizaje.
Deben estar enraizados en contextos auténticos que sean relevantes para la vida de los estudiantes y su aprendizaje a la responsabilidad estudiantil integral, los maestros y los líderes del sistema, no solo el mantra "no es trampa y si lo atrapamos para castigarlo".
Consumimos menos en las herramientas de detección incorrecta y más sobre el apoyo a los maestros para desarrollar su capacidad para evaluar el comité.
0 Comentarios