ISSN: 2319-7293
chen m
La optimización del intervalo de tiempo en la programación es un tema de investigación muy deseable, la detección y prevención de interbloqueos es uno de los temas fundamentales. Con el apoyo de lo aprendido en esta clase, se desarrolla un enfoque de aprendizaje por refuerzo para desentrañar esta dificultad de optimización. Al evaluar este modelo RL en cuarenta puntos de referencia clásicos sin búfer y compararlo con otros algoritmos alternativos, presentamos un resultado casi óptimo.