ISSN: 0974-276X
Hassan Mohabatkar, Komail Amini, Parisa Rabiei, Kamran Mansouri
Objetivo: Hoy en día, los virus del papiloma humano (VPH) se consideran el segundo carcinógeno más frecuente . Se ha distinguido que las proteínas estructurales de los VPH están involucradas en su carcinogenicidad. El objetivo de este trabajo fue analizar las proteínas del VPH y clasificarlas en dos categorías, de bajo y alto riesgo, en función de sus propiedades fisicoquímicas y el concepto de pseudoaminoácidos de Chou.
Materiales y métodos: Inicialmente, se recolectaron secuencias de 69 proteínas pertenecientes a virus de alto riesgo y 107 proteínas pertenecientes a virus de bajo riesgo de la base de datos NCBI y Uniprot. Luego se utilizó el servidor PseAAC para analizar estas secuencias. En el siguiente paso, la información obtenida de este servidor fue analizada por software. Se utilizó el algoritmo KNN para clasificar los conjuntos de datos. Además, se aplicó una prueba de validación cruzada de 10 y 6 veces en el clasificador para evaluar nuestro método de predicción.
Resultados: La especificidad, sensibilidad y precisión de nuestro método propuesto se lograron 87,64 %, 87,22 % y 87,39 % en el conjunto de datos tratados y 91,11 %, 82,60 % y 86,66 % en el conjunto de datos probado. respectivamente.
Conclusión: En este estudio, desarrollamos un método basado en secuencias para predecir la carcinogenicidad potente de las proteínas del VPH y dividirlas en categorías de alto y bajo riesgo.