ISSN: 0974-276X
Abhishek Narain Singh*, Krishan Pal
Existe una marcada variabilidad técnica y una gran cantidad de observaciones faltantes en la unicelular datos que obtenemos de los experimentos. Aparte de eso, claramente cada lote de experimentos tiene un efecto de lote en cada celda del lote. Este efecto de lote se puede aprovechar para tratar la imputación, dado que todas las células de un lote dado pertenecen al mismo tejido. Aquí presentamos ‘BaySiCle’, un nuevo método basado en la inferencia bayesiana combinado con el algoritmo del vecino más cercano para la imputación de datos faltantes en recuentos de scRNA-seq. Los priores se encuentran en función del valor de expresión en todas las celdas para todas las celdas individuales del mismo lote. Mediante el uso de conjuntos de datos de scRNA-seq de muestra y datos de expresión simulados, demostramos que BaySiCle permite una imputación robusta de los valores faltantes generando distribuciones de transcripción realistas que coinciden con las mediciones de hibridación in situ de fluorescencia de una sola molécula. Mediante el uso de datos previos obtenidos por las estructuras del conjunto de datos no solo en el lote de configuración experimental, sino también en el mismo grupo de celdas, BaySiCle mejora la precisión de la imputación para estar mucho más cerca de sus alternativas similares.