angsd-wrapper: utilidades para el análisis de datos de secuenciación de nueva generación

La secuenciación de alto rendimiento ha cambiado muchos aspectos de la genética de poblaciones, la ecología molecular y campos relacionados, afectando tanto al diseño experimental como al análisis de datos. El paquete de software angsd permite a los usuarios realizar una serie de análisis genéticos de poblaciones sobre datos de secuenciación de alto rendimiento. angsd utiliza enfoques probabilísticos que pueden hacer uso directamente de las probabilidades del genotipo; por lo tanto, no se requiere la llamada de SNP para los análisis comparativos. De este modo, se aprovechan todos los datos de secuenciación y se obtienen resultados más precisos para las muestras con poca profundidad de secuenciación. Aquí presentamos angsd-wrapper, un conjunto de scripts de envoltura que proporciona una interfaz fácil de usar para ejecutar angsd y visualizar los resultados. angsd-wrapper soporta múltiples tipos de análisis, incluyendo las estimaciones de las pruebas de neutralidad de la diversidad de la secuencia de nucleótidos, el análisis de componentes principales, la estimación de las proporciones de mezcla para las muestras individuales y el cálculo de las estadísticas que cuantifican la introgresión reciente. angsd-wrapper también proporciona gráficos interactivos de los resultados de angsd para mejorar la exploración de datos. Demostramos la utilidad de angsd-wrapper analizando datos de resecuenciación de poblaciones de Zea silvestre y domesticado. angsd-wrapper está disponible gratuitamente en https://github.com/mojaveazure/angsd-wrapper.