Habréis notado que al descargaros las secuencias existentes de COVID-19 aparecen algunas letras distintas de las 4 bases habituales, por ejemplo la N. La N es cualquier base (es decir, no es un gap pero no se sabe cuál
es). Tenéis la notación completa en
https://en.wikipedia.org/wiki/
Lo normal para el índice de conservación es contar sólo las 4 bases normales, pero cualquier interpretación coherente con
ese significado IUPAC es válida