Cómo determinar el contenido de gc de una secuencia de adn
El contenido de citosina de guanina, o contenido de GC, de una secuencia de ADN indica el porcentaje de pares de base de nucleótidos donde la guanina está unida a la citosina. El ADN con un mayor contenido de GC será más difícil de separarse.
Pasos
Método 1 de 2:
Manualmente1. Rastrear a través de la secuencia y contactar el número de nucleótidos citosina (C) o guanina (g).
2. Divide el número de nucleótidos de citosina y guanina por el número total de pares de bases en la secuencia.
Método 2 de 2:
Programáticamente (Python 2)1. Crea o acepta un archivo de entrada. Este artículo asume que la entrada está en Fastaja Formato, con una sola secuencia por archivo.
2. Leer en el archivo. Para formato FASTA:
DEF INIT (SECUENCIA): con ABIERTO (ARGV [1]) como entrada: secuencia = "".Únete ([línea.Strip () para la línea en la entrada.Readlines () [1:]]) Secuencia de retorno
3. Crear un contador. Idear a través de los datos e incrementar su contador mientras se encuentra con ningún nucleótidos de guanina o citosina.
4
def Gccontent (secuencia): gccount = 0 para la letra en secuencia: si letra == "GRAMO" o letra == "C": Gccount + = 1return gccount
5. Divida el recuento de GC por la longitud total de la secuencia, y emite el resultado en formato porcentual.
6
def Main (): script, entrada = argvesquence = ""secuencia = init (secuencia) impresión "%.2F" % (flotador (gccontent (secuencia)) / len (secuencia))
Consejos
Si está calculando el contenido de GC a mano, asegúrese de verificar doble! Puede ser fácil sumar, especialmente si está analizando una larga secuencia en papel.