DNA-sequencing is ook afhankelijk van ons vermogen om gelelektroforese te gebruiken om DNA-strengen die in grootte verschillen, te scheiden van zo weinig als één basenpaar.
DNA sequentie
Aan het einde van de jaren 1970 werden twee DNA-sequentietechnieken voor langere DNA-moleculen uitgevonden. Dit waren de Sanger (of dideoxy) methode en de Maxam-Gilbert (chemische splitsing) methode. De Maxam-Gilbert-methode is gebaseerd op nucleotide-specifieke splitsing door chemicaliën en kan het best worden gebruikt voor het sequentiëren van oligonucleotiden (korte nucleotide-polymeren, meestal kleiner dan 50 basenparen lang). De Sanger-methode wordt vaker gebruikt omdat het technisch gemakkelijker is om deze toe te passen en met de komst van PCR en automatisering van de techniek gemakkelijk wordt toegepast op lange strengen DNA, waaronder een aantal hele genen. Deze techniek is gebaseerd op ketenbeëindiging door dideoxynucleotiden gedurende PCR-verlengingsreacties.
Sanger-methode
In de Sanger-methode wordt de te analyseren DNA-streng als een matrijs gebruikt en DNA-polymerase wordt in een PCR-reactie gebruikt om complementaire strengen met behulp van primers te genereren.
Vier verschillende PCR-reactiemengsels worden bereid, die elk een bepaald percentage dideoxynucleoside trifosfaat (ddNTP) analogen tegen een van de vier nucleotiden (ATP, CTP, GTP of TTP) bevatten. Synthese van de nieuwe DNA-streng gaat door totdat een van deze analogen is geïncorporeerd, op welk moment de streng vroegtijdig wordt afgekapt.
Elke PCR-reactie zal uiteindelijk een mengsel van verschillende lengtes van DNA-strengen bevatten, die allemaal eindigen met het nucleotide dat voor die reactie met dideoxy werd gemerkt. Gelelektroforese wordt dan gebruikt om de strengen van de vier reacties te scheiden, in vier afzonderlijke lanen, en de volgorde van de oorspronkelijke matrijs te bepalen op basis van welke stukjes strengen eindigen met welk nucleotide.
In de geautomatiseerde Sanger-reactie worden primers gebruikt die zijn gelabeld met vier verschillende gekleurde fluorescentielabels. PCR-reacties, in de aanwezigheid van de verschillende dideoxy-nucleotiden, worden uitgevoerd zoals hierboven beschreven. Vervolgens worden de vier reactiemengsels daarna gecombineerd en op een enkele baan van een gel aangebracht. De kleur van elk fragment wordt gedetecteerd met behulp van een laserstraal en de informatie wordt verzameld door een computer die chromatogrammen genereert die pieken voor elke kleur tonen, waaruit de template-DNA-sequentie kan worden bepaald.
Typisch is de geautomatiseerde sequentiemethode alleen nauwkeurig voor sequenties tot een maximum van ongeveer 700-800 basenparen lang. Het is echter mogelijk om volledige sequenties van grotere genen en in feite hele genomen te verkrijgen, met behulp van stapsgewijze methoden zoals Primer Walking en Shotgun-sequencing.
In Primer Walking wordt een werkbaar deel van een groter gen gesequenced met behulp van de Sanger-methode. Nieuwe primers worden gegenereerd uit een betrouwbaar segment van de sequentie en worden gebruikt om door te gaan met het sequencen van het deel van het gen dat buiten het bereik van de oorspronkelijke reacties lag.
Shotgun-sequencing houdt het willekeurig knippen van het interessante DNA-segment in meer geschikte (beheersbare) grote fragmenten in, het sequencen van elk fragment en het rangschikken van de stukken op basis van overlappende sequenties. Deze techniek is gemakkelijker gemaakt door de toepassing van computersoftware voor het rangschikken van de overlappende stukken.