MDJ:s recension av året: "Djup genotypning" - Vad tredje generationens sekvensering kan lära oss
Dr. Sarah Camargos: Välkommen till MDS Podcast, den officiella kanalen för International Parkinson and Movement Disorder Society. Jag är Sarah Camargos, biträdande redaktör för podcasten. Idag har vi sällskap av Dr. Guillaume Cogan och professor Alexis Brice från Paris Brain Institute. De är korresponderande författare till artikeln, som utsetts till årets Movement Disorders Review.
Visa fullständig transkription
Artikelns titel är *Utforskning av neurogenerativa sjukdomar med hjälp av långläsningssekvensering och optiska genommappningstekniker*. Grattis till er båda för denna viktiga nominering. Dr. Cogan, berätta lite om din bakgrund och vad som inspirerade dig att skriva den här artikeln.
Dr. Guillaume Cogan: Hej. Tack för att ni har oss här. Jag är medicinsk genetiker och nu [00:01:00] doktorerar jag vid Paris Brain Institute. Vi hade ett projekt tillsammans från Paris Brain Institute med National Institutes of Health, med våra kollegor som också är medförfattare till artikeln, Kensuke Daida, Cornelis Blauwendraat och Kimberly Billingsley.
Så i grund och botten hade vi en kohort av olösta Parkinsonsfall, som hade blodexomsekvensering. Vi hade familjära fall och även fall med tidig debut, och vi ville försöka identifiera något i stil med mutationen som orsakar sjukdomen. För att göra det använde vi långtidssekvensering. Jag kommer att gå in på detaljer om det i framtiden. Vi hade ett intressant fall, vi ville rapportera detta till rörelsestörningar, så det gjorde vi. Redaktören bad oss att göra en granskning om långtidssekvensering, men även optisk genomkartläggning för att få en översikt över de nya genetiska teknologierna som vi kan använda vid neurodegenerativa sjukdomar.
Dr. Sarah Camargos: Mycket bra. Jag tycker att genetik ibland kan kännas som ett utmanande ämne för [00:02:00] neurologer. Så låt oss ta ett steg tillbaka och börja med grunderna. Vi ska prata om den typ av varianter som orsakar neurodegenerativa sjukdomar, enstaka nukleotidvarianter, strukturella varianter och upprepade expansioner.
Kan du förklara vilka tekniker som används för att studera den här typen av varianter?
Professor Alexis Brice: Ja, jag kan börja och Guillaume kommer att slutföra. Jag tror att det som är riktigt viktigt är att långläsningssekvensering innebär att man kan analysera långa DNA-fragment snarare än att behöva läsa av ungefär 150 till 300 baspar för varje fragment man har ungefär tiotals kilobaser, och detta förändrar mycket.
Eftersom man kan upptäcka många av [00:03:00] omarrangemangen, som inte detekteras med vanliga tekniker. Och det betyder till exempel att när det finns en inversion i genen kan man se övergångspunkterna. Man kan sekvensera dem. Man kan lättare upptäcka dubbletter eller deletioner.
Och det är också ett ämne för många neurodegenerativa sjukdomar. Och även upprepade expansioner. De små kan fångas upp med klassiska tekniker, men när de överstiger storleken på 300 baspar kan de inte det. Så med långläsningssekvensering. Återigen, man kan upptäcka den här typen av varianter.
Så det är de viktigaste aspekterna. Men det finns andra. Man kan till exempel skilja på individer som har två varianter i en gen. Man kan säga om de är i cis eller i trans. Och för recessiv sjukdom [00:04:00] måste de vara i trans om man vill vara säker på att de är ansvariga för sjukdomen.
Man kan också använda gener och pseudogener när de är mycket homologa. Long-read-sekvensering gör det möjligt att sekvensera genen oberoende av varandra. Så det är egentligen det grundläggande och vi kan säkert ge några exempel om du vill.
Dr. Sarah Camargos: Mycket bra. Speciellt när jag läste din artikel tyckte jag att det var väldigt intressant att du använder dessa exempel för att visa fördelarna med långtidssekvensering, som till exempel pseudogener och fasning. Kan du dela med dig av historien om syskonen och tvillingarna med PRKN-varianter?
Dr. Guillaume Cogan: Ja. Så vår kollega från NIH, Kensuke Daida, hade först dessa två syskon med en fenotyp som var kompatibel med Parkinsons sjukdom. [00:05:00] Så syskonen hade en tidig debut, en långsam progression av sjukdomen och jag tror att det var exomsekvensering. Så kortfattat sekvensering.
De hade en patogen enkelnukleotidvariant men bara en variant, så det är inte tillräckligt för att förklara sjukdomen. Och sedan använde de långtidssekvensering och identifierade en inversion i den andra allelen, vilket förklarar sjukdomen. Och inversionen var mycket stor. Den är sju megabas.
Så det förklarar varför de inte fick det först. Och sedan från vår kohort. Vi hade också två syskon med autosomalt recessiv form av sjukdomen kompatibel med PRKN, återigen, med fenotypen. Och vi använde först konventionella sekvenseringsmetoder, multipel ligeringsprobamplifiering, riktad sekvensering med exomsekvensering.
Och vi hade en deletion av exom fyra, men bara en mutation igen, så det var inte tillräckligt för att förklara sjukdomen. Vi använde, återigen, long read-sekvensering, och vi fann det något väldigt intressant. Så i den första studien [00:06:00] hade vi en deletion av exom tre och exom fyra, och i den andra tillagda studien hade vi en duplicering av exom tre.
Så totalt sett har vi två kopior av exome tre, vilket är normalt, eller hur? Jag hoppas att vi alla har två kopior av exome tre här.
Jag hoppas, och det är därför de andra sekvenseringsverktygen inte kunde se det. Och bara, låt oss säga att långtidssekvensering kunde identifiera detta.
Och sedan utvidgade Kensuke och kollegor studien till, jag tror det var 23 individer med en PRKN-variant och tidig debut av Parkinsons sjukdom, och de kunde lösa en fjärdedel av fallen med hjälp av långtidssekvensering. Så det här är något som är meningsfullt, tror jag. Och neurologer skulle kunna tänka på det när de har en patient med en mutation i PRKN och en fenotyp som är kompatibel.
Dr. Sarah Camargos: Och du fick bara vägledning för fenotypningen. Det här är väldigt intressant. Så du grävde lite för att se om det fanns en strukturell variant som kunde förklara den andra i trans [00:07:00] variationen.
Är det rätt?
Dr. Guillaume Cogan: Ja.
Dr. Sarah Camargos: Fantastiskt. Förutom att upptäcka de nya generna är en annan intressant aspekt att utforska karaktäriseringen av upprepad expansion.
Hur är denna karakterisering relevant för att förstå fenotypen eller genetisk rådgivning?
Professor Alexis Brice: Jag tror att det finns minst två aspekter för upprepningsexpansionerna. För det första är det storleken och lämplig storlek är mycket viktig eftersom det vanligtvis finns ett tröskelvärde över vilket en upprepning kan sägas vara patogen. Och detta varierar mycket beroende på sjukdomarna. Och för vissa av dem måste jag säga att tröskelvärdet som kan vara värdefullt fortfarande är omtvistat, men åtminstone över ett visst värde är man säker på att det är patogent.
Så den första är storleken, vilket är absolut [00:08:00] avgörande för diagnosen. Och den andra aspekten är upprepningens sekvens. För det visar sig att vid vissa loci är det inte bara storleken, utan även upprepningens sammansättning, som är viktig. Och det finns alternativa sammansättningar, av vilka vissa är patogena och andra som tolereras väl och inte är associerade med sjukdomen.
Med långtidssekvensering får man båda med en enda sten. Man har både storleken på upprepningen och sammansättningen, och därför kan man säga om upprepningen är patogen eller inte. Och detta är mycket viktigt för många av de nyligen identifierade upprepningarna som FGF 14 eller RFC 1 till exempel.
Dr. Guillaume Cogan: Ja, jag kanske kan ge exempel på det. FGF 14 är ett mycket bra exempel. Så det är ansvarigt för [00:09:00] spinocerebellär ataxi nummer 27 B identifierades ganska nyligen och vi vet att expansioner av GAA som är lägre än 200, de är inte patogena. Men när upprepningen är över 300, vet vi att det är patogent och använder kortläsningssekvensering eftersom storleken på fragmentet är av läsningen är cirka 150.
Vi kan inte veta något som är längre. Vi kan bara säga att det finns en expansion över 150, men vi kan inte säga om den är över 300 eller inte. Så vi kan inte säga om den är patogen och vi behöver en annan teknik för att kunna säga det. Men med hjälp av långläsningssekvensering kan vi mer exakt avgöra storleken på expansionen och vi kan säga om expansionen är över tröskelvärdet eller inte.
Ett annat exempel på motivets betydelse är en gen som ansvarar för det välkända syndromet cerebellär ataxi, neuropati, vestibulär areflexi, CANVAS. Vi vet att långa expansioner av [00:10:00] AAAG, alltså fem nukleotider, inte är patogena. Expansioner av motivet AAGGG är dock patogena, och med hjälp av långläsningssekvensering har vi motivet så att vi kan veta om det är patogent eller inte.
Och jag tror att något annat viktigt är närvaron eller frånvaron av avbrott. Och vi diskuterar detta i artikeln. Så jag tror att ett bra exempel är spinocerebellär ataxi två. Så det är en CAG-expansion. Och om vi i denna expansion av CAG har ett eller flera avbrott i CAA istället för CAG, vet vi att det inte är ansvarigt för spinocerebellär ataxi utan för Parkinsons sjukdom.
Motivet är närvaron eller frånvaron av integration som är viktig. För fenotypen, men också för åldern vid debut, penetransen, sjukdomens arv samt fenotypens svårighetsgrad och typ.
Professor Alexis Brice: Så vi kan säkerligen förvänta oss att [00:11:00] identifiera fler av dessa upprepningar i framtiden. Och vi vet att de är särskilt vanliga vid neurologiska sjukdomar.
Så jag tror att genom att sekvensera många fler fall kommer vi säkerligen att upptäcka okända mutationer i framtiden.
Dr. Sarah Camargos: Och du kunde även kontrollera metyleringen. Du kan förstå lite mer om genuttrycket.
Dr. Guillaume Cogan: Absolut med hjälp av de viktigaste metoderna för långtidssekvensering. Vi kan identifiera metyleringen, och detta har naturligtvis flera implikationer vid sjukdomar eftersom det vanligtvis inte alltid är fallet. Men vanligtvis har hypermetylerade element i DNA:t mindre uttryck jämfört med hypometylering.
Och i samband med neurodegenerativa sjukdomar. Jag tycker att detta är intressant. Till exempel, om vi har genen. Jag har just studerat detta för NOTCH2NLC, som är ansvarig för när [00:12:00] man har en GGGC, expansion i den fem prematerialregionen. Den är ansvarig för en sjukdom som kallas neuronal intranukleär hyalin inklusionssjukdom, och de fann att det är mycket intressant att opåverkade föräldrar till barn som drabbats av denna sjukdom hade längre expansioner jämfört med avkomman. Så det är inte förväntat, eller hur? Men med hjälp av långtidssekvensering fann de att denna GGC-expansion hos föräldrarna var hypermetylerad. Så genen uttrycktes mindre jämfört med den lägre expansionen. Och denna expansion är patogen eftersom den leder till RNA 4C som leder till en sekvestrering av RNA-bindande proteiner.
Så i grund och botten, om du har ett lägre uttryck, har du mindre RNA 4C och då har du inte sjukdomen. Det är väldigt intressant att se att metylering låter oss förstå varför vissa mutationer inte är patogena jämfört med andra.
Dr. Sarah Camargos: Fantastiskt. Väldigt intressant. [00:13:00] Låt oss prata lite om målinriktning i långläsningssekvensering. I april 2024 intervjuade vi professor Houlden och dr Zhongbo Chen som använde målinriktad långläsningssekvensering för att beskriva SCA4. Kan du påminna oss om hur den här metoden fungerar och om det finns en annan metod för målinriktning istället för att sekvensera allting?
Dr. Guillaume Cogan: Ja. Så det är en bra fråga eftersom man kan använda långtidssekvensering i flera avseenden. Man kan göra helgenomsekvensering men man kan också göra riktad sekvensering. Och jag skulle säga att det finns, i artikeln pratar vi om tre metoder för att göra detta. Först kan man använda Cas9-baserad metod.
Så du fångar bara den intressanta regionen med CRISPR Cas9, och sedan sekvenserar du bara den intressanta regionen. Så detta är den första. En annan är också enkel. Det är långdistans-PCR. Så du amplifierar din intressanta region med hjälp av långdistans-PCR tillsammans. Men om du använder detta kan du naturligtvis få amplifieringsbias eftersom du använder en polymeraskedjereaktion, eller hur?
Så detta är den andra, och den sista tillhandahålls endast av Oxford Nanopore Technologies. Så den sista är adaptiv sampling och den är ganska intressant.
Så i princip har du din DNA-sträng, som går genom poren. Och poren analyserar de första 100-tals basparen. Till exempel 400 baspar, och den ser om dessa baspar är i den region av intresse som du bad sekvenseringsmaskinen att sekvensera. Så om den ser att detta fragment inte är ett fragment av intresse, matar den ut fragmentet.
Så den kommer bara att sekvensera hela vägen igenom de intressanta porfragmenten. Så det är de tre metoderna. Cas9-baserad, långdistans-PCR och ONT adaptiv sampling.
Dr. Sarah Camargos: Mycket bra. Professor Brice, jag har en känsla av att långtidssekvensering är nästan som den genetiska versionen [00:15:00] av djup fenotypning, en sorts djup genotypning. Håller du med?
Professor Alexis Brice: Jag håller helt med, med djup fenotypning hittar man saker som man inte såg eftersom man inte letade ordentligt efter dem. Och jag tror att det är väldigt viktigt för neurologer att kunna utföra denna djupa fenotypning, vilket kan hjälpa till med diagnostisering. Och här är det exakt samma sak eftersom de verktyg vi använde fram till långtidssekvensering inte kunde upptäcka några av dessa varianter.
Och nu när vi har det här verktyget kan vi identifiera dessa varianter och förbättra diagnosen. Så det är egentligen exakt detsamma, förutom att kostnaden för djup fenotypning kan vara lägre än för långtidssekvensering för tillfället, åtminstone.
Dr. Sarah Camargos: Ja. På tal om utmaningarna när det gäller långläsningssekvensering, vilka är de [00:16:00] stora utmaningarna för oss? Förutom kostnaden.
Dr. Guillaume Cogan: Utöver kostnaden är utmaningarna först våtlabb. Så våtlabbprotokollet är ännu inte standardiserat. Dessutom är den bioinformatiska pipelinen för att anropa variansen inte standardiserad. Och du behöver också mycket datalagringskapacitet eftersom det genererar hundratals gigabaser.
Så du behöver bra lagringskapacitet. Bra GPU:er och processorer för att anropa variansen är också mycket beräkningsintensiva och i slutet av kedjan, låt oss säga, för att tolka variansen är det också svårare eftersom vi har mycket mer varians. Åtminstone är vi säkra på vår varians eftersom, till exempel, om du gör kortläsningssekvensering, du försöker analysera strukturell varians, vet du att många av dem bara är falska positiva. Men med långläsningssekvensering vet du att de flesta av dem är sanna positiva. Men när vi analyserar varians, om du vill identifiera orsaken till en patients sjukdom, vill du ta bort varians som har hög [00:17:00] frekvens som är vanlig hos oss alla, bara för att välja varianter.
Saken är den att vi med sekvensering länge inte har kataloger som Genome 80 för sekvensering av korttidsstudier. Så det är svårt att filtrera variansen för korttidsstudier. Ändå finns det några samarbetsprojekt, till exempel 1000 Genome-projektet som sekvenserar hundratals, om inte tusentals, friska kontroller för att ge oss populationsdatabaser, vilket gör att vi kan sortera variansen efter frekvens.
Och slutligen, med lite erfarenhet av det, är det ibland frustrerande eftersom man liksom, jag sekvenserar alla typer av varians jag har som strukturella varians-SND:er, korta upprepningar, men jag hittar inte den genetiska mutationen. Men jag vet att den finns här någonstans, men jag kan bara, jag kan ta kanske ett exempel.
Till exempel har vi introniska strukturella varianter som kan påverka splitsningen av en gen, men vi har inget verktyg för att förutsäga om det påverkar splitsningen eller inte. Så vi hoppas att bioinformatiker [00:18:00] i framtiden kommer att utveckla dessa verktyg så att vi äntligen kan identifiera orsaken till sjukdomen hos alla människor med en genetisk sjukdom, låt oss säga.
Dr. Sarah Camargos: Eller till och med sekvenserade allt RNA också.
Dr. Brice eller Cogan: Ja, det här är en annan. Med hjälp av långsekvensering kan vi identifiera nya isoformer som vi pratar om i artikeln.
Dr. Sarah Camargos: Och i din artikel utforskade du även möjligheterna med optisk genomkartläggning. Förklara hur den här tekniken fungerar och vilka är de främsta fördelarna.
Dr. Guillaume Cogan: Så det är ganska annorlunda jämfört med långläsningssekvensering eftersom det inte är en sekvensering. Så i grund och botten märker du bara ditt DNA vid någon kanonisk sekvens, korta sekvenser, och sedan har du ett mikroskop som tittar på avståndet mellan din märkta tagg i DNA:t. Så med det kan du identifiera strukturella varianter som är över 500 baspar.
Så du kan inte se något under det. Det är en sak. Du [00:19:00] kan inte heller se SND:er, enstaka nukleotidvarianter med hjälp av optisk genommappning. Det är dock ganska intressant eftersom djupet och täckningen är bättre jämfört med långtidssekvensering. Du kan få 150 gånger täckningsdjup med OGM jämfört med vanligtvis 20 till 30 gånger med långtidssekvensering.
Och, och ja, det är det viktigaste med OGM skulle jag säga. Så vissa jämförde OGM och long read-sekvensering. Och för long read-sekvensering är det svårt att identifiera varianter, strukturella varianter som är över 50 kb. OGM är dock bra för att identifiera den typen av mutationer. Så jag skulle säga att om du har pengar kan du använda båda och det skulle vara det bästa.
Men du behöver pengar för att göra det
Dr. Sarah Camargos: Självklart.
Professor Alexis Brice: Nej, jag menar, man behöver också DNA med hög molekylvikt och det är ibland en begränsning för dessa tekniker. Och klassisk biobankning använder ibland extraktionstekniker [00:20:00] som inte tillhandahåller sådant DNA. Så det är något man måste ta hänsyn till åtminstone för de potentiella kohorter eller prover man får.
Dr. Guillaume Cogan: Ja. Och något annat för OGM, jag tror att en begränsning med OGM som är bra att känna till för lyssnare, är att det är väldigt svårt att få den exakta platsen för brytpunkter med hjälp av OGM. Man kan vanligtvis inte få det. Det är mellan 6 KB och 15 kB. Så det kan vara viktigt inom medicinsk genetik eftersom man med hjälp av OGM kan säga att en strukturell variant omfattar ett exom, medan det inte är det, så det är inte ett falskt positivt resultat, men det är helt enkelt inte lika exakt för strukturell varians som långtidsavläsningssekvensering.
Så återigen, det är bra att använda båda om du vill använda OGM, ja.
Dr. Sarah Camargos: Så du förutspår att dessa två teknologier skulle eller kommer att bli den första metoden för att diagnostisera ärftliga neurogenerativa sjukdomar i framtiden?
Professor Alexis Brice: Förutsatt att [00:21:00] pengarna finns där för att betala för dem. Ja, jag tror att de helt klart gör det möjligt att lösa en större andel fall och de är därför mycket användbara. Jag tror att om vi vill ha en metod, en första och sista nivå, där en enda teknik kan ge resultaten.
Dr. Guillaume Cogan: Ja, det är fortfarande en lång väg att gå för att få de här teknologierna som först här, skulle jag säga. Ja.
Dr. Sarah Camargos: Ja. Mycket bra. Innan vi avslutar, finns det ett viktigt budskap som ni båda vill att våra lyssnare ska ta med er från den här artikeln?
Dr. Guillaume Cogan: Ja. Så jag tror att du behöver känna till ditt projekt och vad du verkligen vill se innan du använder dessa tekniker. Och jag tror att vi i vår artikel försökte vårt bästa att ge exempel så att läsaren kan förstå vad hen kan få ut av dessa tekniker. Och jag tror att ja, att läsa den här artikeln är ett sätt att bättre förstå detta och använda det på ett [00:22:00] lämpligt sätt för varje projekt. Ja.
Dr. Sarah Camargos: Ja. Så läkare, tack så mycket för att ni är med oss. Och delar med er av era insikter idag. Tack till alla våra lyssnare för att ni är med oss på MDS Podcast. Håll utkik efter vårt nästa avsnitt, och tills dess, ta hand om er och adjö.
Dr. Guillaume Cogan: Tack för att vi fick komma.

Guillaume Cogan, läkare
Paris hjärninstitut
Paris, Frankrike

Alexis Brice, läkare
Paris hjärninstitut
Paris, Frankrike






