Engineered CRISPR/Cas9 enzimas melhoram a discriminação ao diminuir a clivagem do DNA para permitir a liberação de DNA fora do alvo

HypaCas9 e Cas9-HF1 mostram taxas lentas de clivagem observadas

Iniciamos nossas análises cinéticas medindo a concentração do local enzimático ativo para cada uma das variantes do Cas923,24,25. A medição da quantidade de produto formado em uma titulação de enzima com concentrações crescentes de DNA revelou concentrações de local ativo de 31 nM, 26 nM, 23 nM para SpCas9, HypaCas9 e Cas9-HF1, respectivamente, para amostras de enzimas com concentração nominal de 100 nM com base na absorvância a 280 nm (Suplemento Fig. 1a-d). Também medimos as concentrações de SpCas9 e HiFiCas925 no local ativo a partir da Integrated DNA Technologies (IDT) e observamos concentrações similares de enzima ativa (Suplemento Fig. 1e-f). É importante notar que, em cada caso, a concentração de DNA necessária para saturar o sinal foi igual à concentração do produto formado, o que elimina a preocupação de que parte da enzima possa ligar o DNA, mas não reagir. Todas as experiências subsequentes foram estabelecidas usando a concentração da enzima ativa determinada na titulação do local ativo.

Para comparar a cinética dos substratos de DNA ligado ou desligado do SpCas9 com as variantes de engenharia, primeiro examinamos o curso do tempo da clivagem do fio do alvo (HNH) para cada enzima (Fig. 1 e Fig. 2 Complementar). Os dados foram ajustados com uma função exponencial simples ou dupla usando Eq. (1) ou Eq. (2), respectivamente.

$$Y = A_1e^{ – \lambda _1t} + C$$
(1)

onde Y representa a concentração do produto de clivagem, A1 representa a amplitude, e λ1 representa a taxa de decaimento observada (valor próprio)17.

$$Y = A_1e^{ – \lambda _1t} + A_2e^{ -lambda _2t} + C$$
(2)

onde Y representa a concentração do produto de clivagem, A1 representa a amplitude e λ1 representa a taxa observada para a primeira fase. A2 representa a amplitude e λ2 representa a taxa observada para a segunda fase.

Comparação das taxas de decaimento de clivagem observadas de substratos dentro e fora do alvo pelo SpCas9 mostra que o descasamento de 3 bp PAM-distal retarda a enzima 13 vezes (de 1 s-1 a 0,076 s-1). Ambas as variantes Cas9 de alta fidelidade diminuem drasticamente a taxa de decaimento observada para clivagem de substratos de DNA on-target 21 a 35 vezes em comparação com SpCas9 (0,028 s-1 para HypaCas9 e 0,047 s-1 para Cas9-HF1 vs 1 s-1 para SpCas9). Além disso, HypaCas9 e Cas9-HF1 reduzem ainda mais as taxas de decaimento da clivagem de DNA fora do alvo 8 a 290 vezes (taxas de 0,0033 s-1 e 0,00016 s-1, respectivamente) em relação às suas respectivas taxas com DNA dentro do alvo. Estes dados demonstram mudanças dramáticas nas taxas de clivagem observadas pelas variantes de engenharia com ADN dentro e fora do alvo. Contudo, estas medições por si só não definem alterações na especificidade, que é uma função da partição cinética da clivagem do ADN versus dissociação, abrangendo todas as etapas que conduzem à primeira etapa irreversível do caminho17 , incluindo a ligação reversível do ADN, a formação do laço R, o acoplamento do domínio HNH e a clivagem do ADN.

Desenrolamento do DNA é em grande parte inalterado com as variantes Cas9

Desde que nosso trabalho anterior identificou a formação de loop R como limitador de taxa para a clivagem no alvo e outros subseqüentemente sugeriram que a formação de loop R e as taxas de rebobinagem podem ditar a especificidade enzimática para SpCas9 e Cas9-HF116, testamos se o HypaCas9 exibiria cinética semelhante. Para medir diretamente as taxas de formação de R-loop para todas as enzimas, usamos um ensaio de fluxo parado baseado na medição da fluorescência de tCo a -16 nt, um análogo tricíclico fluorescente de citosina que é atenuado pelo empilhamento da base em dsDNA de modo que a abertura do duplex resulta em um grande aumento da fluorescência. Nossos experimentos de controle usando ambos os nossos substratos analógicos de base tCo- e 2-AP nas posições -16, -9 e -1 nt, respectivamente (Fig. 3 Suplementar), mostram que nenhum dos analógicos afeta a taxa de decaimento observada para a clivagem de DNA. As estruturas químicas do tCo e 2AP são muito menos volumosas do que as etiquetas maiores de Cy3 e Cy5 e menos susceptíveis de interferir com a cinética enzimática (Suplemento Fig. 4). Na presença de Mg2+, SpCas9, HypaCas9 e Cas9-HF1 desenrola-se o substrato de ADN alvo com taxas de decaimento quase idênticas (~2 s-1) (Fig. 2). Surpreendentemente, a taxa de decaimento da formação de R-loop para substratos de DNA fora do alvo para todas as variantes do Cas9 também não sofreu grandes alterações (entre 0,85 s-1 e 2,59 s-1). Portanto, o desenrolamento do DNA não é limitador de taxa e não está correlacionado com as taxas de clivagem observadas para as variantes de alta fidelidade, ao contrário de SpCas9.

Fig. 2: As taxas de desenrolamento do DNA são quase idênticas para os alvos on-targets e off-targets.

As taxas de decaimento da formação do loop foram medidas pela monitorização do aumento da fluorescência do tCo (posição -16 no fio não-alvo) em função do tempo após a mistura da enzima (28 nM) com o DNA (10 nM) na presença de 10 mM Mg2+. Os dados foram ajustados a uma função exponencial dupla para obter as taxas de decaimento mostradas. a, b SpCas9 (28 nm) com on-target (a) e off-target (b) DNA, c, d HypaCas9 com on-target (c) e off-target (d) DNA. e, f Cas9-HF1 com on-target (e) e off-target (f) DNA.

Dada a localização do tCo a -16 nt, é provável que nossas medições tenham refletido uma etapa tardia no processo de desenrolamento. Para comparação, medimos a taxa de decaimento para a formação do loop R usando tCo rotulado em uma posição imediatamente proximal ao PAM (posição -1 nt). Após a rápida mistura do Cas9-RNA com o substrato de ADN alvo, observamos um aumento marcado da fluorescência à medida que o ADN desenrola o análogo à base de tCo. Ajustamos os dados a um duplo exponencial para determinar a maior taxa de decaimento de 10 s-1 (Fig. 3a-f). Intrigantemente, estes resultados indicam que, uma vez que um local PAM está envolvido com a enzima, o desenrolamento inicial do DNA é mais rápido do que o observado a -16 nt. Estes dados sugerem que a taxa líquida de decaimento observada de desenrolamento observada a -16 nt pode ser uma função de várias etapas de desenrolamento rápido que levam ao desenrolamento completo. No entanto, como não foi observado qualquer atraso na cinética, parece que as etapas de desenrolamento parcial mais rápidas e anteriores levam a uma etapa final de desenrolamento total, medida na posição -16 nt. Embora sejam necessários mais estudos para examinar os efeitos dos desajustes em estágios iniciais de desenrolamento, nossa medição atual fornece a melhor estimativa da taxa líquida de formação do loop R. A taxa de decaimento medida para a formação de R-loop usando este rótulo é indistinguível tanto para SpCas9 como para as variantes de alta fidelidade em todos os substratos testados, de modo que as taxas de desenrolamento do DNA parecem não ter sido alteradas pelas enzimas de engenharia Cas9.

Fig. 3: O desenrolamento do DNA ocorre mais rapidamente perto do PAM.

R loop formation decay rates were measured by the monitoring the fluorescence increase from tCo (position -1 in the non-target strand) as a function of time after mixing enzyme (28 nM) with DNA (10 nM) in the presence of 10 mM Mg2+. Os dados foram ajustados a uma função exponencial dupla para obter as taxas de decaimento mostradas. a, b SpCas9 (28 nm) com on-target (a) e off-target (b) DNA, c, d HypaCas9 com on-target (c) e off-target (d) DNA. e, f Cas9-HF1 com on-target (e) e off-target (f) DNA. g Cartoon do rearranjo do domínio HNH. h A FRETSpCas9 rotulada com os pares Cy3 e Cy5 em C867 e C355, respectivamente, foi usada para medir o movimento do domínio HNH durante a clivagem dos substratos on-target.

Para correlacionar as taxas de formação de loop R com os passos envolvidos no acoplamento do domínio HNH no cordão alvo, medimos a mudança conformacional enzimática usando a análise de fluxo parado em um Cas9 que foi rotulado com Cy3 e Cy5 como descrito anteriormente18. Resumidamente, uma versão Cysteine-light do Cas9 foi rotulada com Cy3 no aminoácido 355 e Cy5 no aminoácido 867. A eficiência da FRET aumenta quando o domínio HNH se rearranja para o estado catalítico ativo (Fig. 3g). Após misturar rapidamente o Cas9 rotulado com o par FRET com um DNA perfeitamente compatível com o alvo, observamos um aumento na eficiência FRET, indicando que o domínio HNH estava se rearranjando para o estado catalítico ativo. Medimos a taxa de decaimento para o acoplamento do HNH em ~2,5 s-1 (Fig. 3h), que é semelhante às medições de FRET com uma única molécula. Surpreendentemente, as taxas observadas de formação de loop R (1,5 s-1) e de acoplamento do domínio HNH são muito semelhantes, indicando que estas etapas podem estar cine-ticamente ligadas. A taxa de decaimento observada ligeiramente mais rápida para o movimento do domínio HNH pode ser devida à reação inversa, já que o movimento do domínio chega ao equilíbrio após ou coincidente com a formação do laço R.

As taxas de decaimento do desenrolamento do DNA também foram medidas usando métodos de molécula única usando um DNA rotulado como par FRET, Cy3 e Cy5 foram rotulados na posição -6 nt do cordão alvo e -16 nt no cordão não alvo, respectivamente16. Portanto, também testamos os substratos de DNA com par FRET na tentativa de correlacionar o sinal FRET com as taxas observadas de clivagem de DNA. Primeiro, testamos o substrato anteriormente utilizado em estudos com uma única molécula sem as etiquetas Cy3/Cy516, que tem uma diferença de dois nucleotídeos com nosso substrato, especificamente, uma substituição em T nas posições -16 e -18. A taxa de decaimento da clivagem do feixe alvo (HNH) é semelhante à do nosso substrato (0,7 s-1 vs 1 s-1, Suplemento Fig. 5a), portanto, o contexto da sequência nesta posição não tem um efeito significativo. Também testamos a clivagem com DNA rotulado com Cy3/Cy5 com esta outra sequência, e mostrou uma taxa de decaimento semelhante à nossa sequência (0,05 s-1 vs 0,06 s-1, Suplemento Figs. 5b e 6a). Mais tarde, examinamos o curso temporal da clivagem temporal do feixe alvo (HNH) do ADN marcado com Cy3/Cy5 com a nossa sequência para cada enzima (Fig. 6 Suplementar). Com SpCas9, a reação do DNA marcado com Cy3/Cy5 segue um único exponencial com uma taxa de decaimento acentuadamente reduzida (0,06 s-1 vs 1 s-1) mostrando uma diminuição de ~17 vezes na taxa de decaimento observada para a clivagem do DNA em comparação com o substrato não marcado. O HypaCas9 e Cas9-HF1 também exibiram taxas de decaimento decrescentes de 0,0046 s-1 e 0,0016 s-1, respectivamente, que são 5,9 vezes e 28,75 vezes mais lentas do que os substratos não rotulados medidos sob condições idênticas. É evidente que a interferência das etiquetas Cy3/Cy5 altera o efeito das variantes de alta fidelidade nas taxas de clivagem do ADN. Em conjunto, a etiquetagem do ADN com etiquetas volumosas Cy3 e Cy5 teve um impacto dramático sobre a enzima. Por estas razões, não foram realizados mais estudos utilizando o DNA rotulado como par FRET.

A especificidade Cas9 é governada pela partição cinética

A especificidade da enzima é uma função de todos os passos que levam ao primeiro passo largamente irreversível, todos os eventos anteriores à clivagem do DNA devem ser considerados17. Para medir a taxa de clivagem intrínseca, nós contornamos a etapa de formação do laço R normalmente limitadora da taxa, pré-incubando SpCas9 com DNA fora do alvo na ausência de Mg2+ para permitir que alterações de ligação e conformacionais chegassem ao equilíbrio para formar um complexo SpCas9.DNA. Iniciamos então a reação química com a adição de 10 mM Mg2+. Em nossos estudos anteriores, a formação do laço R foi limitadora da taxa com SpCas9 reagindo com o DNA alvo, e a taxa de decaimento da clivagem intrínseca foi mais rápida quando medida usando o protocolo de préincubação. Aqui, com DNA fora do alvo, as taxas de clivagem de HNH e RuvC foram medidas para 0,12 s-1 e 0,14 s-1, respectivamente (Fig. 7c, d e Fig. 8 Suplementar), que são muito mais lentas do que as taxas de formação do laço R. Intrigantemente, estes resultados mostram que a etapa limitadora da taxa na via enzimática da SpCas9 com um off-target é a clivagem do DNA, uma vez que a taxa de decaimento para a formação do R-loop que medimos foi de 0,85 s-1 (Fig. 2b). Esses dados indicam que a discriminação é baseada, pelo menos em parte, em uma mudança na identidade da etapa limitadora da taxa na comparação entre DNA dentro e fora do alvo.

Repetimos essas experiências com HypaCas9 e Cas9-HF1 com DNA dentro ou fora do alvo. Estes resultados definem as taxas observadas para a clivagem do HNH de 0,035 s-1 e 0,0023 s-1 para HypaCas9 com substratos on- e off-target, respectivamente (Suplemento Fig. 7g, k). As taxas observadas de clivagem de Cas9-HF1 para substratos on- e off-target foram medidas como 0,038 s-1 e 0,00014 s-1, respectivamente (Suplemento Fig. 7o, q). Essas taxas de clivagem observadas são um pouco mais rápidas que as medidas com a adição simultânea de DNA e Mg2+, indicando que alguma etapa além da formação do laço R, mas que precede a clivagem de DNA, pode retardar a taxa de decaimento observada. No entanto, estes resultados mostram que as taxas de clivagem observadas para o ADN alvo são reduzidas ~100 vezes tanto para HypaCas9 como para Cas9-HF1 em relação à SpCas9. Para DNA fora do alvo, as taxas de clivagem observadas são reduzidas em 50 ou 860 vezes para HypaCas9 ou Cas9-HF1, respectivamente, em relação à SpCas9.

Discriminação não é definida apenas pelas taxas relativas de clivagem de DNA. Ao contrário, como a formação de loop R é rápida, a discriminação é uma função da partição cinética entre as taxas de liberação de DNA versus clivagem17,26,27. Para quantificar a partição cinética, incubamos a enzima e rotulamos o DNA na ausência do Mg2+, o que permite que a formação do laço R chegue ao equilíbrio, mas impede a catálise15. Depois adicionamos Mg2+ para iniciar a reação na presença de um grande excesso de DNA idêntico, não rotulado no alvo, para servir como uma armadilha. A comparação entre experimentos paralelos realizados na presença e ausência da armadilha de DNA fornece uma estimativa para a partição cinética fracionada para dissociação versus clivagem do DNA ligado (Fig. 4a). Uma vez que a SpCas9 foi ligada ao ADN alvo, foi clivada rapidamente e a armadilha de ADN teve pouco efeito (Fig. 4b). Em contraste, 33% do DNA fora do alvo desassociou-se da enzima, enquanto ~67% do DNA foi comprometido com a clivagem (Fig. 4c e Suplementar Fig. 9a). Estes resultados mostram que a SpCas9 discrimina o DNA não compatível com o PAM-distal diminuindo a taxa de clivagem, o que aumenta a fração de DNA que é liberada ao invés de clivada. Entretanto, o efeito é pequeno, então a taxa de dissociação parece ser mais lenta do que a clivagem.

Fig. 4: Os Cas9s projetados melhoram a especificidade através da diminuição da taxa de clivagem do DNA.

a Esquema do experimento de armadilha de DNA. b, c SpCas9 clivagem do on-target (de Gong et al.15) (b) ou fora do alvo (c) DNA. d, e HypaCas9 clivagem de DNA on-target (d) ou off-target (e). f, g Clivagem Cas9-HF1 de DNA on-target (f) ou off-target (g). Enzima (28 nM) e DNA rotulado (10 nM) foram incubados na ausência de Mg2+ e a reação foi iniciada pela adição de Mg2+ na presença ou ausência de um excesso de armadilha de DNA não rotulada. A- e A◦ representam a amplitude com (círculos preenchidos) e sem armadilha (círculos abertos), respectivamente. A porcentagem indica a fração de DNA pré-ligado comprometida a avançar para a clivagem relativa à reação na ausência do trap.

Next, examinamos a partição cinética para HypaCas9 e Cas9-HF1 ligada ao DNA alvo (Fig. 4d, f, Suplemento Fig. 9b, d). Nossos resultados com HypaCas9 e Cas9-HF1 mostram que ~75% e ~92% do DNA on-target foi clivado na presença da armadilha, respectivamente. A percentagem de clivagem é menor do que para SpCas9 do tipo selvagem porque a taxa de decaimento intrínseca observada para o DNA on-target pelo HypaCas9 (0,035 s-1) e Cas9-HF1 (0,038 s-1) foi 100 vezes mais lenta do que com SpCas9 (4,3 s-1). Esta taxa de clivagem mais lenta dá tempo para que uma pequena fração (8 a 25%) do DNA on-target se dissocie antes de ser clivada.

A partição cinética para favorecer a dissociação foi aumentada quando HypaCas9 e Cas9-HF1 reagem com DNA off-target porque as taxas de clivagem foram reduzidas ainda mais para 0,0023 s-1 e 0,00014 s-1, respectivamente (Fig. 4e, g, Suplemento Fig. 9c, e). Essas taxas são 50 a 860 vezes mais lentas, respectivamente, em comparação com SpCas9 em um substrato fora do alvo. Assim, apenas ~24% e ~10% do DNA fora do alvo foi comprometido a avançar para a clivagem pelo HypaCas9 e Cas9-HF1, respectivamente, na presença de DNA armadilhado. Em conjunto, estes resultados mostram que as variantes de alta fidelidade adquiridas melhoraram a especificidade contra o ADN não compatível com o PAM através de uma taxa acentuadamente reduzida de clivagem, o que altera a partição cinética para favorecer a libertação em vez da clivagem do substrato ligado para o ADN ligado e desligado do alvo, mas o efeito é maior para o ADN desligado do alvo. O cálculo das constantes da taxa de dissociação aparente usando Eq. (3) mostra que as variantes de alta fidelidade não aumentam a taxa aparente de liberação de DNA (Tabela Complementar 1).

$${\mathrm{Cleavage}}},{\mathrm{probabilidade}} = \frac{{k_{chem}}{{k_{off}} + k_{chem}}}$$
(3)

Rather, o aumento da discriminação é inteiramente atribuído a diminuições na constante de taxa aparente para clivagem.

Em nossas descrições da cinética das enzimas Cas9 até o momento, as taxas de decaimento observadas foram estimadas com base em dados de ajuste a funções exponenciais, que produzem valores próprios que geralmente são funções complexas de constantes de taxas múltiplas17. Para compreender completamente a cinética e o mecanismo, todos os experimentos para cada enzima e substrato de DNA foram ajustados globalmente com base na integração numérica das equações de taxa usando um único modelo unificado (Fig. 5 e Figs. 10-14 Suplementares). O ajuste global dos dados mostra que nosso modelo mínimo (Fig. 5f, inset) contabiliza nossos dados e cada uma das constantes de taxa é bem definida com base na análise de contorno de confiança, testando até que ponto cada parâmetro é limitado pelos dados (Fig. 6)17,28. Observe em particular que nosso modelo é responsável pelos traços bifásicos vistos em alguns experimentos sem ter que invocar heterogeneidade, e fornece constantes de taxa intrínsecas para cada etapa do caminho incluindo a formação de loop R e eventos de clivagem HNH e RuvC. Embora seja provável que rearranjos estruturais adicionais e não resolvidos possam ser necessários para o alinhamento de resíduos catalíticos para clivagem de DNA, estes ainda não foram resolvidos como eventos cinéticos distintos. O modelo atual representa um caminho mínimo necessário e suficiente para contabilizar todos os dados disponíveis, e pode ser facilmente expandido conforme novas informações ficam disponíveis para definir passos adicionais no caminho.

Fig. 5: Ajuste global dos experimentos realizados para interrogar a atividade no alvo do SpCas9.

a DNA e Mg2+ clivagem iniciada pelo domínio HNH. b DNA e Mg2+ clivagem iniciada pelo domínio RuvC. c Taxa de formação de loop R. d Mg2+ clivagem iniciada pelo domínio HNH. e Mg2+ clivagem iniciada pelo domínio RuvC. f Efeito da armadilha de DNA na partição cinética da clivagem Cas9. Todas as curvas foram calculadas com base no ajuste global aos dados de acordo com o modelo cinético (inset), com as constantes de taxa mostradas na Tabela 1. As estimativas de erro foram baseadas na análise do contorno de confiança, conforme mostrado na Fig. 6. E é Cas9.gRNA, D é ADN alvo, ED é Cas9.gRNA.DNA, EDH é formação de laço R com acoplamento da cadeia alvo ao HNH, EDHR e EDP1R são formação de laço R com acoplamento da cadeia não alvo ao RuvC, EDHP2 é clivagem RuvC da cadeia não alvo, EDP1 é clivagem HNH da cadeia alvo, EDP1P2 é clivagem de ambas as cadeias, Dtrap é excesso de DNA não etiquetado, com correspondência perfeita. EDtrap é Cas9.gRNA.DNAtrap.

Fig. 6: Análise de contorno de confiança para ajuste global de dados.

Confidence contours are shown for fitting data in Fig. 5. Constantes numeradas de taxa são definidas em nosso modelo cinético (Fig. 5f, inset). O limite χ2 (linha tracejada) foi definido em 0,99 para definir limites superiores e inferiores para cada constante de taxa como descrito17,32. Como os contornos foram simétricos com parâmetros bem condicionados, reportamos os limites ± de erro na Tabela 1. Para esta análise foi calculado um limite χ2 usando uma distribuição F e foi usado para definir os limites inferior e superior para cada parâmetro.

Para entender a especificidade enzimática, as constantes de taxa devem ser interpretadas no contexto de todos os passos cinéticos relevantes como ilustrado no perfil de energia livre (calculado usando Eq. (4) das constantes de taxa na Tabela 1).

O coeficiente de transmissão A = 0,001

Tabela 1 Parâmetros cinéticos para enzimas Cas9.

Porque o ajuste global dos dados fornece as constantes de taxa para cada passo relevante (Figs. 5 e 6), podemos construir um perfil energético livre de boa fé (Figs. 7b, e Figs. 10-14 Suplementares). Os perfis de energia livre comparando SpCas9, HypaCas9 e Cas9-HF1 mostram uma mudança nas etapas limitadoras de taxa e determinantes de especificidade. A especificidade enzimática é definida por kcat/Km e é dada pela maior barreira global em relação ao estado inicial, enquanto a taxa máxima, kcat, é definida pela maior barreira local em relação ao estado anterior, atenuada por quaisquer etapas anteriores de equilíbrio rápido. Como as constantes de taxa para a formação do loop R não mudam significativamente com diferentes substratos e variantes enzimáticas, a especificidade é governada em grande parte pela partição cinética do loop R Cas9, estado EDH em nosso modelo cinético (Fig. 5f, inset), para avançar resultando em clivagem irreversível versus liberação via recozimento do DNA e ejeção da enzima. As maiores barreiras globais para clivagem observadas com as variantes de alta fidelidade aumentam a probabilidade de partição cinética para favorecer a dissociação do DNA (Fig. 6c).

Fig. 7: A especificidade é governada pela partição cinética de Cas9.

a Representação cartoon da via de reação das enzimas Cas9. b Perfis de energia livre para a clivagem SpCas9 de uma linha cinza de Gong et al.15 e off-target (linha vermelha), respectivamente; clivagem HypaCas9 de uma clivagem off-target (linha azul); e clivagem Cas9-HF1 de uma clivagem off-target (linha preta). Cada perfil foi calculado usando a teoria do estado de transição usando constantes de taxa e equilíbrio que foram derivadas do ajuste global de cada conjunto de experimentos (Tabela 1). Note as barreiras mais altas para a clivagem de DNA em relação à barreira mais baixa para a reação reversa anterior aumentam a probabilidade de liberação de DNA. c Gráfico de barras resumido para k2, k3 e partição cinética (P).