Thứ Tư , 24 Tháng Mười 2018
Trang chủ Chuyên mục Góc nhìn Giải trình tự gene thế hệ mới và tình hình ở Việt Nam

Giải trình tự gene thế hệ mới và tình hình ở Việt Nam

Bài viết thứ 52 trong 51 bài thuộc chủ đề Góc nhìn
 

Góc nhìn

Trong cuốn sách “Homo deus: tương lai của loài người”, tác giả Yuval Harari dành một phần khá lớn thời gian để phân tích những ảnh hưởng của công nghệ gene đến việc chăm sóc sức khỏe, ngành y tế và cuộc sống của con người trong tương lai. “Chưa bao giờ biết về bộ gene chính mình lại dễ dàng và rẻ như thế này”. Điều này có được là nhờ vào những tiến bộ của công nghệ giải trình tự gene thế hệ mới với thời gian và chi phí ngày càng giảm.
Hiện nay, công nghệ giải trình tự gene đang được ứng dụng nhiều ở lĩnh vực chẩn đoán, tầm soát và chữa trị bệnh. Các thai phụ có thể làm những chẩn đoán tiền sinh nhanh và chính xác hơn mà không cần phải chịu những rủi ro và nguy hiểm do chọc ối. Các bệnh di truyền có thể được phát hiện sớm hơn. Với những bệnh di truyền hiếm gặp, việc giải trình tự bộ gene có thể giúp bác sĩ tìm ra nguyên nhân bệnh nhanh hơn. Trong điều trị, trình tự DNA của bệnh nhân có thể giúp bác trị điều chỉnh phác đồ điều trị phù hợp và hiệu quả hơn.

Vậy công nghệ giải trình tự gene thế hệ mới là gì, có những ưu điểm gì, cần cơ sở trang thiết bị và con người như thế nào?

Giải trình tự gene thế hệ mới (next generation sequencing – NGS); như tên gọi của nó, “thế hệ tiếp theo” là để phân biệt với phương pháp giải trình tự thế hệ đầu tiên do Frederick Sanger phát minh vào năm 1977. Vào thời điểm đó, phương pháp Sanger không phải là duy nhất, nhưng hiệu quả và dễ sử dụng hơn cả, nên rất được ưa chuộng. Trong suốt 25 năm sau đó, phương pháp này liên tiếp được cải tiến và tự động hóa để chế tạo thành máy giải trình tự (sequencer) thế hệ đầu tiên và đóng vai trò chủ đạo trong dự án “giải trình tự bộ gene người” đã được công bố vào năm 2001.

                                        Máy HiSeq của lllumina đang hoạt động
Vào đầu những năm 2000, một loạt công nghệ mới được phát minh ra nhằm tăng năng suất và hiệu quả trong việc giải trình tự DNA. Trong số đó, phương pháp của công ty Solexa và sau này được công ty Illumina mua lại và phát triển tiếp thành một thế hệ máy giải trình tự mới. Hiện nay các dòng máy giải trình tự của Illumina (Miseq, HiSeq, NextSeq,…) là phổ biến nhất trên thị trường, được sử dụng rộng rãi trong nghiên cứu cơ bản gồm cả chẩn đoán và điều trị.

Các “sợi mì” DNA được kết nối với nhau từ các trình tự A, T, C, G (Nguồn: Internet).
Để hình dung sự khác nhau cơ bản trong nguyên tắc của hai phương pháp giải trình tự này, chúng ta hãy nhớ lại một chút về hình dạng của phân tử DNA. Nếu được phóng đại lên, sợi DNA có hình dạng giống sợi mì (hình minh họa), nhưng thay vì được cấu thành từ các đơn phân là glucose, thì sợi mì DNA được kết nối bởi hàng triệu các phân tử nucleotide gọi tắt là A, T, C, G (mỗi chữ cái tương ứng với một trình tự). Giải trình tự gene là đi tìm thứ tự đúng của từng phân tử A, T, C, G trên một gene nhỏ hoặc trong toàn bộ gene của sinh vật.
Mỗi tế bào người (thường) có 46 sợi mì (nhiễm sắc thể). Lấy ví dụ một sợi mì nhỏ nhất của người là nhiễm sắc thể thứ 21, có khoảng 50 triệu trình tự. Trong khi đó, các phương pháp hiện nay chỉ giải được cho một cọng mì nhỏ xíu có chiều dài khoảng 500 – 2000 trình tự mà thôi. Như vậy, người ta phải cắt nhỏ sợi mì thứ 21 ra thành 20.000 – 100.000 cọng mì nhỏ để giải (con số có tính chất ước lượng, trên thực tế có thể nhiều hơn vì các cọng mì bị cắt ra có thể chồng lên nhau và phải được giải nhiều lần để tăng độ chính xác), rồi ráp nối kết quả lại với nhau. Mỗi lần giải với phương pháp Sanger thường chỉ giải 1 cọng mì nhỏ, nên chi phí khá cao và hiệu quả lại thấp. Ngược lại, phương pháp NGS cho phép xử lý hàng triệu cọng mì nhỏ cùng một lúc, kết quả được ghi chép và lưu trữ dưới dạng dữ liệu tin học. Nếu so sánh việc giải trình tự như đi câu cá, thì phương pháp Sanger giống như đi câu từng con cá, còn NGS là quăng lưới bắt cả mẻ lớn một lần! Vì vậy, hai điểm mạnh của NGS là rút ngắn thời gian và giảm giá thành. Nếu lấy trên đơn vị là 1 triệu trình tự thì tốn 2400 đô-la Mỹ với phương pháp Sanger và chỉ có 0.05 – 0.15 đô-la Mỹ với NGS! Mức độ chênh lệch quả thật khủng khiếp.
Với giá thành thấp như vậy, nên người ta có thể giải với số lượng nhiều và thu được lượng dữ liệu rất lớn. Từ kho dữ liệu này đến kết quả đáng tin cậy để gửi trả cho khách hàng là một đoạn đường dài, đòi hỏi các phương pháp tính toán hợp lý. Vì vậy, ngoài máy móc và công nghệ, thì quan trọng là người phân tích cần có hiểu biết trong nhiều lĩnh vực: sinh học, tiến hóa phân tử (molecular evolution), tin học và xác suất thống kê.
Với cách thiết kế đa dạng và linh động, phương pháp giải trình tự thế hệ mới có thể được biến đổi để phù hợp cho nhiều mục đích khác nhau. Trong ứng dụng, có 3 quy trình phổ biến nhất:
  • Giải trình tự cả bộ gene (whole genome sequencing): Là xác định trình tự cho cả bộ gene của sinh vật, trong đó có con người. Mặc dù công nghệ hiện nay tiến bộ như vậy, nhưng vẫn chưa có bộ gene của động vật có vú nào, kể cả con người được giải mã hoàn toàn. Mặc dù vẫn còn nhiều hạn chế và thách thức khi ứng dụng rộng rãi, nhưng quy trình này đã tìm ra được các vị trí trong bộ gene có liên quan đến nhiều loại bệnh như tự kỷ, xơ cứng teo một bệnh, rối loạn trương lực (dystonia),…
  • Giải toàn bộ exon (whole exome sequencing): exon chỉ chiếm 1% của bộ gene nhưng chứa thông tin trực tiếp mã hóa cho các protein thực hiện chức năng trong cơ thể. Vì vậy, những thay đổi trình tự của exon có thể liên quan trực tiếp đến bệnh tật hay tình trạng sức khỏe của con người. Quy trình này đã được thương mại hóa nên dễ thực hiện và khá phổ biến.
  • Giải một – vài gene cụ thể: là xác định trình tự của một – vài gene có liên quan đến một loại bệnh nào đó. Ví dụ nhóm các gene liên quan đến hội chứng ung thư di truyền. Vì số lượng ít và mục tiêu rõ ràng, nên kết quả và độ chính xác của việc giải trình tự này sẽ cao hơn, còn giá thành sẽ thấp hơn.
Hiện nay, ngoài Mỹ thì Trung Quốc cũng phát triển rất mạnh và nắm giữ nhiều công nghệ giải trình tự mới. Họ cũng đã tự sản xuất ra được máy giải trình tự của riêng họ (Trung Quốc mà, có thể tháo ra và chế biến lại bất kỳ loại máy móc nào), nhưng độ chính xác và tin cậy thì chưa biết thế nào. Điển hình là viện di truyền học Bắc Kinh (Bejing Genomics Institute – BGI) đã tiến hành giải trình tự bộ gene rất nhiều loài động, thực vật và tất nhiên họ có nguồn dữ liệu khổng lồ về bộ gene con người. Với tiềm lực về công nghệ, tài chính và nhân lực như vậy, các công ty Trung Quốc có thể xâm nhập vào thị trường Việt Nam và các nước châu Á.
Ngoài kinh doanh và lợi nhuận, còn có một vấn đề quan trọng và cấp thiết hơn đáng được quan tâm nếu chúng ta sử dụng công nghệ và dịch vụ của họ. Đó là họ sẽ có quyền sở hữu và khai thác dữ liệu về bộ gene của người Việt Nam. Bạn có muốn người nước ngoài nói chung và Trung Quốc nói riêng nắm giữ thông tin bộ gene của bạn không? Thông tin bộ gene chứa vô vàn thông tin về đặc điểm di truyền, sức khỏe, … của người Việt. Đó là một nguồn dữ liệu vô cùng quý giá mà chúng ta dù chưa khai thác được hết nhưng không thể để mất. Và nếu không muốn viễn cảnh đó xảy ra, thì không cách gì khác là người Việt phải nắm bắt được công nghệ này và đưa vào sử dụng để phục vụ nhu cầu đang ngày một tăng lên trong ngành y tế và sức khỏe. Và hẳn nhiên, sự chọn lựa và hiểu biết của khách hàng khi sử dụng dịch vụ cũng là một yếu tố quan trọng.
Một vài máy giải trình tự của Illumina đã có mặt tại Việt Nam. Hi vọng một ngày không xa, công nghệ này và các ứng dụng của nó sẽ được thực hiện rộng rãi hơn, có tổ chức chặt chẽ và bài bản (kết hợp với tư vấn di truyền) và giá thành thấp hơn phù hợp với khả năng tài chính của người Việt.

Tài liệu tham khảo:

Nếu bài viết hữu ích, bạn thích hãy bấm LIKE và SHARE để ủng hộ nhé.