Virus SARS-CoV-2 là căn nguyên gây bệnh dịch COVID-19, đại dịch đang hành hoành trên khắp thế giới, gây nhiễm bệnh cho hơn 17 triệu người và có hơn 680,000 ca tử vong tính đến ngày 30 tháng 7 năm 2020. SARS-CoV-2 là virus RNA, sợi đơn, dương, có vỏ.
Bộ gene của SARS-CoV-2
Bộ gene của SARS-CoV-2 có độ dài khoảng 25-32 kilobase, đây là virus có bộ gene lớn nhất trong số các virus RNA. Bộ gene bao gồm các vùng: vùng 5’UTR, khung đọc mở, vùng 3’UTR và cuối cùng là Đuôi-poly (A). Hai phần ba đầu tiên của bộ gene mã hóa cho các protein phi cấu trúc từ 2 khung mở đọc ORF1a và ORF1b. 1/3 cuối của bộ gene mã hóa cho các protein cấu trúc. Có 4 protein cấu trúc được bảo tồn trên các CoV đó là protein (S), protein màng (M), protein vỏ (E) và nucleocapsid (N) protein (Hình 1). Protein S chịu trách nhiệm liên kết với tế bào vật chủ và là thụ thể để virus xâm nhập vào tế bào vật chủ. Các protein M, E và N là một phần của nucleocapsid của các hạt virus.
Cấu trúc bộ gene của SARS-CoV-2
Khi phân tích trình tự của 11 mẫu vi rút phân lập được ở những bệnh nhân đầu tiêu, các nhà khoa học thấy rằng SARS-CoV-2 cùng loài với SARS-CoV gây bệnh SARS đầu năm 2003; 2 virut có bộ gene giống nhau tới 94,6% các chuỗi axit amin (có tới 80% sự tương tự trình tự nucleotide ở cả 2 chủng vi rút). Do vậy, từ tháng 2/2020 Ủy ban quốc tế về phân loại Virus chính thức đặt tên cho chủng mới của vi rút corona là SARS-CoV-2. Tên SARS-CoV-2 khác với Tên của căn bệnh mà WHO đã chính thức chỉ định là COVID-19.
Trong bộ gene của SARS-CoV-2 có một gene thiết yếu là gene RdRp (RNA phụ thuộc RNA polymerase), gene này có độ bảo tồn cao, điều này làm cho gene này rất hữu ích để đo lường khoảng cách sự tiến hóa và sự liên quan của chúng với virus khác. Mặt khác gene này cùng dùng để phát hiện chẩn đoán SARS-CoV-2.
Các virus RNA có tỷ lệ đột biến cao hơn các virus DNA, dẫn đến trong quá trình bộ gene của virus sao chép có một số các sai khác của bộ gene virus được tạo ra. Điều này sẽ tạo ra một quần thể virus có bộ gene đa dạng. Với mỗi chu kỳ nhân lên của virus, sự khác biệt tích lũy giữa bộ gene virus ban đầu và bộ gene virus con cháu. Điều này có thể đóng góp vào sự khác biệt trong các triệu chứng, diễn biến lâm sàng giữa các bệnh nhân mắc COVID-19 ở các thời điểm khác nhau.
Tiến hóa của SARS-CoV-2
Khi phân tích nguồn gốc phát sinh của 30 chủng SARS-CoV-2 đã được phân lập từ các bệnh nhân ở một số vùng lãnh thổ, các nhà khoa học dự đoán rằng sự xuất hiện của SARS-CoV-2 trong quần thể dân cư đã có khả năng xảy ra vào giữa tháng 11 năm 2019. Tỷ lệ đột biến trên bộ gene của SARS-CoV-2 đã được ước tính trong các nhóm khác nhau khoảng từ 1,05×10-3 đến 1,26×10-3 thay thế mỗi vị trí mỗi năm, tỷ lệ này tương tự như ước tính tỷ lệ đột biến của MERS-CoV. Càng có nhiều bộ gene virut được công bố công khai, các nhà khoa học sẽ có nhiều dữ liệu để theo dõi sự tiến hóa và tỷ lệ đột biến của virus tốt hơn. Hiện nay 2 gene đang được lựa chọn để theo dõi các đột biến của virus là gene S và gene N, đột biến và thích nghi trong các gene S và N có thể ảnh hưởng đến sự ổn định và khả năng gây bệnh của virus. Khi nhiều bộ gene của SARS-CoV-2 được công bố công khai, phân tích kỹ về sự đa dạng trình tự bộ gene của virus, các nhà khoa học đã thấy sự đa dạng xảy ra nhiều trong các gene cấu trúc, đặc biệt là gene S.
SARS-CoV-2 đang phát triển, đang tiến hóa trong quá trình xảy ra đại dịch. Các nhà khoa học thấy rằng, sự tiến hóa của SARS-CoV-2 không diễn ra nhanh hơn so với các virus khác trong một ổ dịch, chúng đang diễn ra một cách bình thường. Tuy nhiên, có các nhóm SARS-CoV-2 khác nhau đang phát triển khi COVID-19 lan rộng trên toàn địa cầu. Đây là hoàn toàn bình thường và không có nghĩa là có những chủng SARS-CoV-2 mới có độc lực mạnh hơn, gây bệnh nhiều hơn các chủng đang lưu hành.
Để theo dõi sự tiến hóa của virus này, các nhà khoa học đã và đang tiếp tục thực hiện giải trình tự bộ gene SARS-CoV-2 cập nhật và chia sẻ kết quả liên tục trong đại dịch này.
PGS.TS Phan Quốc Hoàn – Khoa Sinh học phân tử
Nguồn: Johns Hopkins Center for Health Security