Ngày 28/1, Google công bố mô hình AI mới mang tên AlphaGenome, được phát triển bởi đội ngũ Google DeepMind. Công cụ này được thiết kế nhằm hỗ trợ các nhà khoa học khám phá sâu hơn bộ gene người, đặc biệt là phần ADN không mã hóa – khu vực chiếm phần lớn hệ gene nhưng trước đây chưa được hiểu rõ chức năng.

Theo đại diện Google DeepMind, việc hoàn tất bản đồ bộ gene người vào năm 2003 mới chỉ giúp con người nắm được “văn bản” của sự sống với khoảng 3 tỷ cặp nucleotide. Tuy nhiên, việc hiểu “ngữ pháp” của bộ gene – tức cách các đoạn ADN phối hợp điều khiển hoạt động sinh học – vẫn là thách thức lớn. AlphaGenome ra đời để góp phần giải quyết bài toán này.
Các nhà khoa học cho biết chỉ khoảng 2% ADN của con người mã hóa protein, còn 98% là ADN không mã hóa. Trước đây, phần này từng bị gọi là “ADN rác”, nhưng nhiều nghiên cứu gần đây cho thấy nó giữ vai trò điều hòa hoạt động gene và có liên quan đến nhiều biến thể gây bệnh. AlphaGenome được huấn luyện trên dữ liệu từ các dự án khoa học công khai, thu thập thông tin về ADN không mã hóa trên hàng trăm loại tế bào và mô ở người và chuột.
Một điểm nổi bật của AlphaGenome là khả năng phân tích các chuỗi ADN rất dài, lên tới một triệu ký tự, trong khi vẫn duy trì độ chi tiết cao. Nhờ đó, mô hình có thể dự đoán tác động của từng cặp nucleotide đối với các quá trình sinh học trong tế bào, chẳng hạn như thời điểm gene bắt đầu hoặc kết thúc hoạt động, hay mức độ sản sinh ARN – phân tử đóng vai trò quan trọng trong truyền đạt thông tin di truyền và tổng hợp protein.
Theo nhóm phát triển, việc xử lý được các chuỗi ADN dài giúp các nhà nghiên cứu hiểu đầy đủ môi trường điều hòa xung quanh một gene đơn lẻ. Độ phân giải cao của mô hình cũng cho phép so sánh trực tiếp giữa chuỗi ADN bình thường và chuỗi có đột biến, từ đó đánh giá ảnh hưởng của các biến thể di truyền.
Google cho biết AlphaGenome đã được hơn 3.000 nhà khoa học tại 160 quốc gia thử nghiệm và hiện được cung cấp miễn phí cho cộng đồng nghiên cứu với mục đích phi thương mại.
Dù được đánh giá là bước tiến quan trọng, nhiều chuyên gia cũng lưu ý AlphaGenome vẫn có giới hạn. Một số nhà nghiên cứu cho rằng mô hình phụ thuộc lớn vào chất lượng dữ liệu huấn luyện, nên chưa thể bao quát hết mọi trường hợp sinh học phức tạp. Ngoài ra, sự biểu hiện gene còn chịu ảnh hưởng từ yếu tố môi trường – điều mà các mô hình AI khó có thể quan sát đầy đủ.
Tuy vậy, giới khoa học nhận định AlphaGenome mở ra cơ hội mới trong việc nghiên cứu nguồn gốc di truyền của nhiều bệnh lý phức tạp, góp phần thúc đẩy sự phát triển của y học chính xác và các liệu pháp điều trị trong tương lai.

Bình luận
0