Lý thuyết dự đoán epitope B cell

Tài liệu được viết cho workflow thiết kế vaccine đa epitope (multi-epitope vaccine, MEV) trong bối cảnh ung thư tuyến giáp thể nhú (papillary thyroid carcinoma, PTC). Các tiêu chí là sàng lọc in silico, không thay thế xác thực in vitro/in vivo.

1. Vai trò của epitope B cell

Epitope B cell là vùng kháng nguyên được kháng thể hoặc B-cell receptor nhận diện. Trong MEV, B-cell epitope được thêm vào để hỗ trợ đáp ứng dịch thể, tăng khả năng sinh kháng thể và bổ sung cho nhánh T-cell.

Khác với T-cell epitope, B-cell epitope không nhất thiết phải gắn MHC. Yếu tố quan trọng là epitope có khả năng nằm trên bề mặt protein, ưa nước, linh động và có tính kháng nguyên.

2. Phân loại epitope B cell

  • Linear epitope: chuỗi amino acid liên tục, dễ đưa vào MEV và dễ tổng hợp.
  • Conformational/discontinuous epitope: gồm các residue xa nhau trên chuỗi nhưng gần nhau trong cấu trúc 3D; khó đưa trực tiếp vào MEV dạng tuyến tính.
  • Trong thiết kế MEV tuyến tính, thường ưu tiên linear B-cell epitope và kiểm tra thêm accessibility/hydrophilicity/antigenicity.

3. Nguyên tắc dự đoán

BepiPred 3.0 sử dụng protein language model để dự đoán residue có khả năng thuộc B-cell epitope từ chuỗi protein. Công cụ tạo điểm xác suất theo từng residue, file CSV thô, file FASTA đánh dấu residue epitope và nhóm top epitope theo phần trăm.

Khi dùng BepiPred 3.0, top 20% là nhóm độ tin cậy cao hơn và phù hợp cho danh sách ứng viên chính. Top 50% có thể dùng để khảo sát mở rộng hoặc tránh bỏ sót vùng lân cận. Top 70% không nên dùng trực tiếp cho danh sách cuối vì nguy cơ false positive cao, trừ khi có xác nhận bằng cấu trúc hoặc bằng nhiều tool đồng thuận.

4. Tiêu chí bổ sung

Tiêu chí Công cụ/scale Diễn giải
Surface accessibility Emini Ưu tiên vùng có khả năng lộ bề mặt
Hydrophilicity Parker Ưu tiên vùng ưa nước vì dễ tiếp xúc kháng thể
Antigenicity Kolaskar-Tongaonkar hoặc VaxiJen Ưu tiên vùng có điểm kháng nguyên cao
Safety AllerTOP/ToxinPred Loại allergen/toxic peptide
Human homology BLASTp Loại peptide tương đồng cao với protein người

5. Phân tích kết quả

Kết quả B-cell nên được diễn giải theo vùng, không chỉ theo từng residue. Vùng ứng viên tốt là đoạn liên tục có score cao, nằm trong top 20% hoặc vượt threshold, đồng thời có hydrophilicity và accessibility phù hợp.

Khi chuyển từ residue-level output sang peptide, nên trích các đoạn liên tục khoảng 10-20 aa. Sau đó chạy VaxiJen, AllerTOP, ToxinPred và kiểm tra trùng lặp với epitope T-cell để tối ưu kích thước construct.

6. Diễn giải trong MEV PTC

Trong vaccine ung thư, B-cell epitope có thể không phải lớp quyết định chính như CTL/HTL epitope. Tuy nhiên, nó có thể hỗ trợ trình diện kháng nguyên, sinh kháng thể và tăng tính đa dạng miễn dịch của construct. Chỉ nên giữ B-cell epitope nếu thỏa tiêu chí surface-accessible, antigenic, non-allergenic và non-toxic.

Nếu protein đích là protein nội bào như BRAF hoặc TP53, cần diễn giải B-cell epitope thận trọng vì kháng thể thường khó tiếp cận trực tiếp protein nội bào trong tế bào sống. Khi đó B-cell epitope chủ yếu đóng vai trò tăng tính kháng nguyên của construct hơn là tạo kháng thể trung hòa trực tiếp.

7. Lỗi thường gặp

  • Lấy top 70% làm danh sách cuối.
  • Không chuyển residue-level score thành peptide rõ ràng.
  • Bỏ qua cấu trúc/bề mặt khi diễn giải B-cell epitope.
  • Đánh đồng B-cell epitope với T-cell epitope.
  • Không kiểm tra allergenicity/toxicity của đoạn B-cell epitope.

8. Tài liệu tham khảo

  • Clifford J et al. BepiPred-3.0: improved B-cell epitope prediction using protein language models. Protein Sci. doi:10.1002/pro.4497.
  • DTU Health Tech. BepiPred 3.0 server and instructions. Accessed 2026.
  • IEDB Analysis Resource. Linear epitope prediction tools including Emini, Parker, and Kolaskar-Tongaonkar scales. Accessed 2026.
  • Doytchinova IA, Flower DR. VaxiJen: a server for prediction of protective antigens, tumour antigens and subunit vaccines. BMC Bioinformatics. 2007;8:4.
  • VaxiJen v2.0 official server. Accessed 2026.
  • Dimitrov I et al. AllerTOP - a server for in silico prediction of allergens. BMC Bioinformatics. 2013;14(Suppl 6):S4.
  • AllerTOP official server. Accessed 2026.
  • Rathore AS et al. ToxinPred 3.0: an improved method for predicting the toxicity of peptides. Comput Biol Med. 2024;179:108926.
  • ToxinPred3.0 official server and dataset. Accessed 2026.