Báo cáo phân tích dữ liệu · 3 năm · Khối thi THPTQG

Giải mã đáp án Tiếng Anh 2023–2025

Phân tích thống kê 4.320 ô đáp án qua ba kỳ thi liên tiếp, lần theo dấu vết một quy luật từng tồn tại — và dự báo điều gì chờ đợi năm 2026.

Câu chuyện trong một câu

Một quy luật từng có thật — rồi biến mất.

Suốt định dạng cũ (2023–2024), đáp án C luôn nhỉnh hơn một cách có ý nghĩa thống kê. Nhưng đúng năm 2025 khi đổi sang định dạng 48 mã đề, thiên hướng đó tan biến hoàn toàn. Đây là bằng chứng sống động: quy luật quá khứ có thể thật, nhưng không bền khi quy trình thay đổi.

Câu chuyện đáp án C qua ba năm

Biểu đồ trung tâm của toàn báo cáo. Theo dõi tỉ lệ bốn đáp án qua từng năm — chú ý đường C (cam) và đường A (xanh) gần như đối xứng nhau qua mốc 25%.

Tỉ lệ A / B / C / D qua ba kỳ thi

Mốc đổi định dạng nằm giữa 2024 và 2025 (50 câu × 24 mã → 40 câu × 48 mã).

C A B D Mức đều 25%

Đọc cho cấp trên: Gộp 2023 và 2024, tỉ lệ C là 28,25% với xác suất ngẫu nhiên chỉ p=0,00015 — gần như chắc chắn không phải tình cờ. Nhưng năm 2025 mức C rơi về 25,9% (p=0,19, không còn ý nghĩa). Một quy luật lặp lại 2 năm rồi mất đúng lúc đổi định dạng — đó là dấu hiệu của một quy trình được cải tiến.

Bảng kết luận chung

So sánh trực tiếp các chỉ số then chốt của ba năm trong một bảng duy nhất.

Chỉ số202320242025

Ba điểm nhất quán qua mọi năm: (1) cùng cơ chế "ngân hàng câu hỏi + xáo trộn hai tầng" — số đáp án A trong một mã luôn dao động rộng; (2) đều có xu hướng tránh lặp đáp án liền kề (tỉ lệ câu liên tiếp trùng luôn dưới 25%); (3) không năm nào có quy luật "sau đáp án X thì hay ra Y".

Độ ngẫu nhiên tăng dần theo thời gian

Chỉ số entropy đo mức độ "khó đoán" của đáp án. Càng gần 2,0 càng ngẫu nhiên. Quy trình trộn đề rõ ràng tốt lên qua các năm.

Entropy trung bình mỗi câu — đo chất lượng trộn đề

2025 đạt mức cao nhất, đồng thời là năm thiên hướng C biến mất.

Dự đoán kỳ thi 2026

Dựa trên xu hướng ba năm và việc 2026 dự kiến giữ định dạng mới giống 2025. Mọi dự đoán đều kèm mức độ tin cậy và lý do.

2026
DỰ BÁO DỰA TRÊN
XU HƯỚNG 2023–2025
Thiên hướng C
Tin cậy cao
Sẽ không quay lại. Thiên hướng C đã biến mất cùng định dạng mới năm 2025. Vì 2026 giữ định dạng 48 mã đề, đáp án C nhiều khả năng vẫn quanh mức đều ~25–26%. Chiến lược "full C" của thời cũ sẽ không còn lợi thế.
Phân bố A/B/C/D
Tin cậy cao
Bốn đáp án sẽ phân bố gần đều, mỗi chữ dao động trong khoảng 23–27%. Không chữ nào lệch đủ để khai thác. Lệch nhỏ giữa các chữ là bình thường và không dự đoán được trước.
Chiến lược khoanh mù
Tin cậy vừa
Kỳ vọng mọi chiến lược đều cho ~25% (≈10/40 câu). Nếu buộc phải chọn, "Full A" là phương án an toàn nhất về mặt rủi ro — nhưng khác biệt so với các kiểu khác sẽ rất nhỏ và phần lớn do may rủi.
Cơ chế trộn đề
Tin cậy cao
Giữ nguyên "ngân hàng câu hỏi + xáo hai tầng", có xu hướng tránh chuỗi lặp dài. Entropy nhiều khả năng vẫn cao (~1,96), tiếp nối đà cải thiện.
Điểm cần lưu ý
Đây là dự báo xác suất, không phải chắc chắn. Chỉ có ba năm dữ liệu và một lần đổi định dạng, nên độ tin cậy bị giới hạn. Nếu 2026 lại đổi định dạng, mọi dự đoán trên cần xét lại.

Khuyến nghị thực dụng cho thí sinh 2026: Đừng học mẹo khoanh từ các năm cũ — quy luật C đã chết. Chênh lệch giữa chiến lược khoanh tốt nhất và tệ nhất chỉ ~2 điểm/40, trong khi loại được 1 đáp án sai mỗi câu sẽ cộng ~3,3 điểm. Toàn bộ phân tích ba năm hội tụ về một lời khuyên duy nhất: dồn thời gian vào kiến thức, không có lối tắt.