Các mô hình đã sai thế nào và tại sao?

Các mô hình đã sai thế nào và tại sao?

Các mô hình dịch tễ học được sử dụng để mở rộng và biện hộ cho tình trạng phong tỏa tiếp diễn do virus corona đang bắt đầu được nghiên cứu kỹ lưỡng bởi giới hàn lâm. Một bài nghiên cứu mới xuất bản bởi Cục Nghiên cứu Kinh tế Quốc gia (NBER) trình bày một báo cáo thống kê chi tiết về một vài mô hình có sức ảnh hưởng nhất định, đặc biệt là nghiên cứu của Đại học Hoàng gia London (ICL) đã dự đoán rằng sẽ có tới 2,2 triệu ca tử vong ở Mỹ khi kịch bản tồi tệ nhất xảy ra.

Mô hình của ICL đã đưa ra một loạt các kịch bản khả dĩ dựa trên các phản ứng chính sách khác nhau, nhưng dự báo cực đoan này - còn được gọi là kịch bản “không làm gì” - đã chiếm trọn tất cả các tiêu đề báo vào tháng Ba vừa rồi. Mặc dù nghiên cứu của ICL đã mô tả kịch bản “không làm gì” của chính họ là “không thể xảy ra” kể cả trong trường hợp giả định rằng virus lây lan và có rất ít phản ứng chính sách cũng như hành vi, nhưng những dự báo về số ca tử vong khổng lồ của nó đã được công nhận rộng rãi vào thời điểm đó khiến một số chính phủ phải áp dụng những chính sách phong tỏa hà khắc như hiện tại.

Chính quyền Trump đã viện dẫn đích danh dự báo 2,2 triệu người chết của ICL vào ngày 16 tháng 3 khi họ chuyển hướng sang một loạt chính sách nghiêm ngặt về "giãn cách xã hội" mà nhiều bang sau đó đã sử dụng làm cơ sở cho lệnh ở-nguyên-tại-chỗ. Tại Anh, nơi kịch bản “không làm gì cả” của mô hình tương tự dự đoán hơn 500.000 người chết, nhóm ICL đã được công nhận trực tiếp vì đã khiến Thủ tướng Boris Johnson chuyển hướng từ chiến lược dần dần xây dựng “miễn dịch cộng đồng” thông qua cách tiếp cận can thiệp chính sách nhẹ nhàng sang phong tỏa như hiện tại.

Rõ ràng là, mô hình ICL đã thay đổi đáng kể phản ứng chính sách của hai cường quốc hàng đầu thế giới.

Quả thực, nhóm ICL đã đóng một vai trò không nhỏ trong việc thổi phồng các dự báo về kịch bản “không làm gì cả” này, ngay cả khi báo cáo của chính họ đã hạ thấp khả năng xảy ra của chính kết quả đó để ủng hộ những kế hoạch thận trọng hơn liên quan đến một loạt các chính sách giãn cách xã hội và tạm ngưng việc tụ tập nơi công cộng. Vào ngày 20 tháng 3, tác giả chính của ICL, Neil Ferguson, đã báo cáo cho Nicholas Kristof của New York Times rằng dự báo 2,2 triệu ca tử vong là "trường hợp xấu nhất". Khi Kristof hỏi thêm về "trường hợp tốt nhất", Ferguson trả lời "Khoảng 1,1 triệu ca" - một dự đoán dựa trên một chiến lược vừa phải nhằm giảm thiểu dịch bệnh.

Điều đáng chú ý là ngay cả vào thời điểm chúng được công khai vào ngày 16 tháng 3, thực tế đã hoàn toàn trái với các điều kiện của kịch bản “không làm gì” của ICL, dẫn đến các giả định của mô hình là không hợp lý. Hầu hết các chính phủ đã bắt đầu “làm điều gì đó” vào thời điểm được đề cập, dù cho nó liên quan đến các chiến dịch thông tin công khai về vệ sinh và giãn cách xã hội hay hủy bỏ sự kiện và những giai đoạn đầu của việc phong tỏa, điều đã bắt đầu được thực thi nghiêm túc trước đó một tuần. Sự thay đổi hành vi một cách tự nguyện để thích ứng cũng đi trước các chính sách của chính phủ vài tuần, theo dõi từ tháng 2 cũng đo lường được sự gia tăng trong hoạt động rửa tay và lượng đặt chỗ ở các nhà hàng cũng giảm mạnh trong hai tuần đầu tiên của tháng Ba. Khi gắn với bối cảnh này, quyết định thổi phồng số ca tử vong lên mức cực đoan với kịch bản “không làm gì cả” của Ferguson với báo chí vào khoảng giữa đến cuối tháng Ba là vô trách nhiệm.

Tuy nhiên, những dự báo về số người chết đáng báo động đã chi phối công chúng vào thời điểm đó và - Hoa Kỳ, bằng việc viện dẫn mô hình ICL - đã thực sự tiến hành phong tỏa.

Một tháng sau, có thể thấy rõ rằng dự báo 2,2 triệu ca tử vong đã sai lệch gấp nhiều lần, và mô hình tương tự dự báo 500.000 người tử vong tại Anh cũng như vậy. Ferguson và nhóm ICL đã thay đổi quan điểm trước công chúng của họ sang nhấn mạnh những kịch bản khác với các dự đoán thận trọng hơn trong số hàng chục nghìn khả năng (trong một số trường hợp, người ta đã mô tả một cách nhầm lẫn rằng đây là bản sửa đổi cho mô hình cũ, mặc dù nó thực sự có sử dụng các kịch bản nhẹ nhàng hơn trong bài báo gốc ngày 16 tháng 3).

Tuy nhiên, hậu quả của kịch bản cường điệu hóa "không làm gì" của ICL đã ở kia rồi. Thật vậy, tính đến thời điểm viết bài này, Tổng thống Trump vẫn viện dẫn dự báo 2,2 triệu người trong các cuộc họp báo hàng ngày như một cơ sở lý luận cho việc phong tỏa. Đến tận ngày 18 tháng 4, phóng viên COVID của New York Times Donald McNeil cũng vẫn đưa ra những con số tương tự, và thậm chí một tháng sau đó nó vẫn là điều cấm kỵ trên mạng xã hội đối với những người không phải là nhà dịch tễ học khi xem xét kỹ lưỡng các tuyên bố thống kê cơ bản của các chuyên gia có trình độ như Ferguson.

Chúng ta được thông báo rằng “hãy ở yên” và để các chuyên gia làm việc của họ. Dịch tễ học có các phương pháp và mô hình của riêng mình, ngay cả khi các kịch bản đáng báo động nhất của họ - những kịch bản mà Ferguson đã công khai phóng đại trên các phương tiện truyền thông một tháng trước - đã dần phai nhạt theo những cách hiển nhiên và rõ ràng.

Giờ hãy xem xét bài nghiên cứu mới của NBER, đồng tác giả bởi một nhóm các nhà kinh tế sức khỏe từ Đại học Harvard và MIT. Các tác giả của nghiên cứu này tiến hành đo lường và xem xét kỹ lưỡng các dự báo dịch tễ học hàng đầu, bao gồm cả mô hình ICL từng là tâm can của những quyết định chính sách phong tỏa vào tháng Ba. Một trong số những phát hiện của nghiên cứu này là:

“Trong thực tế, tính không đồng nhất trọng yếu và thách thức nhất là hành vi cá nhân thay đổi theo thời gian. Cụ thể là, sự lây lan của dịch bệnh có thể khiến các cá nhân phải đưa ra các quyết định riêng để hạn chế tiếp xúc với người khác. Do đó, ước tính từ các kịch bản giả định sự lây lan dịch bệnh theo cấp số nhân không được kiểm soát, chẳng hạn như số liệu được báo cáo từ mô hình của Đại học Hoàng gia về 500.000 ca tử vong ở Anh và 2,2 triệu ở Mỹ, không tương ứng với các phản ứng hành vi phỏng đoán trong thực tế. "

Như các tác giả giải thích, hành vi của con người thay đổi trong suốt quá trình xảy ra dịch bệnh. Ngay cả kiến thức cơ bản về các nguy cơ lây nhiễm liên quan cũng khiến mọi người phải thực hiện các bước phòng ngừa (suy nghĩ thấu đáo làm gia tăng hành vi rửa tay hoặc đeo khẩu trang ở nơi công cộng). Bản thân những kỳ vọng về các can thiệp chính sách sau đó sẽ khiến mọi người thay đổi hành vi của họ nhiều hơn - và cứ tiếp tục như vậy. Tác động tích lũy từ những hành vi này sẽ làm giảm độ tin cậy của các dự báo dịch tễ học, đặc biệt là những dự báo không giải thích cho các thay đổi hành vi.

Nếu điều này nghe có vẻ quen thuộc, thì đây chính là lời phê bình mà đồng nghiệp Will Luther của tôi đưa ra vào ngày 18 tháng 3, chỉ hai ngày sau khi mô hình ICL ra mắt. Tương tự, ông ấy cũng chú tâm đến hàm ý này khi Ferguson thay đổi thái độ trước công chúng sang các kịch bản thận trọng hơn trong mô hình của ông vào cuối tháng Ba. Tôi cũng chỉ ra tầm quan trọng của việc thích ứng hành vi trong khoảng thời gian này khi xem xét nhiều phản ứng chính sách đối với COVID-19, từ lời khuyên về sức khỏe cộng đồng cho đến việc chốt chặn hay các trạm kiểm soát biên giới ở một số bang nhất định.

Xa hơn, các tác giả bài nghiên cứu của NBER chỉ trích nghiên cứu của ICL và bốn mô hình dịch tễ học khác vì đã phóng đại quá mức độ chắc chắn về nhiều kịch bản dự báo của họ. So với các yếu tố khác, thích ứng hành vi làm giảm độ chính xác của dự báo dài hạn. Việc trình bày nhiều kịch bản cũng đặt ra yêu cầu áp dụng vô số giả định cơ sở về cách các yếu tố này sẽ thay đổi như thế nào khi mỗi lựa chọn chính sách được đưa ra. Điều không may là, không có mô hình dịch tễ học nào họ xem xét thực hiện các bước đầy đủ để tính đến những biến phức tạp này.

Do đó, nghiên cứu của NBER kết luận: "Tóm lại, ngôn ngữ của những bài nghiên cứu này thể hiện một mức độ chắc chắn mà đơn giản là không thể biện minh được. Ngay cả khi các giá trị tham số đại diện cho một loạt các trường hợp khả dĩ trong điều kiện của mô hình được đưa ra, thì không ai trong số các tác giả này cố gắng lượng hóa sự không bất trắc về tính xác đáng trong việc lựa chọn mô hình của họ".

Kiến thức chuyên ngành dịch tễ học có thể truyền đạt những hiểu biết chuyên môn về bản chất lây truyền dịch bệnh đặc biệt phù hợp trong việc dự báo sự lây lan của đại dịch. Tuy thế, điều đó không miễn trừ việc những nhà lập mô hình trong khoa học xã hội tốt nhất là phải kiểm tra tính chắc chắn trong các tuyên bố của họ, và việc này cũng không vi phạm các quy tắc cơ bản của phân tích thống kê.

Sẽ thật sai lầm nếu coi dịch tễ học là một ngành mà những người không nằm trong chuyên môn không phê phán được, bởi các cuộc tranh luận về Covid-19 đang diễn ra chứng tỏ đó là một thảo luận khoa học phức tạp, đa chiều, cần sự tham gia của những chuyên gia y tế và các chuyên gia ngành khác nữa. Cùng thời điểm đó, vào tháng 3, mô hình ICL được đưa ra bởi một nhà thống kê y học nổi tiếng.

John Ionannidis đã mạnh mẽ khuyến cáo các nhà lập mô hình dịch bệnh để giúp họ nhận ra những thiếu sót nghiêm trọng của những dữ liệu dù có là đáng tin cậy về Covid-19, bao gồm những giả định về sự lây truyền của nó và những tỉ lệ tử vong cơ bản chưa xác định được. Gần đây hơn, một nhóm các nhà dịch tễ học tại Đại học Sydney đã kiểm tra hoạt động của mô hình nổi tiếng của Viện Đánh giá và Đo lường Sức Khỏe (IHME) của Đại học Washington trong việc dự đoán số ca tử vong ngày hôm sau ở từng bang trong toàn bộ 50 bang ở Mỹ. Khi xem xét kết quả hàng ngày từ tháng 3 và đầu tháng 4, họ kết luận rằng có tới 70% tổng số ca tử vong thực tế hằng ngày nằm ngoài khoảng tin cậy 95% của mô hình, do con số quá cao hoặc quá thấp. Phát hiện này không nhất thiết bác bỏ độ tin cậy của phương pháp tiếp cận từ các nhà nghiên cứu của IHME, song nó nói lên được sự cần thiết trong việc cải tiến kỹ thuật của họ, đồng thời cảnh bảo việc sử dụng các dự đoán của nó làm cơ sở để hoạch định chính sách trong khi sự không chắc chắn của mô hình vẫn khá cao.

Những ví dụ này cho thấy dịch tễ học, kinh tế học sức khỏe và những lĩnh vực liên quan chuyên về thống kê y học không cung cấp được sự "đồng thuận" duy nhất và do đó không phải là nguồn tham khảo chuyên môn duy nhất. Thay vào đó, những thống kê này mở ra những cuộc tranh luận cần thiết, đôi khi gây tranh cãi sâu sắc, bao gồm những tranh cãi về COVID-19.

Để chứng minh tầm quan trọng của việc giám sát thống kê, ta cần quay lại quan sát những đại dịch từng xảy ra trong quá khứ để xem những tranh luận tương tự nói lên điều gì về tính chính xác của các dự báo dịch tễ học khác nhau. Vào cuối thập niên 90 và đầu những năm 2000, tại Vương Quốc Anh, có một tranh luận liên quan đến hội chứng Creutzfeldt-Jakob, hay được biết đến nhiều hơn với cái tên "Bệnh Bò điên".

Năm 2001, tờ New York Times đăng một câu chuyện về các dự báo dịch tễ học khác nhau về sự lây lan của Bệnh Bò điên, nêu bật hai mô hình khác nhau. Mô hình đầu tiên đến từ nhóm của Jerome Hillard d’Aignaux, Simon Cousens và Peter Smith tại Trường Y học Nhiệt đới và Vệ sinh Dịch tễ London (LSHTM). Sử dụng nhiều giả định về tỷ lệ hiện mắc bệnh của căn bệnh này (một vài giả định đang bị tranh cãi gay gắt) cũng như dữ liệu quan sát về tỷ lệ mắc bệnh trước vụ bùng phát lớn năm 1996, mô hình LSHTM đưa ra nhiều kịch bản mô tả một dạng lây truyền, về tổng thể là nhẹ đối với bệnh dịch này.

Như Cousens nói trong cuộc phỏng vấn với tạp chí Times năm 2001, "Không có mô hình nào đưa ra con số vượt quá 10.000 ca tử vong và hầu hết mô hình đưa ra con số thấp hơn rất nhiều, trong khoảng vài nghìn ca tử vong" lan rộng trong thập kỷ tới. Trong khi các tài liệu về Bệnh Bò điên liên tiếp tranh luận về một số giả định cơ bản trong mô hình của họ, nhóm LSHTM đưa ra dự báo tử vong khá sát với thực tế - ít nhất là khá sát so với những mô hình còn lại.

Có ước tính chừng 177 người đã chết bởi bệnh Bò điên ở Anh Quốc ngay sau đợt bùng nổ năm 1996. Quá trình phòng dịch vẫn căng sức để phòng chống bằng được một đợt bùng lây nhiễm khác từ gia súc-sang-người bùng nổ trong tương lai, bao gồm việc hạn chế xuất nhập khẩu thịt bò cho tới việc giết hàng loạt gia súc, để duy trì số lượng gia súc bị nhiễm trong tầm kiểm soát. Nhưng trong vòng hai thập kỉ qua, việc bệnh Bò điên xuất hiện ở người vẫn cực kỳ hiếm hoi.

Tuy nhiên, khi câu chuyện trên tờ Times được đăng tải năm 2001, một mô hình khác đã chiếm ưu thế trên các tiêu đề về đợt bùng phát bệnh Bò điên - một mô hình dự báo đại dịch trên diện rộng dẫn đến hơn 136.000 số người tử vong tại Anh. Chính phủ Anh đã dựa vào mô hình này để đưa ra chính sách phản ứng, ước tính giết hơn 4 triệu con bò trong quá trình này. Mô hình đó không chỉ dừng lại ở gia súc. Trong một nghiên cứu bổ sung, họ đã xem xét khả năng gia súc bị nhiễm bệnh quy mô hàng loạt. Trong trường hợp có sự lây lan từ gia súc-sang-người, những người lập mô hình đưa ra kịch bản "trường hợp xấu nhất" là có 150.000 người chết, dẫn đến việc báo chí hoảng loạn và thổi phồng lên vào thời điểm đó.

Trong bài báo đăng trên tờ Times năm 2001, tác giả của chính dự báo đáng báo động hơn này đã phản hồi lại những dự báo về số người chết tương đối nhỏ từ nhóm LSHTM. Ông khẳng định những con số như vậy là "lạc quan một cách phi lý". Ông đã chỉ ra một loạt vấn đề với mô hình LSHTM, mô tả các giả định của nó về việc phơi nhiễm với Bệnh Bò điên trước đó là "cực kỳ ngây thơ" và cho thấy nó đã bỏ sót "việc báo cáo thiếu sót về dịch bệnh của những nông dân và bác sĩ thú y, những người đang không hiểu chuyện gì xảy ra với động vật của họ". Ông thừa nhận vào thời điểm đó rằng ông đã "kể từ đó sửa lại [dự báo 136.000 ca tử vong] giảm xuống đôi chút, song vẫn bày bỏ tin tưởng là con số này gần với số liệu thực tế.

Tác giả chính của các dự báo về tỷ lệ tử vong của bệnh Bò điên và Bệnh Cừu điên vào đầu những năm 2000 là cái tên quen thuộc trong mô hình dịch tễ học.

Đó là Neil Ferguson của đội ngũ ICL. Cũng như với khủng hoảng hiện tại, độ bất trắc quá cao đã che mờ các ứng báo dịch tễ trong quá khứ. Tính bất trắc như thế vốn là không thể tránh được, nhưng nó cũng cho ra một loạt những phương án khác để cạnh tranh với nhau. Khi chính phủ thiết kế chính sách dựa trên các ứng báo dịch tễ, việc lựa chọn mô hình nào để dùng có thể chỉ là sự khác nhau, giữa một bên là quyết sách phản ứng nhẹ nhàng, và một bên là chủ động can thiệp ở quy mô lớn, như ta thấy ở quyết định giết hàng loạt bò còn sống đối với bệnh Bò điên hay là lệnh phong tỏa ở quy mô lớn trên toàn xã hội với COVID-19.

Những lựa chọn như vậy, thường được đưa ra trong hoàn cảnh dữ liệu bị cực kì giới hạn, lại được trình bày trước công chúng như một hành động cần thiết để ngăn chặn viễn cảnh tận thế không xảy ra. Nhưng chúng ta cũng phải xem xét những tác hại vô hình có thể xảy ra khi các chính trị gia đưa ra quyết định dựa trên những kịch bản mô hình hóa không những khó xảy ra mà còn cực kì đáng báo động, vốn dễ bị các phương tiện truyền thổi phồng và bị các chính trị gia chú ý.

Khi xem xét tính thiếu chắc chắn lộ ra từ những giám sát thống kê dịch tễ hay ho, các chuyên gia y tế đưa ra, giả định nên đi theo hướng khác. Điều được đảm bảo không phải là những quyết định chính trị táo bạo đưa ra dựa trên những mô hình quan sát thiếu minh bạch với những giả thuyết không rõ ràng, mà thay vào đó phải hết sức thận trọng khi dựa vào những mô hình như vậy để xác định chính sách.

Nguồn: Phillip Magness, How Wrong Were the Models and Why?, AIER, 23/4/2020