Tổng số lượt xem trang

Thứ Tư, 31 tháng 8, 2011

Tác giả biểu đồ Kaplan - Meier đã ra đi

Tác giả biểu đồ Kaplan - Meier đã ra đi
Nguyễn văn Tuấn
Thứ tư, 31 Tháng 8 2011
Từ nguyenvantuan.net
Những ai “quen biết” với y văn chắc chắn có lần thấy cụm từ “Kaplan Meier plot” hay “Kaplan-Meier Estimator”. Đó là tên của hai nhà thống kê học nổi tiếng: Edward Kaplan và Paul Meier. Ông Kaplan qua đời năm 2006. Vài tuần trước ông Paul Meier cũng qua đời. Báo chí đại chúng trên thế giới nhắc đến Meier như là một “cứu tinh” cho hàng triệu bệnh nhân trên thế giới qua công trình nghiên cứu của ông. Thế là hai tác giả của biểu đồ nổi tiếng trong y khoa đã ra đi, nhưng họ để lại một di sản đáng trân quí.

Đọc các tập san y khoa, chúng ta dễ gặp thấy một biểu đồ như sau:



Biểu đồ này có tên là Kaplan – Meier plot. Trục hoành là thời gian. Trục tung là xác suất sống sót (hay xác suất biến cố lâm sàng chưa xảy ra). Sau này có người để nghị trục tung lên là xác suất tử vong hay xác suất biến cố lâm sàng xảy ra. Biểu đồ đơn giản này cho phép chúng ta đánh giá hiệu quả của một thủ thuật can thiệp cho từng thời gian. Biểu đồ trên có nghĩa là những người mang gien A có xác suất sống sót cao hơn những người mang gien B: sau 3.5 khoảng 50% người mang gien A còn sống, cao gần gấp 2 lần so với người mang gien B (25%). Phân tích chuyên sâu hơn, chúng ta có thể ước tính khá chính xác xác suất sống sót cho một cá nhân. Đó chính là phương pháp mà chúng tôi phát triển mô hình tiên lượng gãy xương. Đó cũng chính là phương pháp mà các mô hình tiên lượng được ứng dụng trong bệnh viện để đánh giá nguy cơ tử vong cho bệnh nhân và dựa vào đó mà quyết định điều trị tích cực hay chờ. Phương pháp phân tích để có biểu đồ Kaplan – Meier còn được ứng dụng trong hầu hết các nghiên cứu lâm sàng xuôi thời gian (nhưng không phải ai cũng có đủ kinh nghiệm làm phân tích này!)


                                                                          Paul Meier

Paul Meier sinh ngày 24/7/1924 tại Newark (New Jersey), tốt nghiệp cử nhân toán từ trường Oberlin vào năm 1945, tiến sĩ thống kê học từ Đại học Princeton năm 1951 dưới sự hướng dẫn của John Tukey. Ông dạy ở Đại học Johns Hopkins từ năm 1952 đến 1957. Sau này ông chuyển đến Đại học Chicago và trở thành chủ nhiệm bộ môn thống kê cho đến năm 1992, và sau đó chuyển về Đại học Columbia. Ông là một nhà khoa học để lại dấu ấn có ích cho đời, với phương pháp phân tích nổi tiếng được gói gọn trong công thức Kaplan Meier Estimator trong một bài báo dài 24 trang công bố trên tập san Journal of the American Statistical Association (JASA) năm 1958 (1), mà ông là đồng tác giả với Edward Kaplan, lúc đó là nhà nghiên cứu của Đại học California.

Công thức KP bắt đầu từ năm 1952, khi ông còn giảng dạy ở Đại học Johns Hopkins. Lúc đó, Edward Kaplan đọc một bài báo của Greenwood (người nổi tiếng với công thức Greenwood trong phân tích ung thư) về thời gian bệnh nhân mắc bệnh ung thư. Kaplan liên tưởng đến cách ước tính tuổi thọ của linh kiện điện thoại chôn dưới đáy biển (mà sau này chúng ta biết đến dưới thuật ngữ survival analysis). Ông viết bài báo về cách phân tích survival và đưa bài đó cho John Tukey xem đồng thời nộp cho JASA để công bố. Tukey báo cho ông biết rằng Paul Meier cũng đang nghiên cứu về vấn đề này, và bản thảo cũng đã được nộp cho JASA. Sau này JASA đề nghị hai người (Kaplan và Meier) nên hợp tác viết chung một bài báo, thay vì đăng riêng 2 bài. Phải hơn 4 năm trao đổi và hoàn thiện, sau bài báo mới hoàn chỉnh và được JASA công bố vào năm 1958. Bài báo này khi mới công bố 3 năm đã có 1495 trích dẫn. Cho đến nay, bài báo đã được trích dẫn trên 35.000 lần, trở thành một trong những công trình có ảnh hưởng lớn nhất đến lịch sử khoa học!

Biểu đồ Kaplan-Meier (KP) cũng được phát triển từ bài báo lịch sử đó. Những ai làm nghiên cứu xuôi thời gian (prospective study) đều biết đến biểu đồ KP, vốn dùng để mô tả xác suất sống sót (hay xác suất biến cố lâm sàng) theo từng thời điểm cho một quần thể bệnh nhân. Chính cách tính này cũng được ứng dụng để tính tuổi thọ trung bình cho một dân số (life expectancy). Vấn đề chính trong những nghiên cứu xuôi thời gian là làm cách nào để ước tính xác suất một biến cố lâm sàng (như xác suất tử vong, gãy xương, ung thư, đột quị, v.v.) sau một thời gian (như 1 tháng, 1 năm, 5 năm, v.v.) khi mà không phải bệnh nhân nào cũng được theo dõi chính xác trong quãng thời gian đó. Kaplan và Meier phát triển một loạt phương trình để ước tính xác suất biến cố lâm sàng cho mỗi bệnh nhân cho bất cứ thời gian theo dõi nào. Đó là một phát triển rất quan trọng và có ý nghĩa rất thực tiễn trong nghiên cứu lâm sàng.

Paul Meier còn là người kiên trì đề xướng mô hình nghiên cứu lâm sàng đối chứng ngẫu nhiên (randomized controlled clinical trial hay RCT) trong các nghiên cứu y khoa để đánh giá hiệu quả của một thủ thuật can thiệp. Dù không phải là người đầu tiên phát kiến RCT, nhưng Paul Meier là người có công thuyết phục Cục Quản lí thực phẩm và dược phẩm (FDA) của Mĩ và đồng nghiệp y khoa ứng dụng mô hình RCT. Và, ông đã thành công. Báo New York Times trích dẫn ý kiến của Gs Richard Peto, người cho rằng có lẽ Paul Meier đã giúp y học cứu hàng triệu người qua mô hình nghiên cứu RCT.

Mô hình nghiên cứu RCT rất đơn giản, nhưng không phải ai cũng có khả năng và kinh nghiệm để thực hiện. Để đánh giá hiệu quả một thủ thuật can thiệp theo mô hình RCT, một nhóm bệnh nhân sẽ được tuyển chọn theo những tiêu chuẩn định trước; phân ra (thường là) 2 nhóm một cách ngẫu nhiên, nhóm được can thiệp và nhóm chứng; theo dõi một thời gian để quan sát một biến cố lâm sàng; và sau đó là so sánh biến cố lâm sàng giữa hai nhóm. Thời đó, vấn đề làm nhiều người trong giới y khoa khó chấp nhận là khái niệm phân nhóm ngẫu nhiên (randomization), vì ai cũng nghĩ rằng can thiệp là phải có hiệu quả và phân nhóm ngẫu nhiên là điều không cần thiết. Vả lại, y khoa khó chấp nhận trò chơi ngẫu nhiên hóa. Nhưng dần dần thì Meier cũng thuyết phục được ý tưởng RCT và như chúng ta biết đến ngày nay thì mô hình RCT đã trở thành một chuẩn vàng (gold standard) để đánh giá hiệu quả và an toàn của một thủ thuật can thiệp, kể cả dược phẩm. Ngày nay, bất cứ một can thiệp nào được FDA phê chuẩn đều phải có dữ liệu từ những nghiên cứu RCT. Không có RCT thì đừng nghĩ đến chuyện được FDA phê chuẩn!

Ngày nay, với máy tính và trình độ thống kê hiện hành, phương pháp của Meier và Kaplan có vẻ quá đơn giản. (Thật ra, lí thuyết phân tích survival thường được giảng dạy cho sinh viên năm thứ ba về thống kê học, còn sinh viên ngoài thống kê thì chỉ học ứng dụng). Nhưng 60 năm về trước, phương pháp KP là một tiến bộ đáng kể trong khoa học thống kê, và sau này ngài David Cox phát triển thành một phương pháp tham số (parametric method) mà ngày nay chúng ta biết đến như là Cox’s proportional hazards model. Tôi sẽ quay lại chủ đề survival analysis trong một dịp sau để thấy cái “đẹp” của phương pháp này trong nghiên cứu lâm sàng.

Trong thế giới thống kê học và toán học, ít nhân vật nào có ảnh hưởng lớn đến khoa học đến nổi báo Los Angeles Times, Washington Post và New York Times có bài viết khi ông qua đời như trường hợp Paul Meier. Giáo sư Meier được xem là một trong những nhà thống kê học có ảnh hưởng lớn nhất đến nghiên cứu y khoa sau thế chiến thứ II.

Chú thích:
1. Kaplan EL, Meier P. Nonparametric estimation from incomplete observations. J Amer Statist Assn 1958; 53:457-481.

Không có nhận xét nào :