 Sự khác nhau giữa độ chính xác (Precision) và độ nhắc lại (Recall). (Viết lại)

Predicted \Fact:           Positives  |    Negatives

Positives        ||               TP            |       FN 

-------------   ---------------------------

Negatives       ||               FP            |       TN

Độ chính xác mô tả ý nghĩa như sau: 

Giả sử ta có một quần thể cần tìm ra trong quần thể có bao nhiêu cá thể dương tính (Positives) và bao nhiêu cá thể âm tính (Negatives). 

Một phương pháp A có độ chính xác (precision) 80% có nghĩa là nếu ta thực hiện 100 mẫu kiểm định và phát hiện ra 40 mẫu có phát hiện  có dương tính trong đó, thì với độ chính xác 80%, khả năng là 40*0.8 = 32  mẫu là dương tính thật còn 8 mẫu dương tính đó khả năng là dương tính giả.

Cũng phương pháp A đó, nếu nó có độ nhắc lại (recall) là 70% có nghĩa là trong quần thể giả sử có 50 dương tính thật thì phương pháp này cho phép phân lập nhiều nhất có thể là  50*0.7 = 35 phần tử trong quần thể đó là có dương tính. Vì cách tính này dựa trên số lượng Dương tính thật của quần thể cho nên để thực hiện tính nó cần thực hiện một nhóm thử nghiệm để xác định tổng số dương tính thực trong quần thể.

Về mặt định nghĩa thì ta sẽ có công thức như sau:

Precision = TP/(TP + FP)

Recall = TP/(TP + FN)

Ta có thể thấy Độ chính xác liên quan tới số cá thể có thể phát hiện ra từ một kiểm định, trong khi độ nhắc lại phản ánh độ phân loại trong nhóm thử nghiệm. Do đó ta có thể dùng thay thế bởi hai từ thuật ngữ khác là 

Độ nhạy(Sensitivity) thay cho độ nhắc lại

Độ đặc hiệu(Specificity)  cho phép đánh gia công dụng của một phương pháp tác động lên quần thể thoongqua số lượng âm tính mà phương pháp tạo ra được.

Specificity = TN/(TN + FP)


