Ecuación #16: Teorema de Bayes

descripción de la imagen

Por Napoleón Cornejo

28 April 2018

Suponga que una enfermedad muy grave, pero muy rara, afecta el 0.1 % de la población. Y existe un examen que la puede detectar con 99 % de efectividad. Usted hace el examen y el resultado es positivo. ¿Se debe preocupar? La mayoría de personas correría a firmar su testamento y despedirse de sus seres queridos, pero lo que en realidad necesitan es un poco de perspectiva.

Piense que si el examen es 99 % efectivo, quiere decir que a 1 % de las personas las diagnostican mal. En un grupo de 1,000 personas, 1 va a tener la enfermedad (0.1 %), pero a 10 (1 %) el examen les dará un falso positivo. Así que de 11 personas diagnosticadas, solo 1 realmente van tener la enfermedad y entonces su probabilidad de padecerla es únicamente 9 % (1/11). En otras palabras, el 91 % de las personas que obtiene positivo en realidad no padecen la enfermedad. Sorprendente, pero es el resultado correcto de razonar según la ecuación de esta semana, el Teorema de Bayes:

P(H|E) = P(E|H) P(H) / P(E)

Esta trascendental ecuación es el fruto de las ideas de un presbítero inglés llamado Thomas Bayes, nacido a principios del siglo XVIII. Escribió sobre teología y matemáticas, y al final de su vida tomó especial interés en la probabilidad condicional; el estudio riguroso para descifrar cómo las causas influyen en la probabilidad de observar sus efectos y viceversa. El teorema puede resumirse así: es el grado de confianza (P) en una hipótesis (H) a medida que se acumula evidencia (E). Si la evidencia es consistente con la hipótesis, mi confianza debe aumentar. Si no, debe bajar. En el caso de la enfermedad, su probabilidad inicial es la estadística de población general. Le llamamos a esto la “probabilidad a priori”, porque es lo que sabe de antemano. Pero luego hace el examen que resulta positivo. Esto produce la “probabilidad posterior”, ya que hay ahora nueva evidencia.

Tome otro ejemplo, un punto de asalto. Como vivimos en El Salvador, usted ya tiene una noción de poder ser asaltado en cualquier esquina del país (probabilidad a priori). Pero de repente, esperando en un semáforo, ve que asaltan al conductor de enfrente. Usted, por lo tanto, ahora ya no tiene la misma confianza en pasar por esa esquina (probabilidad posterior). Su pregunta debe ser: ¿cuánto debo cambiar mi probabilidad posterior a la luz de este nuevo dato? Para eso está el Teorema de Bayes. Es solo perspectiva y grado de certeza puestos en forma de ecuación.

Thomas Bayes no le dio mucha importancia a su teorema, y de hecho ni lo publicó, sino que lo hizo un amigo suyo después de su muerte. Pero ahora es toda una doctrina en la epistemología y la filosofía de la ciencia. En la Inteligencia Artificial, que intenta simular el aprendizaje humano con computadoras, es un pilar fundamental y tiene múltiples aplicaciones. Las compañías de telefonía, por ejemplo, pueden analizar todas sus bases de datos examinando el comportamientos de sus clientes: a qué horas llama, a quién, qué productos compra, su historial de pago, ingresos, status familiar, etc. y formarse con ello probabilidades a priori de cada uno. A medida que estos comportamientos cambian, la computadora actualiza sus probabilidades posteriores, y puede predecir, usando a Bayes, no solo si su cliente va cancelar un contrato, sino también qué promociones tienen mayor probabilidad de retenerlo. Los bancos pueden hacer lo mismo con sus clientes o los burós de crédito para evaluar deudas. Amazon, Facebook y Google aplican el teorema todo el tiempo en sus algoritmos para predecir nuestro comportamiento.

Tome el caso de la delincuencia descrito anteriormente. Si la PNC aplica algoritmos especializados en sus bases de datos, podrían formar modelos bayesianos a priori sobre el crimen en puntos geográficos del país. A medida que nuevos datos se acumulan, ya sea de la misma PNC o directamente de ciudadanos, la computadora no solo podría asignar probabilidades de la ocurrencia del crimen en lugares específicos, sino que podría predecir adónde va ocurrir otro con mayor certeza o como se moverán los puntos de asalto. Podrían entonces enviar sus unidades ahí anticipadamente. Policías de EE. UU., China y otros países ya experimentan con esta metodología.

Volvamos al ejemplo inicial. Suponga que toma el examen por segunda vez y vuelve a dar positivo. ¿Cuál es ahora su probabilidad de realmente padecer la enfermedad?

(La edición impresa puede no mostrar las fórmulas adecuadamente. Para conocer la respuesta al segundo diagnóstico, visite el sitio web: http://52ecuaciones.xyz).

Ingeniero Aeroespacial salvadoreño,

radicado en Holanda

cornejo@52ecuaciones.xyz