martes, 22 de julio de 2014

¿Es mejor conducir borracho que sobrio? Probabilidad condicionada

Está claro que conducir borracho aumenta el riesgo de accidente, y en el artículo El 43% de los muertos de tráfico en 2013 dio positivo por alcohol o drogas este hecho individual se convierte en un dato estadístico.

Ahora bien, seguro que muchos han gastado la broma típica: Conducen peor los que no van borrachos porque han tenido ... ¡un 57% de los accidentes!

Lo malo es que, a veces, quién hace esa broma parece que no tiene muy claro porque es una broma y no es verdad. Tiene que ver con un concepto matemático llamado probabilidad condicionada.

La probabilidad condicionada nos adapta el concepto de probabilidad a los casos en los que no solo nos preguntan por la probabilidad de algo, sino que nos dan una información adicional que restringe el número de casos totales sobre los que se aplica esa pregunta.

La letra P representa la probabilidad de que ocurra algo (y aquí también puede representar el porcentaje de casos en los que ocurra algo)

Probabilidad de que ocurra A (sin más condiciones)     P ( A ) = N ( A ) N P(A) = {N(A)} over N
N(A) = Número de casos en los que ocurre A
N      = Número de casos totales

Probabilidad de que ocurra A si ha ocurrido B P ( A / B ) = N ( A y B ) N ( B ) P(A/B) = {N(A y B)} over {N(B)} 
N(A y B) = Número de casos en los que ocurran A y B a la vez
N(B)       = Número de casos en los que ocurre B

Por ejemplo, si tenemos un dado perfectamente equilibrado la probabilidad de sacar un "2" es 1/6, pero si nos advierten de que ya han tirado el dado y el número que ha salido es par la respuesta a la pregunta "¿probabilidad de sacar un 2?" cambia, ya no es 1/6, sino 1/3 ya que solo hay 3 números pares entre 1 y 6.

En notación matemática esto quedaría escrito de la siguiente forma:
P ( 2 ) = N ( 2 ) N = 1 6 P("2") = {N("2")} over {N} = 1 over 6

P ( 2 / PAR ) = N ( 2  PAR ) N ( PAR ) = 1 3 P(2/PAR) = {N(2 y PAR)} over {N(PAR)} = 1 over 3


Siguiendo esta lógica a continuación veremos que aunque el porcentajes de accidentes con conductores ebrios es parecido al porcentaje de accidente con conductores sobrios, como los conductores borrachos abundan menos, la probabilidad de tener un accidente estando borracho es 5 veces superior a si se está sobrio.

Nuestro objetivo es calcular la probabilidad de tener un accidente si vas borracho P(A/B) y compararlo con la probabilidad de accidente si no vas borracho P(A/No B) a partir de los datos:
  • Probabilidad  de estar borracho si has tenido un accidente
    P(Borracho/Accidente) = P(B/A) = 43% = 0,43
  • Probabilidad  de no estar borracho si has tenido un accidente
    P(No Borracho/Accidente) = P(No B/A) = 57% = 0,57 
  • Porcentaje de conductores Borrachos P(B) = 12% = 0,12
  • Extrayendo datos de Nota de prensa: Estadísticas 2013 DGT
  • N. accidentes 2013 = 928
    N. desplazamiento 2013 = 354.219.623
    P ( A ) = 928 354.219 .623 = 0,00000262 P(A) = 928 over {354.219.623} = 0,00000262  =0,00026% 
Porcentaje de accidentes con conductor borracho implicado
P ( A  y  B ) = P ( A ) · P ( B / A ) = 0,00000262 · 0,43 = 0,000001127 0,00011%

Calculamos lo mismo para el caso de que el conductor no esté borracho. Como se ve, el número es prácticamente igual al caso anterior.
P ( A  y  No  B ) = P ( A ) · P ( No  B / A ) = 0,00000262 · 0,57 = 0,000001493 0,00015% P(A y No B) = P(A)·P(No B/A) = 0,00000262·0,57 = 0,000001493 approx 0,00015%

Con la definición de probabilidad condicionada calculamos la probabilidad de tener un accidente si estás borracho
P ( A / B ) = P ( A  y  B ) P ( B ) = 0,000001127 0,12 0,0009% P(A/B) = {P(A y B)} over {P(B)} = 0,000001493 over 0,88 approx 0,00017%
P ( A / No B ) = P ( y No  B ) P ( No B ) = 0,000001493 0,88 ≈ 0,00017%

P(A/B) : P(A/No B) = 0,00090/0,00017 = 5,2 

Por cierto,  la relación entre ambas probabilidades, en realidad, no depende del porcentaje de accidentes que aparece idéntico en ambas expresiones.

P.D.: Aunque en ningún momento se haya nombrado, al calcular las probabilidades condicionadas intercambiando A por B, hemos aplicado el teorema de Bayes herramienta muy útil tanto en la caza del spam como en las técnicas de inducción estadística.

No hay comentarios:

Publicar un comentario