quinta-feira, 21 de novembro de 2013

Cuidado com a "base rate"

Novo teste para detectar a doença X.

Doença X é rara. Nesse blog, apenas a Mariazinha tem.
Numa população de 1000, apenas 1% de gente tem.
O teste tem 99% de acurácia. Se você tem a X disease, ele acusa com 99% de chance. Se você não tem, ele erra, dizendo que tem, apenas 1% das vezes.
É o teste 99% !
Maravilha.
Veja que das tais 1000 pessoas, 10 de fato têm a doença
Ok, apliquemos o teste.
O teste aplicado nessas 10 que realmente têm a doença acerta 99% das vezes, ou seja pega todos os dez doentes (incluindo a Mariazinha X).
Aplicado aos 990 cidadãos que não têm, com margem de 1% de erro, ele dá o seguinte resultado: 10 doentes (erroneamente identificados).
Então, o teste 99 acusa 20 doentes, quando só temos na verdade 10.
Mas dizer que tem 20 quanto tem 10 não parece tão acurado assim.
Por causa da base rate
Refaça o exercício com 50% das pessoas inicialmente contaminadas.

6 comentários:

  1. Hahaha, q zueira. Entendi nada. Isso è comunicação interna?

    ResponderExcluir
  2. Louco isso! O exame é 99% sensível (para detectar verdadeiro positivos) e 99% específico (para detectar verdadeiros negativos), mas 50% das pessoas diagnosticadas com a doença neste exame não têm a doença X!

    ResponderExcluir
  3. Oi Celoto, mestre dos tempos de Crusp!
    A questão bayesiana de fundo é: a prior é muito baixa, 1%, e isso precisaria ser levado em conta na hora de fazer a conta da posterior. Nesse exemplo, comum nos livros de estatística bayesiana, só estamos fazendo a conta da likelihood, sem levar em conta a prior, baixinha. Quando a prior é de 50%, o teste fica uma beleza!

    ResponderExcluir
    Respostas
    1. Oi Dudu, agora você é que é o mestre! Eu senti na prática esta questão recentemente quando minha filha estava fazendo exames de doenças bem raras. Em clínica médica eles usam o termo prevalência (prior) para calcular o VPP (valor predito positivo: proporção de pacientes com resultados verdadeiramente negativos entre os diagnosticados como negativos). http://clinicamedicarquivo.blogspot.com.br/2004/06/sensibilidade-especificidade-valores.html

      Excluir
  4. Não entendi o post. Se pelo primeiro teste descobri que 10 têm a patologia e 990 não a tem, porque diabos devo aplicar novamente o teste naqueles 990 que já descobri que não têm a doença?

    ResponderExcluir
  5. O teste é aplicado a TODOS os 1000 simultaneamente. Exante, o que se sabe é que 1% tem, essa é a base rate. Mas o teste acusa 20 contagiados, quando sabemos que, de fato, são apenas 10. Mas dos 20 que acusam "positivo", não sabemos separar os 10 realmente doentes dos 10 que o teste identifica erroneamente.

    ResponderExcluir